2025年2月2日
星期日
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
马希荣
作品数:
1
被引量:5
H指数:1
供职机构:
中国科学院计算技术研究所
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
刘群
中国科学院计算技术研究所
林政
中国科学院计算技术研究所
吕雅娟
中国科学院计算技术研究所
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
对齐
1篇
语料
1篇
语料库
1篇
统计机器
1篇
统计机器翻译
1篇
平行语料
1篇
平行语料库
1篇
句子对齐
1篇
机器翻译
1篇
翻译
1篇
WEB
1篇
WEB挖掘
机构
1篇
中国科学院
作者
1篇
吕雅娟
1篇
林政
1篇
刘群
1篇
马希荣
传媒
1篇
中文信息学报
年份
1篇
2010
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
Web平行语料挖掘及其在机器翻译中的应用
被引量:5
2010年
双语平行语料库在自然语言处理领域有很多重要应用,但是大规模双语平行语料库的自动获取并不容易。该文提出了一种有效的从Web上获取高质量双语平行语料库的方案,研究了候选双语混合网页获取和平行句对抽取等关键技术。运用该文方法共获取了258万双语平行句对,平均正确率为93.75%,其中前150万句对的平均正确率达到96%。该文还提出句对质量排序和领域信息检索两种方法将Web数据应用于统计机器翻译的模型训练,在IWSLT评测数据上BLEU值可以提高2到5个百分点。
林政
吕雅娟
刘群
马希荣
关键词:
WEB挖掘
平行语料库
句子对齐
统计机器翻译
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张