徐金安
- 作品数:108 被引量:158H指数:6
- 供职机构:北京交通大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国际科技合作与交流专项项目更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 融合格框架的基于语块的依存树到串日汉统计机器翻译模型被引量:1
- 2014年
- 该文提出了一种融合格框架的日汉基于语块的依存树到串统计机器翻译模型。其基本思想是从日语依存分析树获取格框架,在翻译模型的规则抽取及解码中,以日语格框架作为约束条件,指导依存树的句法结构重排,调整日语和汉语的句法结构差异,实现格框架与日汉依存树到串模型的融合。实验结果表明,该文提出的方法可有效改善日汉统计机器翻译的句法结构调序和词汇翻译,同时,还可有效提高日汉统计机器翻译的译文质量。
- 吴培昊徐金安谢军张玉洁
- 关键词:句法结构
- 中文实体关系抽取研究综述被引量:17
- 2018年
- 作为信息抽取任务中极为关键的一项子任务,实体关系抽取对于语义知识库的构建和知识图谱的发展都有着重要的意义。对于中文而言,语义关系更加复杂,实体关系抽取的作用也就愈加显著,因此,对中文实体关系抽取的研究方法进行详细考察极为必要。本文从实体关系抽取的产生和发展开始,对目前基于中文的实体关系抽取技术现状作了阐述;按照关系抽取方法对语料的依赖程度分为4类:有监督的实体关系抽取、无监督的实体关系抽取、半监督的实体关系抽取和开放域的实体关系抽取,并对这4类抽取方法进行具体的分析和比较;最后介绍深度学习在中文实体关系抽取上的应用成果和发展前景。
- 武文雅陈钰枫徐金安张玉洁
- 关键词:中文实体关系抽取
- 机器翻译方法及系统
- 本发明公开了一种机器翻译方法及系统,属于自然语言处理研究领域。所述方法包括:获取源语言测试句子;分别得到词法分析结果和句法分析结果;利用句法分析结果,抽取谓词论元结构;根据目标语言的句法特点,将谓词论元结构进行结构转换;...
- 徐金安刘江鸣吴培昊
- 文献传递
- 基于任务驱动的“自然语言处理”课程教学探究与实践
- “自然语言处理”课程是计算机科学与技术专业的专业核心课程之一。自然语言处理是人工智能领域的前沿热点研究方向,其知识内容新、更新快,因此,国内高校尚未形成统一成熟的教学大纲体系。针对“自然语言处理”课程理论性强、抽象性强、...
- 陈钰枫徐金安张玉洁
- 关键词:自然语言处理研究生教学
- 一种消减多模态偏见的鲁棒视觉问答方法被引量:1
- 2024年
- 为了增强视觉问答模型的鲁棒性,提出一种偏见消减方法,并在此基础上探究语言与视觉信息对偏见的影响。进一步地,构造两个偏见学习分支来分别捕获语言偏见以及语言和图片共同导致的偏见,利用偏见消减方法,得到鲁棒性更强的预测结果。最后,依据标准视觉问答与偏见分支之间的预测概率差异,对样本进行动态赋权,使模型针对不同偏见程度的样本动态地调节学习程度。在VQA-CP v2.0等数据集上的实验结果证明了所提方法的有效性,缓解了偏见对模型的影响。
- 张丰硕李豫李向前徐金安陈钰枫
- 面向专利文献的汉语分词技术研究被引量:16
- 2013年
- 针对专利文献专业术语多、领域广的特点,采用基于领域词典与统计相结合的方法探讨了专利文献的汉语分词问题。利用NC-value算法抽取专业术语,使用条件随机场模型(CRF)提高专业术语识别率,提高分词精度。实验结果表明,提出的方法在开放测试下分词的准确率为95.56%,召回率为96.18%,F值为95.87%,大大提高了专利文献的分词精度。
- 岳金媛徐金安张玉洁
- 关键词:汉语分词条件随机场
- 机器翻译质量评估方法、装置、设备及介质
- 本申请公开了一种机器翻译质量评估方法、装置、设备及介质,涉及机器学习网络。上述方法应用于机器翻译自动评估系统中,所述机器翻译自动评估系统运行有特征提取网络和分类预测网络,所述方法包括:获取源语句和机器译文,所述机器译文是...
- 徐金安黄辉陈钰枫刘健
- 文献传递
- 面向移动终端的统计机器翻译解码定点化方法
- 2011年
- 面向移动终端的统计机器翻译需求越来越多,但无浮点运算单元的处理器限制了翻译速度。该文提出了一种对统计机器翻译解码运算的定点化运算方法,缓解了无浮点运算单元的处理器对翻译速度的影响。基于PC和移动终端的实验表明,在保证翻译质量的情况下,利用定点处理浮点运算的解码器的运算速度较编译器模拟的浮点运算速度提高135.6%。因此,该方法可以有效地提高浮点运算能力薄弱的移动终端统计机器翻译速度。
- 李响徐金安姜文斌吕雅娟刘群
- 关键词:统计机器翻译移动终端
- 融合规则与统计的微博新词发现方法
- 结合微博新词的构词规则自由度大和极其复杂的特点,针对传统的C/NC-value方法抽取的结果新词边界的识别准确率不高,以及低频微博新词无法正确识别的问题,提出了一种融合人工启发式规则、C/NC-value改进算法和条件随...
- 周霜霜徐金安陈钰枫张玉洁
- 关键词:构词规则条件随机场模型
- 基于多任务标签一致性机制的中文命名实体识别
- 2023年
- 实体边界预测对中文命名实体识别至关重要。现有研究为改善边界识别效果而提出的多任务学习方法大多仅考虑与分词任务进行简单结合,但由于缺少包含多任务标签的训练数据,导致无法学到多个任务之间的标签一致性关系。该文提出一种新的基于多任务标签一致性机制的中文命名实体识别方法:将分词和词性信息融入命名实体识别模型,进而联合训练命名实体识别、分词、词性标注三种任务;建立基于标签一致性机制的多任务学习模式,增强边界信息学习,捕获标签一致性关系,更好地学习多任务表示。相较于基线模型,全样本实验、模拟小样本实验及真实小样本实验分别提升F_1值10.28%、11.17%和8.84%,表明了该方法的有效性。
- 吕书宁刘健徐金安陈钰枫张玉洁
- 关键词:中文命名实体识别多任务学习