您的位置: 专家智库 > >

李洪政

作品数:8 被引量:15H指数:2
供职机构:北京师范大学中文信息处理研究所更多>>
发文基金:国家高技术研究发展计划中央高校基本科研业务费专项资金中国博士后科学基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 7篇期刊文章
  • 1篇会议论文

领域

  • 5篇自动化与计算...
  • 3篇语言文字

主题

  • 5篇汉语
  • 3篇动词
  • 3篇介词
  • 3篇机器翻译
  • 3篇翻译
  • 2篇短语
  • 2篇语言
  • 2篇语言学
  • 2篇语言学特征
  • 2篇向量
  • 2篇介词短语
  • 2篇汉语动词
  • 1篇随机场
  • 1篇条件随机场
  • 1篇资源库
  • 1篇资源库建设
  • 1篇自动识别
  • 1篇结构识别
  • 1篇兼类词
  • 1篇汉英机器翻译

机构

  • 8篇北京师范大学
  • 2篇鲁东大学
  • 2篇香港理工大学
  • 1篇中国专利信息...
  • 1篇中科鼎富(北...
  • 1篇北京奇虎科技...

作者

  • 8篇李洪政
  • 4篇晋耀红
  • 3篇朱筠
  • 2篇刘洪超
  • 1篇侯仁魁
  • 1篇胡韧奋
  • 1篇黄居仁

传媒

  • 2篇中文信息学报
  • 2篇现代语文(下...
  • 1篇计算机工程与...
  • 1篇曲靖师范学院...
  • 1篇情报工程

年份

  • 1篇2018
  • 3篇2017
  • 1篇2016
  • 2篇2015
  • 1篇2013
8 条 记 录,以下是 1-8
排序方式:
基于条件随机场方法的汉语专利文本介词短语识别被引量:1
2015年
介词短语作为一种重要的短语类型在汉语中分布广泛,正确自动识别介词短语在自然语言处理的应用领域具有重要意义和积极影响。本文尝试利用目前比较流行的条件随机场模型,主要面向汉语专利文本,对其中的介词短语进行识别研究。首先在分词和词性标注的基础上对语料进行序列特征标注,然后利用条件随机场工具包训练了识别介词短语的模型,最后设计相关实验来验证方法的效果,实验准确率达到90%以上。
李洪政晋耀红
关键词:介词短语条件随机场
汉语介词短语自动识别研究综述被引量:1
2017年
作为一种重要的短语类型,介词短语在汉语中分布广泛,正确识别汉语介词短语对自然语言处理领域的很多任务和应用都有重要的作用和意义。该文对近些年与识别汉语介词短语有关的研究做了梳理,从研究对象、实验评价标准和具体研究方法等几个方面比较详细地介绍了相关工作,最后归纳了汉语介词短语识别研究中表现出来的一些特点,并对未来研究的发展提出了几点建议。
李洪政晋耀红
关键词:介词短语
基于语言学特征向量和词嵌入向量的汉语动词事件类型预测
本文主要介绍汉语动词事件类型的预测.事件类型是根据内部时间结构对汉语动词进行的重要分类,包括状态、活动、变化(完结和达成).对汉语动词事件类型进行预测从理论上能够对以往语言学研究提出的特征进行验证,从应用上可以服务于机器...
刘洪超黄居仁侯仁魁李洪政
关键词:汉语动词语言学特征
面向专利领域的汉英机器翻译融合系统被引量:7
2017年
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。
李洪政赵凯胡韧奋蒋宏飞朱筠晋耀红
关键词:机器翻译
基于语言学特征向量和词嵌入向量的汉语动词事件类型预测被引量:2
2018年
该文主要介绍汉语动词事件类型的预测。事件类型是根据内部时间结构对汉语动词进行的重要分类,包括状态、活动、变化(完结和达成)。对汉语动词事件类型进行预测从理论上能够对以往语言学研究提出的特征进行验证,从应用上可以服务于机器翻译等任务。该文基于两种方式构建词向量进行汉语动词事件类型的预测,一种是根据语言学特征有监督地构建词向量,另一种是利用word2vec无监督地构建词嵌入向量。通过多元逻辑回归、支持向量机和人工神经网络分类器对汉语动词事件类型进行预测,最终实现了73.6%的总体准确率。
刘洪超黄居仁侯仁魁侯仁魁
关键词:汉语动词语言学特征
汉英专利机器翻译中动-介兼类词自动识别被引量:1
2015年
兼类词在汉语专利语料中分布普遍。面向汉英专利机器翻译提出了一种基于规则的动-介兼类词识别方法。根据边界感知原则和兼类词的句法语义属性以及周围的语境信息,设计了一系列兼类排歧规则,同时分别提出了兼类词识别为动词或介词的策略,并以形式化的规则加以描述。相关实验测试表明提出的方法可以有效地识别动-介兼类词语,对改善翻译系统的翻译结果也有帮助。
李洪政朱筠晋耀红
关键词:动词介词兼类词机器翻译
国内汉语方言资源库建设现状研究——以三个资源库为例被引量:3
2016年
近年来国内汉语方言资源建设取得了较快发展,出现了很多形式的方言数据库和资源库。针对国内已知的方言资源库,尝试从多个角度进行了调研分析,对目前国内方言资源的建设有了一个初步了解和认识,总结了方言资源建设的若干特点,同时也指出了一些存在的问题与不足,并就方言资源的未来发展趋势提出了一些建议和意见。
李洪政
关键词:汉语方言资源库方言文化方言保护
面向汉英专利机器翻译的“V_1+V_2”结构识别方法研究
2013年
两个动词经常连续出现在一个句子中是汉语专利文本的重要特点之一,如何在几个动词中正确识别出核心谓语动词是汉英专利机器翻译面临的一个关键问题。基于"概念层次网络理论"(HNC),本文首先分析了几种常见的"V1+V2"结构,并提出了识别各种"V1+V2"结构以及核心动词的处理策略。系统会根据匹配的规则分析不同动词之间的关系,赋予每个动词不同的权重并打上相应标记,然后根据标记判断核心动词与其他动词的关系。将识别方法应用到专利机器翻译系统后进行的实验结果表明,处理方法可以较准确地识别出复杂句子中的谓语和"V1+V2"结构,这对于有效改善翻译的效果,促进机器翻译及自然语言处理的发展都有积极的影响。
李洪政朱筠晋耀红
关键词:机器翻译
共1页<1>
聚类工具0