刘鹏远 作品数:15 被引量:48 H指数:4 供职机构: 哈尔滨工业大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 建筑科学 语言文字 更多>>
头驱动句法分析中的直接插值平滑算法 被引量:9 2009年 在头驱动句法分析模型下,基于经典插值平滑算法,提出了以统计空间中平均事件数为基础的直接插值平滑建模原则,并应用经典的误差理论分析了该原则的合理性.基于该原则并借鉴语言模型中其他插值平滑算法对模型的零点进行假设的方法,在头驱动句法分析模型下,重新构造了4种平滑算法.实验数据显示,新平滑算法在高于经典平滑算法性能的同时,显著降低了自由参数的扰动程度,从实验的角度证明了该平滑建模原则的有效性. 刘水 李生 赵铁军 刘鹏远关键词:句法分析 基于知识自动获取的无指导译文消歧方法研究 这是个互联网的世界,使用高效的搜索引擎在互联网获取信息已经成为当代人们获取信息的最重要手段。在日益国际化的信息中,不同种语言之间的理解与处理一直存在着难以逾越的鸿沟,这就形成了人们对机器翻译、跨语言信息检索与处理的迫切需... 刘鹏远关键词:自然语言处理 译文消歧 知识自动获取 数据稀疏 基于等价伪译词模型的无指导译文消歧研究 被引量:3 2008年 该文提出了一种基于等价伪译词进行无指导译文消歧的方法。该方法利用源语言岐义词不同语义下目标语译文的单义同义词集合,定义并构造等价伪译词。利用等价伪译词从目标语语料中自动获取大量已标注语义的目标语实例。由这些实例得到的目标语语义知识,可直接形成该等价伪译词的语义分类器。利用Hownet可将含目标歧义词的英语实例映射成汉语词集合,然后利用这个语义分类器进行译文消歧。在国际标准语义评测集上进行的测试表明,该方法优于其余两种自动获取已标注语料的系统,且与Senseval-2 ELS上可比较的最好无指导系统的性能相当。 刘鹏远 赵铁军 杨沐昀 李壮关键词:词义消歧 译文消歧 目标语 利用语义相似度解决双语词汇知识获取的错误累计问题 在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义... 刘鹏远 赵铁军 李生 杨沐昀关键词:词对齐 知识获取 HOWNET 语义相似度 语义词典 双语翻译 文献传递 基于中心/修饰依存重排序模型的短语SMT 被引量:1 2012年 为了提高基于短语的机器翻译系统的重排序能力,提出了一个基于源语言端的中心-修饰依存结构的重排序模型,并将该重排序模型以软约束的方式加入到机器翻译系统中.该排序模型提出了一种在机器翻译中应用句法树资源的方法,将句法树结构,通过将句法树映射成中心-修饰词的依存关系集合.该重排序模型在基于短语系统的默认参数设置下,显著地提升了系统的翻译质量.在系统原有的词汇化的重排序模型基础上,该重排序模型在翻译模型中融入了句法信息.实验结果显示,该模型可以明显地改善机器翻译系统的局部调序. 刘水 李生 赵铁军 刘鹏远两端支承单层柱面网壳非线性稳定参数分析 稳定问题是单层网壳结构设计中的一个关键性问题.只有在结构的荷载--位移非线性全过程分析中才能准确把据单层柱面网壳的稳定承载力.因此,该文从结构的全过程分析入手,对单层柱面网壳的稳定承载力进行了深入、系统的研究.该文对八百... 刘鹏远关键词:单层柱面网壳 稳定性 屈曲 临界荷载 非线性 利用语义相似度解决双语词汇知识获取的错误累计问题 被引量:1 2006年 在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方法.实验结果表明该方法行之有效.并对HowNet以及WordNet相似度计算方法进行了基于实际应用的对比与探讨后得出:HowNet在语义区分上粒度更细因此其召回率较高,WordNet则具有更高的精确率. 刘鹏远 赵铁军 李生 杨沭昀关键词:词对齐 知识获取 HOWNET WORDNET 相似度 语义词典 基于双语词汇Web间接关联的无指导译文消歧 被引量:6 2010年 为解决困扰词义消歧及译文消歧任务中存在的数据稀疏及知识获取问题,提出一种利用双语词汇Web间接关联的完全无指导消歧方法.首先做出词汇歧义可由双语词汇的间接关联度决定的假设,为译文消歧提供了一种新的知识.在此基础上,对4种常用计算间接关联的方法进了改造并定义了双语词汇Web间接关联.随后进行基于Web的词汇消歧知识获取并设计了3种消歧决策方法.最后,在国际语义评测SemEval-2007中的Multilingual Chinese English Lexical Sample Task测试集进行了测试.该方法的Pmar值为44.4%,超过了该评测上最好的无指导系统的结果. 刘鹏远 赵铁军关键词:词义消歧 知识获取 高层主次结构体系力学性能及地震失效模式研究 主次结构体系是由提供主要承重能力及抗侧能力的主结构与仅承担自身荷载的次结构组成,并能高效协同工作的一种新型结构体系。新型主次结构中构件类别多、功能属性复杂,其力学特性、屈服失效机理及失效模式优化等方面与常规结构体系存在显... 刘鹏远关键词:高层建筑 力学性能 基于特征组合的中文语义角色标注 被引量:15 2011年 提出一种基于特征组合和支持向量机(support vector machine,简称SVM)的语义角色标注(semantic role labeling,简称SRL)方法.该方法以句法成分作为基本标注单元,首先从当前基于句法分析的语义角色标注系统中选出高效特征,构成基本特征集合.然后提出一种基于统计的特征组合方法.该方法能够根据正反例中组合特征的分布状况,以类间距离和类内距离之比作为统计量来衡量组合特征对分类所产生的效果,保留分类效果较好的组合特征.最后,在Chinese PropBank(CPB)语料上利用支持向量机进行分类实验,结果表明,引入该特征组合方法后,语义角色标注整体F值达91.81%,提高了近2%. 李世奇 赵铁军 李晗静 刘鹏远 刘水关键词:语义角色标注 自然语言处理 支持向量机