魏玮 作品数:11 被引量:29 H指数:3 供职机构: 中国科学院自动化研究所 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 医药卫生 电子电信 更多>>
2005统计机器翻译研讨班研究报告 被引量:12 2006年 2005年7月13日至15日,中国科学院自动化研究所、计算技术研究所和厦门大学计算机系联合举办了我国首届统计机器翻译研讨班。本文主要介绍本次研讨班参加单位的测试系统和实验结果,并给出相应的分析。测试结果表明,我国的统计机器翻译研究起步虽晚,但已有快速进展,参评系统在短期内得到了较好的翻译质量,与往年参加863评测的基于规则方法的系统相比性能虽还有差距,但差距已经不大。从目前国际统计机器翻译研究的现状和发展趋势来看,随着数据资源规模的不断扩大和计算机性能的迅速提高,统计机器翻译还有很大的发展空间。在未来几年内,在基于短语的主流统计翻译方法中融入句法、语义信息,必将成为机器翻译发展的趋势。 徐波 史晓东 刘群 宗成庆 庞薇 陈振标 杨振东 魏玮 杜金华 陈毅东 刘洋 熊德意 侯宏旭 何中军关键词:人工智能 机器翻译 统计机器翻译 机器翻译评测 基于分层语块分析的统计翻译研究 被引量:8 2007年 本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识,因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的解码算法改进了线图分析的CKY算法,融入了线性的N-gram语言模型。目前,本文主要针对中文-英文的口语翻译进行了一系列实验,并以国际口语评测IWSLT(International Workshopon Spoken Language Translation)为标准,在2005年的评测测试集上,BLEU和NIST得分均比统计短语翻译系统有所提高。 魏玮 杜金华 徐波关键词:人工智能 机器翻译 条件随机场 基于分层语块分析的统计翻译研究 本文描述了一个基于分层语块分析的统计翻译模型。该模型在形式上不仅符合同步上下文无关文法,而且融合了基于条件随机场的英文语块分析知识。因此基于分层语块分析的统计翻译模型做到了将句法翻译模型和短语翻译模型有效地结合。该系统的... 魏玮 杜金华 徐波关键词:条件随机场 文献传递 一种基于状态转移的N元语言模型快速查询方法 融合基于海量语料的语言模型是提高统计机器翻译系统性能的有效手段。随着模型规模的不断增加,如何实现语言模型的快速查询成为影响系统性能的关键。本文根据N元语言模型查询具有的上下文相关特性,提出—种基于状态转移的语言模型快速查... 付晓寅 魏玮 徐波关键词:统计机器翻译 N元语言模型 快速查询 数据结构 基于混淆网络解码的机器翻译多系统融合 被引量:5 2008年 在对当前几种较流行的统计机器翻译多系统融合方法分析的基础上,提出了一种改进的多系统融合框架,该框架集成了最小贝叶斯风险解码和多特征混淆网络解码两种技术。融合过程如下:(1)从多个翻译系统输出的-best结果中,利用最小贝叶斯风险解码器选择一个风险最小的假设作为对齐参考;(2)将其余的-best假设结果与该参考对齐,从而构建混淆网络。多特征混淆网络基于对数线性模型,引入了更多有效的知识源参与最优路径选择,融合后的BLEU得分比融合前最好的单系统BLEU得分提高了2.19%。在对齐方法上,我们提出了一种改进的翻译错误率(Translation Error Rate,TER)准则——GIZA-TER准则,该准则可以对CN网络进行更有效的短语调序。实验中的显著性检验证明了本文方法的有效性。 杜金华 魏玮 徐波关键词:人工智能 机器翻译 基于多任务信息提高目标检测泛化能力的脑机接口系统 本发明属于脑‑机接口应用领域,具体涉及一种基于多任务信息提高目标检测泛化能力的脑机接口系统,旨在为了解决基于脑电的快速序列视觉呈现目标检索问题中跨用户模型泛化性能差的问题,通过多任务学习的方式提高跨用户泛化能力,多任务模... 何晖光 魏玮 邱爽 李劲鹏文献传递 基于强制对齐的层次短语模型过滤和优化 被引量:1 2013年 该文提出一种层次短语模型过滤和优化方法.该方法在采用传统方法训练得到层次短语规则的基础上,通过强制对齐同时构建源语言和目标语言的解析树,从中过滤并抽取对齐的层次短语规则,最后利用这些规则重新估计翻译模型的翻译概率.该方法不需要引入任何语言学知识,适合大规模语料训练模型.在大规模中英翻译评测任务中,采用该方法训练的模型与传统层次短语模型相比,不仅能够过滤50%左右规则,同时获得0.8~1.2BLEU值的提高. 付晓寅 魏玮 卢世祥 徐波关键词:统计机器翻译 基于单试次脑电解码的类自举法谎言预测研究 2023年 基于脑电(Electroencephalogram,EEG)的谎言检测技术依赖于对事件相关电位(Event-related potential,ERP)的有效解码,当前主要采用手工设计特征进行脑电分析.近年来,单试次脑电分类方法取得了长足进步,其中端到端的脑电分类方法能够实现对脑电的自动特征提取和分类,但在谎言检测中缺乏研究和应用,同时存在无法在测谎场景下直接应用的问题.本研究设计基于复合反应范式(Complex trial protocol,CTP)进行自我面孔信息识别任务的实验,采集了18名被试的脑电数据.研究了不同端到端的单试次ERP分类方法在谎言检测中的应用,同时针对单试次脑电解码方法无法直接实际应用的问题,提出了一种类自举算法.算法基于数据分布假设,通过对比各类刺激图像被视为探针刺激时所训练模型的性能,来推断真正的探针刺激.实验结果表明,在基于自我面孔信息的CTP的谎言预测中,所提出的类自举法性能优于传统探针预测方法,在仅使用少量脑电数据情况下,可实现准确的谎言预测. 白帅帅 陈超 魏玮 代璐瑶 刘烨 邱爽 何晖光关键词:脑电 事件相关电位 基于短语模板对齐的统计机器翻译系统 被引量:1 2006年 论文提出了一种基于短语模板时齐的机器翻译系统。系统采用基于短语模板对齐的翻译模型替代原始基于词的模型,提出了计算短语模板翻译概率的方法,改进了先前单纯基于短语的搜索算法和回溯方法。解码时引入繁衍度为0且出现频率高的词,使翻译结果更合理。论文进行了一系列实验,介绍了05年863评洲,证明本系统翻译结果的Bleu得分比原来的系统有了显著提高。 杨振东 庞薇 魏玮 杜金华 陈振标 宗成庆关键词:统计机器翻译 翻译模型 搜索算法 基于精细运动想象的脑机接口技术研究进展 被引量:2 2021年 基于运动想象的脑机接口(Motor Imagery based Brain-Computer Interface,MIBCI)对运动康复具有重大意义。然而,现有MI-BCI指令集有限,在高维精细运动控制时,运动意图与动作输出无法匹配,不利于构建反馈真实运动意图的闭环运动康复系统。近年来,精细运动想象编解码研究逐渐受到关注与重视,在范式与解码方法两方面取得了一些研究进展。范式方面,一些研究对想象单一肢体不同关节、同一关节不同自由度的动作进行了尝试;解码方法方面,传统机器学习、深度学习与基于领域自适应的迁移学习方法等被引入到了精细运动想象解码研究中。本综述讨论了基于脑电信号的精细运动想象范式与解码方法的研究进展,并展望了其未来前景,以期促进精细运动想象脑机接口技术的深入研究及未来应用。 邱爽 张裕坤 吴晨瑶 马学林 魏玮 何晖光关键词:脑机接口 脑电 范式 解码