张金超
- 作品数:15 被引量:12H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 翻译方法、装置、计算机设备和存储介质
- 本发明涉及一种翻译方法、装置、计算机设备和存储介质,所述方法包括:获取目标源语句以及对所述目标源语句进行翻译得到的初始翻译语句;利用已训练的机器学习模型对所述目标源语句以及所述初始翻译语句进行编码,得到所述目标源语句对应...
- 杨郑鑫张金超孟凡东冯洋周杰
- 基于对话的内容推荐方法、装置、计算机设备及存储介质
- 本申请是关于一种基于对话的内容推荐方法、装置、计算机设备及存储介质,涉及人工智能交互技术领域。所述方法包括:获取与目标用户之间的历史对话语句;将历史对话语句,以及各个候选推荐内容输入至对话推荐模型,获得对话推荐预测结果;...
- 李泽康张金超周杰冯洋
- 文献传递
- 基于多编码器多解码器的大规模维汉神经网络机器翻译模型被引量:7
- 2018年
- 为提升维汉机器翻译模型的翻译能力,该文提出使用多编码器多解码器的结构,搭建大规模的维汉神经网络机器翻译模型。相比于单编码器单解码器的浅层的小模型,多编码器多解码器模型具有多个编码器,可以对源语言进行多层次、多视角的压缩表示;同时具有多个解码器,可以增强目标语言的生成能力。实验证明,在大规模的训练数据上,使用该方法搭建的大规模维汉神经网络机器翻译模型,译文质量可以大幅度地超过基于短语的统计机器翻译模型和基本的神经网络翻译模型。该文还针对维汉翻译源端语言和目标端语言的翻译单元粒度进行了实验,发现维吾尔语端使用字节对编码单元、汉语端使用字单元,可以消除对汉语分词器的依赖,做到和双端都使用字节对编码单元可比的效果。
- 张金超艾山.吾买尔艾山吾买尔刘群
- 关键词:神经网络
- 语料评估模型训练方法、装置、存储介质和计算机设备
- 本申请涉及一种语料评估模型训练方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取平行语料;所述平行语料包括源文本和相应的参考翻译文本;通过机器翻译模型对所述源文本进行翻译得到相应的机器翻译文本;将所述源文本和...
- 邵晨泽张金超孟凡东周杰冯洋
- 文献传递
- 模型训练方法、装置、计算机可读存储介质和计算机设备
- 本申请涉及一种模型训练方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取训练文本对;所述训练文本对包括相对应的源文本和期望文本;将所述源文本输入翻译模型,生成与所述源文本相对应的翻译文本;获取所述翻译模型的隐...
- 邵晨泽张金超孟凡东周杰冯洋
- 文献传递
- 基于机器翻译模型的翻译方法、装置、设备和存储介质
- 本申请提供了一种基于机器翻译模型的翻译方法、装置、设备和存储介质。所述方法包括:将源端句子的第i个源端词嵌入编码为中间向量;结合第i个源端词嵌入,对中间向量进行解码,得到解码后的中间向量;将解码后的中间向量与目标端句子的...
- 邵晨泽张金超孟凡东冯洋周杰
- 基于机器翻译模型的翻译方法、装置、设备和存储介质
- 本申请提供了一种基于机器翻译模型的翻译方法、装置、设备和存储介质。所述方法包括:将源端句子的第i个源端词嵌入编码为中间向量;结合第i个源端词嵌入,对中间向量进行解码,得到解码后的中间向量;将解码后的中间向量与目标端句子的...
- 邵晨泽张金超孟凡东冯洋周杰
- 文献传递
- 模型训练方法、装置、计算机可读存储介质和计算机设备
- 本申请涉及一种模型训练方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取训练文本对;所述训练文本对包括相对应的源文本和期望文本;将所述源文本输入翻译模型,生成与所述源文本相对应的翻译文本;获取所述翻译模型的隐...
- 邵晨泽张金超孟凡东周杰冯洋
- 翻译方法、机器翻译模型的训练方法、装置及存储介质
- 本申请公开了一种翻译方法、机器翻译模型的训练方法、装置及存储介质,涉及人工智能领域,该方法包括:获取标注有参考翻译结果的样本语句;将样本语句输入待训练的机器翻译模型,得到样本语句的样本翻译结果,机器翻译模型为模型参数待调...
- 邵晨泽张金超孟凡东冯洋周杰
- 一种用于盲人读取汉字的方法及系统
- 本发明提出一种用于盲人读取汉字的方法及系统,涉及自然语言处理技术领域和面向残疾人的人机交互技术领域,该方法包括获取汉语文本,对所述汉语文本进行分词操作,生成汉字串,通过发音词典、多音字字典与词频信息,参考分词得到的词性标...
- 王向东杨阳钱跃良刘宏张金超姜文斌
- 文献传递