汤步洲
- 作品数:11 被引量:16H指数:3
- 供职机构:哈尔滨工业大学深圳研究生院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划贵州省科学技术基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 语句级中英文混合输入方法
- 语句级中英文混合输入方法,本发明涉及信息输入方法,尤其涉及一种中英文混合语句输入方法。它解决了现有的中英文混合输入方法采用手工标示输入的字母串中哪些需要转换成中文哪些是英文单词,无法保证连续的语句输入的问题。它包括下述步...
- 王晓龙刘秉权汤步洲林磊刘远超王轩陈清财
- 文献传递
- 语句级智能拼音输入技术
- 王晓龙王轩刘秉权陈清财王文敏王平林磊刘远超单丽莉孙承杰汤步洲王磊
- 在本成果出现之前,国内外汉字输入(声音输入、键盘输入及文字识别)停留在以字词为输入单位的阶段。本项目研究以短语或句子为输入单位,采用人工智能最新技术,把国际上两项语言处理技术(统计方法和规则理解方法)在一个理论体系下实现...
- 关键词:
- 关键词:中文输入
- 词汇自适应中文输入方法
- 词汇自适应中文输入方法,本发明涉及一种计算机、手机、或者掌上电子产品等的词汇自适应的中文输入方法。它降低输入法的背景噪音,减少系统开销,实现个性化输入。它用于汉字输入。它包括下述步骤:输入汉语拼音字符串;进行音节切分;根...
- 王晓龙刘秉权汤步洲单丽莉孙承杰刘铭陈清财王轩
- 语句级汉字拼音输入技术评估方法的研究被引量:5
- 2008年
- 该文介绍了语句级汉字拼音输入技术评估方法的研究意义及其重要性。从信息论角度出发,提出了基于损失函数的语句级汉字拼音输入技术的评估方法,它通过损失函数比较经语句级汉字拼音输入系统输出的句子和相应的标准句子,得到描述系统性能的定量指标。该方法对汉字拼音输入技术的音节流自动切分和音字转换两方面进行了较全面的评估。采用手工标注的1996年《人民日报》部分语料,对目前流行的汉字拼音输入技术进行了评估,实验结果表明:拼音输入技术音字转换准确率最高能达到64.3%,音节流自动切分对音字转换的准确率有大约2%的影响。评估结果对今后的拼音输入技术的评估提供了参考价值,对汉字拼音输入技术的持续发展有指导意义。
- 汤步洲王晓龙王轩张强
- 关键词:人工智能自然语言处理损失函数音字转换
- 语句级中英文混合输入方法
- 语句级中英文混合输入方法,本发明涉及信息输入方法,尤其涉及一种中英文混合语句输入方法。它解决了现有的中英文混合输入方法采用手工标示输入的字母串中哪些需要转换成中文哪些是英文单词,无法保证连续的语句输入的问题。它包括下述步...
- 王晓龙刘秉权汤步洲林磊刘远超王轩陈清财
- 基于宏特征融合的文本分类被引量:2
- 2017年
- 宏特征(即文档级特征)抽取方法是文本分类中一类典型的特征抽取方法,可以分为有监督宏特征抽取和无监督宏特征抽取。这两类宏特征抽取方法均能提高文本分类的性能。但是,同时使用两类宏特征的情况还没有被研究。该文研究了有监督宏特征和无监督宏特征融合对文本分类性能的影响。具体来讲,研究了两种有监督宏特征抽取方法,与三种无监督宏特征抽取方法,即K-means、LDA和DBN,相互融合的情况。在两个公开语料库Reuters-21578和20-Newsgroup以及一个自动构建的语料库上的对比实验表明,有监督和无监督宏特征之间的融合比单独使用有监督或者无监督宏特征的方式对文本分类更加有效。
- 王丹丹陈清财王晓龙汤步洲
- 关键词:文本分类
- 序列标注问题的监督学习方法及应用
- 随着机器学习理论的发展,机器学习方法逐渐开始处理复杂的学习任务。在监督学习方面,不再局限于解决简单的分类问题,一些复杂问题逐渐进入研究者的视线。其中,序列标注问题因普遍存在于多个研究领域而长期倍受关注。本文主要探讨解决序...
- 汤步洲
- 关键词:自然语言处理生物信息学
- 基于Android的智能中文输入法被引量:5
- 2011年
- 介绍语句级汉字拼音输入技术的基本原理,讨论在移动设备上面临的问题和解决方案,并实现基于Android操作系统的语句级汉字拼音输入法。将该输入法应用于多普达A3288手机,运行状态良好,汉字输入流畅,音字转换准确率为86.92%。随着用户对输入法和输入习惯的适应,准确率还会有一定的提高。
- 刘峰王晔晗汤步洲王晓龙王轩
- 关键词:输入法ANDROID操作系统音字转换自然语言处理
- 词汇自适应中文输入方法
- 词汇自适应中文输入方法,本发明涉及一种计算机、手机、或者掌上电子产品等的词汇自适应的中文输入方法。它降低输入法的背景噪音,减少系统开销,实现个性化输入。它用于汉字输入。它包括下述步骤:输入汉语拼音字符串;进行音节切分;根...
- 王晓龙刘秉权汤步洲单丽莉孙承杰刘铭陈清财王轩
- 文献传递
- 语句级智能汉字输入技术
- 王晓龙王轩刘秉权陈清财林磊汤步洲
- 文字输入是人与计算机交互的基础,决定了社会的信息化程度。在该项目成果出现之前,国内外汉字输入停留在以字词为输入单位的阶段,对字词的音形义进行编码输入。该项目开创性地提出语句输入的思想,考虑到汉字上下文的约束关系,以短语或...
- 关键词:
- 关键词:汉字输入语句输入