吴胜远
- 作品数:7 被引量:116H指数:3
- 供职机构:山东大学计算机科学与技术学院更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 一种汉语分词方法被引量:86
- 1996年
- 本文对现有的汉语分词方法作了概述,然后,提出了一种新的汉语分词方法──单扫描分词方法,并对单扫描汉语分词方法的时间复杂度作了分析。分析表明,单扫描分词方法的时间复杂度为2.89,比现有的分词方法的时间复杂度12.32小得多。单扫描分词方法无论在理论,还是在实践上都有重大的意义。
- 吴胜远
- 关键词:信息处理汉字信息处理汉语分词
- 多级内码理论及应用效果被引量:3
- 1995年
- 该文提出关于文字信息的存储、传输和处理方面的多级内码(MMC,Multilevel Machine Code)理论,解决了汉语分词的正确性问题和分词的速度问题。
- 吴胜远
- 关键词:多级内码信息存储信息传输信息处理
- 基于多级内码的信息服务系统——谈多级内码理论在信息领域的应用
- 1999年
- 多级内码理论是一种新型的汉字处理理论,其独特的优点使其具有广阔的发展前景。录音和人工方式一直是信息台不可逾越的障碍。基于多级内码的信息服务系统,巧妙地运用了MMC理论,解决了这方面的问题,填补了国内外空白。本文介绍了多级内码的分词方法的应用,以及信息服务系统的组成和功能,说明了系统的发展前景。
- 刘功申吴胜远
- 关键词:多级内码数据库信息服务系统信息处理
- 一种文本与多媒体的检索方法
- 提出了一种全新的文本与多媒体检索方法,既可实现各种对象的混合检索,又能实现对象的分类检索;可以检索中文字、词、英文文字、音频、视频和图像等各种对象,并能检索到不同层次上的对象,如一部视频,一个剪辑,或者是一帧视频;对于文...
- 吴胜远
- 关键词:文本检索多媒体检索搜索引擎
- 文献传递
- 基于组件的多级文语浏览器的实现
- 2002年
- 介绍了多级文语浏览器的设计与实现。该软件的设计应用了基于组件的软件设计方法。该系统充分利用了多级内码的相关理论,将浏览器的汉字处理水平提高到词一级,而且实现了网页文本朗读功能,填补了国内空白。
- 王金栋吴胜远戎晓霞
- 关键词:组件多级内码网页制作汉字信息处理INTERNET
- 基于BHO和协同技术的多级文语IE的实现被引量:10
- 2004年
- 介绍了基于BHO和协同技术的多级IE的设计与实现。该软件采用基于组件的软件设计思想,利用浏览器助手对象,扩展了IE的功能,使其具有对多级内码网页的浏览能力,并添加了网页的语音浏览功能。该系统充分利用了多级内码的相关理论,将浏览器的汉字处理水平提高到词一级。
- 戎晓霞王金栋吴胜远
- 关键词:多级内码浏览器
- 并行分词方法的研究被引量:26
- 1997年
- 目前,中文分词方法都是属于串行分词方法.本文提出了一种并行分词方法,该方法是根据多级内码理论设计的,它大大提高了分词的速度.
- 吴胜远
- 关键词:多级内码中文分词方法