河北省自然科学基金(2004000132)
- 作品数:4 被引量:12H指数:2
- 相关作者:董五洲安艳辉张广慧李奋华黄潇更多>>
- 相关机构:河北省教育考试院河北省信息产业厅石家庄邮电职业技术学院更多>>
- 发文基金:河北省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于改进的朴素贝叶斯文本分类研究被引量:7
- 2007年
- 文本分类(Text Categorization,TC)指的是把一个自然语言文本,根据其主题归入到预先定义好的类别中的过程。文本分类是自然语言处理的一个基础性工作,也是近年来人们研究的热点话题。针对朴素贝叶斯算法在小样本集分类效果不高的原因进行了分析,对其进行了改进和调整,提出了基于改进的朴素贝叶斯文本分类方法,试验结果表明,该方法取得了更好的效果。
- 安艳辉董五洲游自英
- 关键词:文本分类朴素贝叶斯K近邻知网中文分词
- 印刷体数学公式的识别
- 2007年
- 介绍了一个印刷体数学公式识别系统,它由公式字符识别和结构分析两部分组成。在公式字符识别中,采用了一些适用于公式字符的特殊处理方法;在结构分析中,根据数学公式的结构布局,采用了一种将“自顶向下”和“自底向上”策略相结合的数学公式结构分析方法,实现了数学公式的重用,实验表明,这种方法能取得较好的识别效果。
- 李奋华黄潇
- 关键词:字符识别自顶向下自底向上
- 基于轮廓线搜索策略的搭接英文字符切分方法被引量:1
- 2008年
- 字符切分是影响OCR系统识别的关键因素之一。对于英文搭接字符图像,笔者提出了一种基于轮廓线搜索策略的搭接英文字符切分方法。该方法结构简单,容易实现,实验结果表明该方法切分效果好。
- 安艳辉董五洲张广慧
- 关键词:OCR字符切分字符识别
- 基于识别反馈的粘连字符切分方法研究被引量:4
- 2008年
- 字符切分是影响OCR系统识别的关键因素之一。对于中英文混排粘连字符图像,笔者提出了一种基于字符类别的识别反馈的字符切分方法。该方法结构简单,容易实现,实验结果表明该方法切分效果好。
- 安艳辉董五洲
- 关键词:OCR字符切分粘连字符字符识别