潘璐璐
- 作品数:2 被引量:31H指数:2
- 供职机构:四川大学计算机学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于前后文n-gram模型的古汉语句子切分被引量:26
- 2007年
- 提出了基于前后文n-gram模型的古汉语句子切分算法,该算法能够在数据稀疏的情况下,通过收集上下文信息,对切分位置进行比较准确的预测,从而较好地处理小规模训练语料的情况,降低数据稀疏对切分准确率的影响。采用《论语》对所提出的算法进行了句子切分实验,达到了81%的召回率和52%的准确率。
- 陈天莹陈蓉潘璐璐李红军于中华
- 关键词:N-GRAM模型数据稀疏
- 基于规则挖掘和Nave Bayes方法的组合型歧义字段切分被引量:5
- 2008年
- 组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Nave Bayes模型综合决策进行组合型歧义字段切分。充分的实验表明,相对于文献中的研究结果,该算法对组合型歧义字段切分的准确率提高了大约8%。
- 张严虎潘璐璐彭子平张靖波于中华
- 关键词:中文分词组合型歧义语法规则