您的位置: 专家智库 > >

博士科研启动基金(2008A02)

作品数:3 被引量:82H指数:3
相关作者:石晶李万龙范猛更多>>
相关机构:长春工业大学吉林大学更多>>
发文基金:博士科研启动基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 3篇LDA模型
  • 2篇文本分割
  • 2篇GIBBS抽...
  • 1篇主题
  • 1篇主题分析
  • 1篇小世界
  • 1篇小世界模型
  • 1篇抽取
  • 1篇抽取方法

机构

  • 3篇长春工业大学
  • 3篇吉林大学

作者

  • 3篇李万龙
  • 3篇石晶
  • 1篇范猛

传媒

  • 1篇自动化学报
  • 1篇计算机工程
  • 1篇计算机工程与...

年份

  • 1篇2010
  • 2篇2009
3 条 记 录,以下是 1-3
排序方式:
三种主题分割方法的对比研究被引量:3
2009年
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用。基于PLSA及LDA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系,而基于小世界模型的分割则依据小世界模型的短路径、高聚集性的特点实现片段边界的识别。从模型的特点、分割策略以及实验结果等角度对基于三种模型的分割进行对比。分析表明,基于LDA模型的分割比基于PLSA模型的分割具有更大的稳定性,且分割效果更好。基于小世界模型的分割策略更适合小世界模型特性明显的文本。
石晶李万龙
关键词:文本分割LDA模型小世界模型
基于LDA模型的主题词抽取方法被引量:46
2010年
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的速度约比传统Gibbs算法高5倍,准确率和抽取效率均较高。
石晶李万龙
关键词:LDA模型GIBBS抽样
基于LDA模型的主题分析被引量:36
2009年
在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片段边界.依据词汇的香农信息提取片段主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵.实验表明,文本分析的结果明显好于其他方法,可以为下一步文本推理的工作提供有价值的预处理.
石晶范猛李万龙
关键词:主题分析LDA模型文本分割GIBBS抽样
共1页<1>
聚类工具0