您的位置: 专家智库 > >

卞小丁

作品数:3 被引量:0H指数:0
供职机构:清华大学更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文专利

领域

  • 1篇自动化与计算...

主题

  • 3篇中文
  • 3篇中文网页
  • 3篇网页
  • 3篇词串
  • 2篇中文分词
  • 2篇自动获取方法
  • 2篇新词
  • 2篇分词
  • 2篇词频
  • 1篇增量式
  • 1篇网页文本
  • 1篇文本分类
  • 1篇文本分类方法
  • 1篇聚类
  • 1篇类方

机构

  • 3篇清华大学

作者

  • 3篇卞小丁
  • 3篇袁睿翕
  • 3篇孙立远

年份

  • 1篇2011
  • 2篇2010
3 条 记 录,以下是 1-3
排序方式:
一种基于流聚类的中文网页文本分类方法
本发明涉及一种基于流聚类的中文网页文本分类方法,属于互联网数据挖掘技术领域,该方法包括:实时采集网页;去除未处理过的该网页的格式中的标签,解析出网页中各文本的特征信息;将文本内容分割、做ngram分词,形成多个词串;计算...
卞小丁袁睿翕孙立远
文献传递
一种中文网页新词自动获取方法
本发明涉及中文网页新词自动获取的方法,属于互联网数据挖掘技术领域;该方法包括:从Internet采集不同类型的网页,解析出含有时间信息的网页正文文本,并进行预处理,对得到句子片段进行n-gram分词产生词串并统计词频,连...
孙立远袁睿翕卞小丁
文献传递
一种中文网页新词自动获取方法
本发明涉及中文网页新词自动获取的方法,属于互联网数据挖掘技术领域;该方法包括:从Internet采集不同类型的网页,解析出含有时间信息的网页正文文本,并进行预处理,对得到句子片段进行n-gram分词产生词串并统计词频,连...
孙立远袁睿翕卞小丁
共1页<1>
聚类工具0