您的位置: 专家智库 > >

天津市高等学校科技发展基金计划项目(20071303)

作品数:5 被引量:41H指数:3
相关作者:孙志伟王辉王晖昱左万利程岚岚更多>>
相关机构:天津科技大学澳大利亚卧龙岗大学吉林大学更多>>
发文基金:天津市高等学校科技发展基金计划项目吉林省科技发展计划基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 2篇聚类
  • 1篇动态模型
  • 1篇增量式
  • 1篇正则
  • 1篇正则表达式
  • 1篇神经网
  • 1篇神经网络
  • 1篇数据挖掘
  • 1篇情感分类
  • 1篇主题爬行
  • 1篇拓扑
  • 1篇网格
  • 1篇网络
  • 1篇网络拓扑
  • 1篇无向图
  • 1篇锚文本
  • 1篇聚类算法
  • 1篇观点搜索
  • 1篇WEB挖掘

机构

  • 5篇天津科技大学
  • 2篇吉林大学
  • 2篇澳大利亚卧龙...

作者

  • 3篇孙志伟
  • 2篇左万利
  • 2篇王晖昱
  • 2篇王辉
  • 1篇程岚岚
  • 1篇宁爱军
  • 1篇满春雷

传媒

  • 3篇计算机应用研...
  • 1篇计算机研究与...
  • 1篇情报杂志

年份

  • 4篇2009
  • 1篇2008
5 条 记 录,以下是 1-5
排序方式:
基于质心向量的增量式主题爬行被引量:5
2009年
研究如何在一个网页内部进行有选择的爬行.使用TFIDF-2模型以及Max,Ave,Sum三个启发式规则分别计算文档特征权重和质心特征权重,在此基础上构建与根集文档相对应的质心向量,利用它作为前端分类器指导主题爬行.使用前后端分类器分别给Frontier中的各个锚文本打分,将它们的打分求和,从中选择打分最高的链接,下载其对应的网页.实验结果表明,在质心向量的指导下,爬行程序借助于锚文本便可以准确地预测链接所指向网页的相关性;另外,双分类器框架还使得爬行策略具有增量爬行的能力.
王辉左万利王晖昱宁爱军孙志伟满春雷
关键词:主题爬行锚文本
基于正则表达式的大规模网页术语对抽取研究被引量:16
2008年
多语术语对的收集对于跨语言信息检索、机器翻译和语言学习等具有重要应用价值,但传统的手工方式或基于平行语料的术语收集方法均有各自的局限性。针对Web上存在的大规模术语网页,基于Web挖掘技术,提出了一种采用正则表达式的术语对抽取方法。首先是获取网页源文件,接着依据已定义的正则表达式从中抽取出正确的术语对,并存储到本地术语库中。实验结果表明,该方法可实现66.7%的术语网页的抽取,并且对于可抽取网页,抽取出的术语对准确率接近100%。
程岚岚
关键词:正则表达式WEB挖掘
观点挖掘综述被引量:17
2009年
互联网包含着大量的非结构化文本信息,分析这些文本信息是非常重要的。观点挖掘是当前科研人员研究的一个热点,因为需要进行自然语言处理,观点挖掘非常具有挑战性,然而它有广阔的应用前景。比如各公司总是希望能够及时获取公众或者消费者对于它们产品和服务的评价,以便进一步改进这些产品和服务。为此,对观点挖掘的各方面进行了较详细的描述。其内容主要包括评价文本的挖掘、观点搜索以及观点作弊。
王辉王晖昱左万利
关键词:情感分类观点搜索
存在物理约束下的基于密度的空间聚类算法被引量:1
2009年
在现有的基于空间约束的空间聚类算法DBCluC和DBRS+等的研究和比较基础上,提出了一种新的处理物理约束的基于密度的空间聚类算法——DBCluC+。该算法在DBCluC算法基础上,采用网络拓扑结构建模通达对象,并增加通达对象访问点的宽度属性,从而采用约束距离(constrained distance)代替简单的欧几里德距离或障碍距离(obstacle distance)作为相异度的度量标准。理论分析和实验结果表明,DBCluC+算法不仅具有密度聚类算法的优点,而且聚类结果比传统的处理通达约束的聚类算法更合理,也更加符合实际情况的需要。
孙志伟
关键词:聚类网络拓扑无向图
一种能发现自然聚类的聚类算法被引量:2
2009年
目前的聚类算法如K-means、DBSCAN等,采用全局参数而难以发现数据的自然聚类,提出一种新的分级聚类算法C luFNC,能够在数据空间中发现内部聚类特征。该算法的参数包括网格大小、噪声阈值和神经节点数量。算法首先根据参数对数据空间划分网格,接着使用高斯影响函数计算每个单元的场强,然后针对网格位置和网格的场强使用SOM进行聚类,最后使用Chameleon算法对SOM聚类得到的神经网络节点的权值进行聚类,并把聚类结果映射回原始数据空间以得到最终聚类结果。理论分析和实验结果证明,该算法能够发现数据空间内更自然的聚类,而且具有较高的执行效率。
孙志伟
关键词:数据挖掘聚类神经网络网格动态模型
共1页<1>
聚类工具0