您的位置: 专家智库 > >

四川省科技厅公益性研究计划项目(2008SZ0049)

作品数:1 被引量:7H指数:1
相关作者:韩国辉琚生根梁时木李志蜀陈黎更多>>
相关机构:四川大学更多>>
发文基金:四川省科技厅公益性研究计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇支持向量
  • 1篇支持向量机
  • 1篇爬虫
  • 1篇主题爬虫
  • 1篇向量
  • 1篇向量机
  • 1篇金融
  • 1篇分类器

机构

  • 1篇四川大学

作者

  • 1篇唐小棚
  • 1篇陈黎
  • 1篇李志蜀
  • 1篇梁时木
  • 1篇琚生根
  • 1篇韩国辉

传媒

  • 1篇四川大学学报...

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
基于SVM预测的金融主题爬虫被引量:7
2010年
随着Internet上信息的爆炸,利用通用搜索引擎检索用户相关的信息变得越来越困难,而主题爬虫成为WEB上检索主题相关信息的重要工具.目前大部分基于分类器预测的主题爬虫的训练数据是不同类别网页的内容,但是在实际预测过程只能根据父网页中的一些链接信息进行预测,所以造成主题爬虫的预测的准确率较低.本文使用SVM分类器对标注了类别的URL以及上下文和锚文本进行训练,并分别使用了DF和信息增益两种不同的特征选择方法进行特征筛选,对影响分类器的各种因素进行了实验对比,并对分类器进行了在线的实验.实验证明这种方法在实际预测过程中效率很高.
陈黎李志蜀琚生根唐小棚梁时木韩国辉
关键词:主题爬虫分类器支持向量机金融
共1页<1>
聚类工具0