您的位置: 专家智库 > >

国家自然科学基金(61170039)

作品数:7 被引量:48H指数:4
相关作者:郗亚辉王亮王馨王煜张玉峰更多>>
相关机构:河北大学天津大学更多>>
发文基金:国家自然科学基金河北省软科学研究计划河北省自然科学基金更多>>
相关领域:自动化与计算机技术经济管理电子电信更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 5篇自动化与计算...
  • 1篇经济管理
  • 1篇电子电信

主题

  • 1篇登录
  • 1篇新闻
  • 1篇页面
  • 1篇正误
  • 1篇数据库
  • 1篇索引
  • 1篇索引结构
  • 1篇同义
  • 1篇同义词
  • 1篇情感词典
  • 1篇情感分析
  • 1篇热点排名
  • 1篇中文
  • 1篇外键
  • 1篇网络新闻
  • 1篇未登录词
  • 1篇相似度
  • 1篇新词发现
  • 1篇聚类
  • 1篇聚类算法

机构

  • 6篇河北大学
  • 1篇天津大学

作者

  • 3篇郗亚辉
  • 2篇王亮
  • 1篇宋鑫
  • 1篇湛燕
  • 1篇袁方
  • 1篇张瑜
  • 1篇王煜
  • 1篇张玉峰
  • 1篇王馨
  • 1篇胡轶

传媒

  • 2篇中文信息学报
  • 1篇河北大学学报...
  • 1篇图书情报工作
  • 1篇情报学报
  • 1篇计算机工程与...
  • 1篇Inform...

年份

  • 2篇2016
  • 2篇2015
  • 3篇2014
7 条 记 录,以下是 1-7
排序方式:
基于Web的中文陈述句正误验证
2014年
针对Web页中存在不少不真实信息的问题,提出了一个两步的方法来鉴别一个中文陈述句是否是事实。第一步根据陈述句中的不确定单元对陈述句进行分类扩展,找到一些和待验证陈述句主题匹配的候选陈述句。第二步把候选陈述句代入现有搜索引擎,确定出最有可能的候选。这两步过程都需要从主流的搜索引擎的搜索结果中抽取各种特性。实验结果表明,准确率可以达到85%以上。经过改进,该技术可以用来评测网页的可信度。
宋鑫张瑜胡轶
关键词:陈述句正误WEB页面
产品评论特征及观点抽取研究被引量:11
2014年
随着电子商务的飞速发展,电子商务网站上各种产品的评论数量也在飞速地增长。如何从Web中大量存在的产品评论中挖掘出对消费者和生产厂商都有价值的信息,已经成为一个非常重要的研究领域。产品特征及观点的抽取是产品评论挖掘中的基本工作,其质量的好坏直接决定着后续工作的效果。双向传播算法能有效地抽取产品评论中的特征及观点,但对中文产品评论仍存在一些不足。本文对双向传播算法做了进一步的改进,提高了在中文产品评论中特征及观点抽取的准确率和召回率。首先,增加了两种产品特征和观点的间接句法依存关系模式,并引入了动词产品特征以增加召回率;其次,将产品特征和观点之间的句法依存关系模式作为HUB节点,利用HITS算法对候选产品特征和观点排序,从而提高准确率;最后,提出了模式相关性对最终抽取的产品特征进行优化,进一步提高了产品特征抽取的准确率。实验结果表明,本文的算法在不同产品评论的特征及观点抽取中都取得了较好的效果。
郗亚辉
关键词:HITS算法
Fast processing of foreign fiber images by image blocking被引量:2
2014年
In the textile industry,it is always the case that cotton products are constitutive of many types of foreign fibers which affect the overall quality of cotton products.As the foundation of the foreign fiber automated inspection,image process exerts a critical impact on the process of foreign fiber identification.This paper presents a new approach for the fast processing of foreign fiber images.This approach includes five main steps,image block,image predecision,image background extraction,image enhancement and segmentation,and image connection.At first,the captured color images were transformed into gray-scale images;followed by the inversion of gray-scale of the transformed images;then the whole image was divided into several blocks.Thereafter,the subsequent step is to judge which image block contains the target foreign fiber image through image pre-decision.Then we segment the image block via OSTU which possibly contains target images after background eradication and image strengthening.Finally,we connect those relevant segmented image blocks to get an intact and clear foreign fiber target image.The experimental result shows that this method of segmentation has the advantage of accuracy and speed over the other segmentation methods.On the other hand,this method also connects the target image that produce fractures therefore getting an intact and clear foreign fiber target image.
Yutao WuDaoliang LiZhenbo LiWenzhu Yang
关键词:COTTON
产品评论中领域情感词典的构建被引量:21
2016年
领域情感词典是情感分析最重要的基础。由于产品评论的数量巨大、领域众多,如何自动构建领域情感词典已经成为近年来的一个研究热点。该文提出了一个两阶段的领域情感词典构建算法。第一阶段,利用情感词间的点互信息和上下文约束,使用基于约束的标签传播算法构造基本情感词典;第二阶段,根据情感冲突的频率来识别领域相关情感词,并根据其上下文约束以及修饰的特征完善领域情感词典。实验结果表明,该方法在实际产品评论数据集上取得了较好的效果。
郗亚辉
关键词:情感分析
基于索引结构的关系数据库关键词检索被引量:1
2015年
检索系统构建了用于记录各数据项在数据表和字段中位置的索引结构,以及基于数据库关系图的用于描述各个数据表之间关联关系的主外键关系表,根据索引结构和主外键关系表检索出与用户输入的多个关键词相关联的记录.为了进一步提高检索效率,又构建了一个查询结果存储结构,把查询过的关键词和对应的结果存入其中.当用户输入关键词进行检索时,检索系统先去查询结果存储结构中检索,如果检索到就直接输出结果,否则再通过访问索引结构和主外键关系表构建SQL语句到原始数据库中进行检索得到结果.实验结果表明,这种基于索引结构和查询结果存储结构的检索机制具有较好的检索性能.
张玉峰袁方湛燕王亮
关键词:关系数据库关键词检索索引结构
基于新词发现的网络新闻热点排名被引量:10
2015年
[目的 /意义]随着网络新闻的广泛快速传播,通过辨析网络新词,及时掌握新闻热点关键词,对于了解新闻热点和社会舆情的预警控制具有十分重要的意义。[方法 /过程]利用改进的关联规则算法对网络新闻标题进行挖掘,相邻、有序地输出频繁字符串集合。根据互信息计算字符串的相似度,形成热点新闻的关键词集合,以实际的网络新闻为语料进行实验。[结果 /结论]实验结果表明,本文所提出的方法不仅能有效地发现词典中不存在的新词汇以及当前网络中流行的热词,而且有效地区别词汇集合中的复合式新词,继而可通过热词集合的热点度计算对网络新闻热点进行排名。
王馨王煜王亮
关键词:关联规则未登录词互信息
产品评论挖掘中特征同义词的识别被引量:4
2016年
随着电子商务的飞速发展,电子商务网站上的各种产品评论数量也在飞速增长。如何从Web中大量存在的产品评论中挖掘出对消费者和生产厂商都有价值的信息,已经成为一个非常重要的研究领域。在产品评论中,用户往往会用不同的词语描述同一产品特征。识别这些产品特征同义词才能更好地进行观点汇总。该文经过对产品评论的分析,抽取了must-link和can-not-link两类约束,并使用约束层次聚类算法识别产品特征同义词。同时,比较了几种不同产品特征相似度计算方法的结果。实验结果表明,该文的方法在实际产品评论数据集上取得了较好的效果。
郗亚辉
关键词:相似度
共1页<1>
聚类工具0