马飞翔
- 作品数:4 被引量:10H指数:1
- 供职机构:福州大学更多>>
- 发文基金:福建省科技重大专项国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于知识图谱的文本观点检索方法被引量:9
- 2016年
- 文本观点检索旨在检索出与查询主题相关并且表达用户对主题观点的文档。由于用户查询时输入通常很短,难以准确表示查询的信息需求。知识图谱是结构化的语义知识库,通过知识图谱中的知识有助于理解用户的信息需求。因此,提出了一种基于知识图谱的文本观点检索方法。首先由知识图谱获取候选查询扩展词,并计算每个候选词扩展词分布、共现频率、邻近关系、文档集频率,然后利用4类特征通过SVM分类得到扩展词,最后利用扩展词对产生式观点检索模型进行扩展,实现对查询的观点检索。实验表明,在微博和推特两个数据集上,与基准工作对比,所提出的方法在MAP、NDCG等评价指标上均有显著的提升。
- 马飞翔廖祥文於志勇吴运兵陈国龙
- 关键词:知识图谱查询扩展
- 基于知识图谱的观点检索
- 随着互联网的飞速发展,越来越多的用户交互式媒体涌现出来,人们在这些平台上发表对事物的观点评论,对这些观点文档的研究蕴含了巨大的商业价值和学术价值。随着数据量的不断增大,观点检索也逐渐成为自然语言处理的一个研究热点,它研究...
- 马飞翔
- 关键词:知识图谱查询扩展
- 结合主动学习的多记录网页属性抽取方法被引量:1
- 2016年
- 属性抽取可分为对齐和语义标注两个过程,现有对齐方法中部分含有相同标签不同语义的属性会错分到同一个组,而且为了提高语义标注的精度,通常需要大量的人工标注训练集.为此,文中提出结合主动学习的多记录网页属性抽取方法.针对属性错分问题,引入属性的浅层语义,减少相同标签语义不一致的影响.在语义标注阶段,基于网页的文本、视觉和全局特征,采用基于主动学习的SVM分类方法获得带有语义的结构化数据.同时在主动学习的策略选择方面,通过引入样本整体信息,构建基于不确定性度量的策略,选择语义分类预测不准的样本进行标注.实验表明,在论坛、微博等多个数据集上,相比现有方法,文中方法抽取效果更好.
- 魏晶晶廖祥文陈巧灵马飞翔陈国龙
- 关键词:属性抽取语义分类
- 针对社交媒体的观点检索系统及方法
- 本发明涉及一种针对社交媒体的观点检索系统及方法。包括:一文本实体链接模块,用于将用户查询和待查询文档进行分词处理,同时链接到指定的知识图谱,充分利用知识图谱中的实体间关系,增加系统对用户查询和文档的理解程度;一查询扩展模...
- 廖祥文陈国龙马飞翔杨定达
- 文献传递