您的位置: 专家智库 > >

国家自然科学基金(61203298)

作品数:2 被引量:13H指数:2
相关作者:程学旗郭嘉丰白露曹雷孙飞更多>>
相关机构:中国科学院中国科学院大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇单词
  • 1篇分布式
  • 1篇查询
  • 1篇查询图
  • 1篇查询推荐
  • 1篇查询意图
  • 1篇长尾
  • 1篇词项

机构

  • 2篇中国科学院
  • 1篇中国科学院大...

作者

  • 2篇郭嘉丰
  • 2篇程学旗
  • 1篇徐君
  • 1篇徐君
  • 1篇兰艳艳
  • 1篇曹雷
  • 1篇孙飞
  • 1篇白露

传媒

  • 2篇计算机学报

年份

  • 1篇2019
  • 1篇2013
2 条 记 录,以下是 1-2
排序方式:
分布式单词表示综述被引量:6
2019年
单词表示作为自然语言处理的基本问题,一直广受关注.传统的独热表示丢失了单词间的语义关联,因而在实际使用中易受数据稀疏问题困扰.而分布式表示通过将单词表示为低维稠密实数向量,捕捉单词间的关联信息.该表示方式可在低维空间中高效计算单词间的语义关联,有效解决数据稀疏问题.作为神经网络模型的基本输入,单词分布式表示伴随着深度学习被广泛应用于自然语言处理领域的方方面面.从早期的隐式语义分析,到最近的神经网络模型,研究人员提出了各种各样的模型来学习单词的分布式表示.本文梳理了单词分布式表示学习的发展脉络,并从模型利用上下文入手,将这些模型统一在分布语义假设框架下,它们的区别只在于建模了单词不同的上下文.以隐式语义分析为代表的话题模型,利用文档作为上下文,建模了单词间的横向组合关系;以神经网络语言模型为代表的工作,则利用单词周围单词作为上下文,建模了单词间的纵向聚合关系.此外,本文还总结了单词分布式表示目前面临的主要挑战,包括多义词的表示、稀缺单词表示学习、细粒度语义建模、单词表示的解释性以及单词表示的评价,并介绍了最新的已有解决方案.最后,本文展望了单词表示未来的发展方向与前景。
孙飞郭嘉丰郭嘉丰兰艳艳徐君
基于查询意图的长尾查询推荐被引量:7
2013年
查询推荐是一种提升用户搜索效率的重要工具.传统的查询推荐方法关注频度较高的查询,但对于那些频度较低的长尾查询,由于其信息的稀疏性而难以产生好的推荐效果.另外,传统的方法由于没有考虑查询意图对推荐结果的影响,故对长尾查询的推荐会受到查询中噪声单词的影响.该文提出了一种新的关于词项查询图(term-query graph)概率混合模型,该模型能够准确地发掘出用户的查询意图.另外,文中还提出了一种融合查询意图的查询推荐方法,该方法可以将新查询中单词的推荐结果按查询意图自然地融合起来,从而避免了噪声单词对推荐结果的影响.实验结果表明,通过考虑查询意图,可以显著提高长尾查询推荐的相关性.
白露郭嘉丰曹雷程学旗
关键词:查询推荐查询意图
共1页<1>
聚类工具0