您的位置: 专家智库 > >

国家自然科学基金(60903107)

作品数:5 被引量:46H指数:3
相关作者:马少平刘奕群张敏茹立云许丹青更多>>
相关机构:清华大学更多>>
发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 1篇会议论文

领域

  • 6篇自动化与计算...

主题

  • 2篇用户
  • 1篇信息扩散
  • 1篇用户行为
  • 1篇在线社会网络
  • 1篇日志
  • 1篇日志分析
  • 1篇社会
  • 1篇社会网
  • 1篇社会网络
  • 1篇社会影响力
  • 1篇输入法
  • 1篇权威性
  • 1篇中文
  • 1篇中文输入
  • 1篇中文输入法
  • 1篇中心性
  • 1篇浏览
  • 1篇网络
  • 1篇网页
  • 1篇网页关键词

机构

  • 5篇清华大学
  • 1篇清华信息科学...

作者

  • 5篇刘奕群
  • 5篇马少平
  • 4篇张敏
  • 2篇许丹青
  • 2篇茹立云
  • 1篇陈飞
  • 1篇岑荣伟
  • 1篇杨磊
  • 1篇闫兴龙
  • 1篇孔维泽

传媒

  • 3篇中文信息学报
  • 1篇山东大学学报...
  • 1篇智能系统学报

年份

  • 1篇2016
  • 1篇2012
  • 3篇2011
  • 1篇2010
5 条 记 录,以下是 1-6
排序方式:
基于日志分析的中文输入法用户行为研究被引量:1
2011年
与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点。在中文输入法技术的研究中,用户的行为特点对输入法软件的词库建立、算法设计、交互方式设计与性能评价等多方面都有着至关重要的作用,但由于数据获取与分析的困难,这方面的相关研究尚不多见。该文利用某中文输入法在用户许可下收集的超过4.1亿条用户输入行为记录,进行了中文输入法用户行为的分析研究,针对不同类别应用程序的输入词频差异,不同用户在同类应用程序中的不同候选词条的选择等行为特点进行了挖掘分析,研究结果会对深入了解中文输入法用户行为,进而改进输入法软件性能具有一定的指导意义。
许丹青刘奕群岑荣伟马少平茹立云杨磊
关键词:中文输入法用户行为日志分析
面向浏览推荐的网页关键词提取被引量:4
2012年
在网页浏览推荐任务中,如何利用网页内容选取合适的推荐关键词是具有挑战性的研究热点.为了实现有效的关键词推荐方法,利用大规模的真实网络用户浏览行为数据,以及相关提取算法和新词发现算法实现并比较了基于领域关键词提取技术和基于查询词候选集合的关键词推荐方法.实验结果证明,2种方法都能够有效地表征用户信息需求,而第1种推荐方法的准确率更高,具有更好的推荐性能.
闫兴龙刘奕群马少平张敏茹立云
关键词:关键词提取网页关键词
基于在线社会网络的用户影响力研究被引量:3
2016年
对大规模的在线社会网络图结构进行了较为系统的分析,结果表明社会网络的入度、出度、发文数等基本符合幂律分布。社会网络的小世界属性也使得强连通关系呈现"纺锤体"形状。该文从用户的阅读概率角度引入用户的发文行为、浏览行为与标签社区小世界属性等对用户的社会影响力模型进行建模。实验结果显示PTIM模型融合了发文行为与小世界属性等特性,在最具影响力用户节点、用户粉丝数、认证用户数与人工标注的相对用户影响力大小等指标上均表现出稳定的性能。
许丹青刘奕群张敏马少平
关键词:社会影响力信息扩散社会网络
基于HITS算法的查询结果多样化方法被引量:3
2011年
现有的查询结果多样化研究很难准确得到用户多样性需求并提供与用户查询各个方面需求相关的文档。针对这个问题,本文基于HITS算法的网页间链接分析特性,根据网页链接图直接计算查询结果列表中的文档可能满足用户多样性需求的程度,并将其应用到结果列表的重排序中以实现搜索结果多样性。在TREC大规模数据集合上的实验结果表明了该方法的有效性。
陈飞张敏刘奕群马少平
关键词:HITSPAGERANK权威性中心性
问答社区中回答质量的评价方法研究被引量:35
2011年
问答社区已经成为网络信息获取的一种重要渠道,但其信息质量差异较大。该文研究了问答社区中回答质量的评价方法。具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据。针对百度知道的特点,文本提出的基于时序的特征、基于问题粒度的特征和基于百度知道社区用户的特征,从更多的角度对回答质量进行评价。利用分类学习的框架,该文综合了新设计的三方面特征和经典的文本特征、链接特征,对高质量和非高质量的回答进行分类。基于大规模问答语料的实验表明,在文本特征与链接特征的基础上,基于时序与基于问题粒度的特征能够有效地提高回答质量的评估效果。另外也发现,根据该文的回答质量评价框架做出的质量评分能够有效地预测最佳答案。
孔维泽刘奕群张敏马少平
问答社区中回答质量的评价方法研究
问答社区已经成为网络信息获取的一种重要渠道,但其中信息质量分布差异较大。本文研究了问答社区中回答质量的评价方法。具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据。针对百度知道的特点,文本提出的基于时序的特征...
孔维泽刘奕群张敏马少平
文献传递
共1页<1>
聚类工具0