您的位置: 专家智库 > >

赵鑫

作品数:7 被引量:17H指数:3
供职机构:中国人民大学信息学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划北京市自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 5篇期刊文章
  • 2篇会议论文

领域

  • 7篇自动化与计算...
  • 1篇文化科学

主题

  • 2篇社交
  • 2篇媒体
  • 2篇长尾
  • 1篇倒排索引
  • 1篇电子商务
  • 1篇信息检索
  • 1篇用户
  • 1篇用户行为
  • 1篇用户行为分析
  • 1篇游戏
  • 1篇语义
  • 1篇语义扩展
  • 1篇在线游戏
  • 1篇整数编码
  • 1篇指令级
  • 1篇指令级并行
  • 1篇商务
  • 1篇社交媒体
  • 1篇树模型
  • 1篇索引

机构

  • 4篇北京大学
  • 4篇中国人民大学
  • 1篇北京理工大学
  • 1篇淘宝(中国)...

作者

  • 7篇赵鑫
  • 4篇闫宏飞
  • 2篇文继荣
  • 1篇毛先领
  • 1篇张旭东
  • 1篇江翰

传媒

  • 3篇中文信息学报
  • 1篇计算机研究与...
  • 1篇计算机科学与...

年份

  • 1篇2018
  • 1篇2017
  • 2篇2016
  • 3篇2015
7 条 记 录,以下是 1-7
排序方式:
基于社交媒体信息的长尾商品购买行为预测
长尾商品是指单种商品销量较低,但是由于种类繁多,形成的累计销售总量较大,能够增加企业盈利空间的商品,在电子商务网站中,用户信息量较少且购买长尾商品数量较少、数据稀疏,因此对用户购买长尾商品的行为预测具有一定的挑战性。本文...
白婷杨伯华赵鑫文继荣
网络游戏案例研究:用户行为分析和流失预测被引量:2
2016年
用户流失预测在很多领域得到关注,目前主流的用户流失预测方法是使用分类法。网络游戏领域发展迅猛,但用户特征选取、特征处理和流失预测的相关研究较少。本文以一款网页网络游戏的用户记录为数据,对用户游戏行为进行分析对比,发现流失用户在游戏投入、博彩热情、玩家互动方面与正常用户存在显著差异;同时发现网络游戏数据存在样本分布不平衡、候选特征库庞大和干扰差异多等难点。在此分析基础上,本文探讨了网游用户的关键特征提取的关注方向,以及归一化和对齐化在特征处理中的关键作用。实验表明,本文提取的特征具有很好的区分度。
过岩巍吴悦昕赵鑫闫宏飞黄建兴
关键词:特征提取网络游戏
记忆神经网络研究进展浅析
机器学习(深度学习)算法拥有数据刻画、拟合、预测能力,统称为"学习能力"很多机器学习算法,缺乏良好的记忆能力。
赵鑫
基于语义查询扩展的产品评论检索被引量:1
2015年
随着电子商务的快速发展和用户在线评论数据的迅速增加,产品评论检索面临更多的挑战。一方面,产品评论从更为主观的角度为产品的特性提供描述;另一方面,产品评论的数据特性要求对传统检索方法进行相应的修正,以解决数据稀疏和词项权重单一等问题。在产品评论检索的任务下,引入词项相关度的概念,针对传统检索方法主题词项稀疏和词项权重缺少先验的问题,进行基于语义的查询扩展。同时,将词项相关度融入到一个高性能的检索框架中。一系列评测实验表明,该方法可以提高产品评论检索的准确率与质量,更好地提升评论的参考价值。
江翰赵鑫吴悦昕闫宏飞
关键词:语义扩展
基于指令级并行的倒排索引压缩算法被引量:7
2015年
文本信息数量的快速增长给传统的信息检索技术带来了新的挑战.搜索引擎通常使用倒排索引来高效地处理查询.为了减少存储开销和加快访问速度,倒排索引通常被压缩存储.因此,如何选择一个高性能的压缩算法对高效查询处理是非常有必要的.在已有倒排链压缩算法PackedBinary和PForDelta的基础上,利用CPU的超标量特性和SIMD向量指令集,将其压缩和解压缩中的关键步骤并行化,提出了2种指令级并行压缩算法SIMD-PB和SIMD-PFD.基于GOV2和ClueWeb09B两个公开数据集的实验表明,SIMD-PB和SIMD-PFD算法在压缩率不变的情况下,压缩和解压缩速度比现有的压缩算法均有非常明显的提升.其中解压缩速度比起目前最好的倒排链压缩算法,最高能提升17%.此外,实验表明算法在较长的倒排链、较大的压缩块单位上有更好的解压缩性能.
闫宏飞张旭东单栋栋毛先领赵鑫
关键词:倒排索引整数编码信息检索
在线游戏用户的流失预测:基于不平衡数据的采样方法比较和分析被引量:5
2016年
流失用户预测问题在很多领域都是研究重点。目前主流的流失用户预测方法是使用分类法,即把用户是否会流失看作一个二分类问题来处理。该文提出了一个基于二分类问题解决的在线游戏流失用户预测方法。此方法除了总结了一些对在线游戏而言比较重要的可以用于流失预测的特征之外,也考虑到流失用户相对稀少的问题,在流失用户预测问题中引入了不平衡数据分类的思想。该文主要在流失预测中结合使用了基于采样法的不平衡数据处理策略,并对现有主要的几种采样算法进行了对比实验和分析。
吴悦昕赵鑫过岩巍闫宏飞
关键词:在线游戏不平衡数据采样法
基于迭代回归树模型的跨平台长尾商品购买行为预测被引量:3
2017年
长尾商品是指单种商品销量较低,但是由于种类繁多,形成的累计销售总量较大,能够增加企业盈利空间的商品。在电子商务网站中,用户信息量较少且购买长尾商品数量较少、数据稀疏,因此对用户购买长尾商品的行为预测具有一定的挑战性。该文提出预测用户购买长尾商品的比例,研究单一用户购买长尾商品的整体偏好程度。利用社交媒体网站上海量的文本信息和丰富的用户个人信息,提取用户的个人属性、文本语义、关注关系、活跃时间等多个种类的特征;采用改进的迭代回归树模型MART(Multiple Additive Regression Tree),对用户购买长尾商品的行为进行预测分析;分别选取京东商城和新浪微博作为电子商务网站和社交媒体网站,使用真实数据构建回归预测实验,得到了一些有意义的发现。该文从社交媒体网站抽取用户特征,对于预测用户购买长尾商品的行为给出一个新颖的思路,可以更好地理解用户个性化需求,挖掘长尾市场潜在的经济价值,改进电子商务网站的服务。
白婷文继荣赵鑫赵鑫
关键词:电子商务社交媒体
共1页<1>
聚类工具0