张晨逸
- 作品数:5 被引量:168H指数:1
- 供职机构:浙江大学更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 大规模跨媒体数据分布式半监督内容识别分类方法及装置
- 本发明公开了一种大规模跨媒体数据分布式半监督内容识别分类方法及装置,其根据不同模态特征之间数据的内在联系,既利用有便签的数据又考虑无标签的数据,挖掘出其间共存的信息,通过二值化约束来加速计算,并通过多分类的回归模型,调整...
- 赵学义张晨逸张仲非
- 基于MB-LDA模型的微博主题挖掘
- 随着微博的日趋流行,Twitter等微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博本身内容的挖掘进行转变。在数据挖掘领域,尽管传统文本的主题挖掘已经得到了广泛的研究,但对于微博这种特殊的文本...
- 张晨逸孙建伶丁轶群
- 关键词:主题挖掘LDA模型社交网络
- 基于附加信息的推荐系统优化
- 近年来,推荐系统的研究变得极为火热,这主要因为,推荐系统能从大数据中提供个性化信息给用户,而这些数据往往是非常嘈杂和难以利用的。传统的方法是利用“用户-物品”的评分矩阵来进行推荐的。但在现实生活中,推荐系统往往存在着该矩...
- 张晨逸
- 关键词:推荐系统
- 文献传递
- 基于MB-LDA模型的微博主题挖掘被引量:168
- 2011年
- 随着微博的日趋流行,Twitter等微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博本身内容的挖掘进行转变.在数据挖掘领域,尽管传统文本的主题挖掘已经得到了广泛的研究,但对于微博这种特殊的文本,因其本身带有一些结构化的社会网络方面的信息,传统的文本挖掘算法不能很好地对它进行建模.提出了一个基于LDA的微博生成模型MB-LDA,综合考虑了微博的联系人关联关系和文本关联关系,来辅助进行微博的主题挖掘.采用吉布斯抽样法对模型进行推导,不仅能挖掘出微博的主题,还能挖掘出联系人关注的主题.此外,模型还能推广到许多带有社交网络性质的文本中.在真实数据集上的实验表明,MB-LDA模型能有效地对微博进行主题挖掘.
- 张晨逸孙建伶丁轶群
- 关键词:主题挖掘LDA社交网络
- 大规模跨媒体数据分布式半监督内容识别分类方法及装置
- 本发明公开了一种大规模跨媒体数据分布式半监督内容识别分类方法及装置,其根据不同模态特征之间数据的内在联系,既利用有便签的数据又考虑无标签的数据,挖掘出其间共存的信息,通过二值化约束来加速计算,并通过多分类的回归模型,调整...
- 赵学义张晨逸张仲非
- 文献传递