余传明 作品数:83 被引量:750 H指数:16 供职机构: 中南财经政法大学信息与安全工程学院 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 教育部人文社会科学研究重大课题攻关项目 更多>> 相关领域: 自动化与计算机技术 文化科学 经济管理 政治法律 更多>>
基于深度强化学习的查询扩展模型研究 被引量:5 2019年 文章在传统的伪相关反馈基础上引入深度强化学习的查询扩展方法来改善信息检索中由词不匹配造成的检索效果不佳问题。选择eBay于2017年发布的用户查询与商品名称作为实验数据,利用深度学习框架抽取词的抽象特征,并把召回率作为奖励,使用强化学习方法对扩展词进行选择。当使用召回率、精度和平均精度均值三个指标对模型进行评价时,文章提出的基于深度强化学习的查询扩展方法明显优于基线方法(原始查询、基于TF-IDF的查询扩展、基于余弦相似度的查询扩展和基于深度学习的查询扩展),扩展后的查询检索效果在召回率上比原始查询高1.32%。实验结果表明基于深度强化学习的查询扩展模型能够改善词不匹配带来的问题,提高系统检索效果。 余传明 胡莎莎 叶鹏昊 安璐关键词:查询扩展 信息检索 以CMM为导向的软件过程改进探讨 该文以软件企业的过程改进为研究对象,提出了以CMM为参照,通过PSP改进软件研发人员个人软件过程,通过TSP改进小组软件过程,从而不断提高企业软件过程能力的思路.全文共分6个部分:第一部分:分析了软件产品、软件产业的特点... 余传明关键词:能力成熟度模型 软件过程改进 个人软件过程 小组软件过程 文献传递 基于深度循环神经网络的跨领域文本情感分析 被引量:22 2018年 [目的/意义]通过在标注资源丰富的源领域(Source Domain)中学习,并将目标领域(Target Domain)的文档投影到与源领域相同的特征空间(Feature Space)中去,从而解决目标领域因标注数据量较小而难以获得好的分类模型的问题。[方法/过程]选择亚马逊在书籍、DVD和音乐类目下的中文评论作为实验数据,以跨领域情感分析作为研究任务,提出一种跨领域深度循环神经网络(Cross Domain Deep Recurrent Neural Network,CD-DRNN)模型。实现不同领域环境下的知识迁移。CD-DRNN模型在跨领域环境下的平均分类准确度达到了81.70%,优于传统的栈式长短时记忆网络(Stacked Long Short Term Memory, Stacked-LSTM)模型(79.90%)、双向长短时记忆网络模型(Bidirectional Long Short Term Memory, Bi-LSTM)模型(80.50%)、卷积神经网络长短时记忆网络串联(Convolution Neural Network with Long Short Term Memory, CNN-LSTM)(74.70%)模型以及卷积神经网络长短时记忆网络并联(Merged Convolution Neural Network with Long Short Term Memory, Merged-CNN-LSTM)模型(80.90%)。[结果/结论]源领域和目标领域的知识迁移能够有效解决监督学习在小数据集上难以获得好的分类效果的问题,通过CD-DRNN模型能够从无标注数据中有效地筛选特征,从而大大降低目标领域数据标注相关的工作量。 余传明关键词:情感分析 基于生成对抗网络的跨语言文本情感分析 被引量:6 2019年 [目的/意义]将跨语言文本情感分析分为跨语言向量对齐、文档向量生成和分类器迁移三个模块,探究不同模块对跨语言文本情感分析效果的影响。[方法/过程]选择亚马逊在书籍、音乐和DVD类目下的商品评论作为实验数据,首先采用生成对抗网络对源语言和目标语言进行语义映射,然后使用平均法获取文档向量,最后通过支持向量机进行情感分类。[结果/结论]当使用F1值作为评价指标时,与基线方法相比,本文所提出的跨语言情感分析方法受领域和语言变化的影响较小,具有较强的鲁棒性,在整体上取得了较高的准确率。实验结果表明跨语言情感分析方法能够有效应对目标语言标注语料资源匮乏问题,从而改善情感分类准确率。[局限]只在三种语言上进行了跨语言情感分析实验,后续将在更多的语言情境下探究本文方法的效果。 余传明 王峰 胡莎莎 安璐关键词:神经网络模型 支持向量机 基于深度学习的词汇表示模型对比研究 被引量:7 2020年 【目的】系统揭示传统深度表示模型与最新预训练模型的原理,探究其在文本挖掘任务中的效果差异。【方法】采用对比研究法,从模型侧和实验侧分别比较传统模型与最新模型在CR、MR、MPQA、Subj、SST-2和TREC六个数据集上的效果差异。【结果】在六个任务中,XLNet模型取得了最高的平均F1值(0.9186),优于ELMo(0.8090)、BERT(0.8983)、Word2Vec(0.7692)、GloVe(0.7576)和FastText(0.7506)。【局限】由于篇幅限制,实证研究以文本挖掘中的分类任务为主,尚未比较词汇表示学习方法在机器翻译、问答等其他任务中的效果。【结论】传统深度表示学习模型与最新预训练模型在文本挖掘任务中的表现存在较大差异。 余传明 王曼怡 林虹君 朱星宇 黄婷婷 安璐关键词:知识表示 文本挖掘 一种新的信息系统——语义信息系统 被引量:2 2006年 本文提出了一种新的信息系统——语义信息系统,分析它的产生背景、定义、结构和特点,并论述了它与传统的管理信息系统、决策支持系统、竞争情报系统、专家系统的区别。 余传明关键词:信息系统 信息检索 基于深度表示学习的跨领域情感分析 目的:通过在标注资源丰富的源领域中学习,并将目标领域的文档投影到与源领域相同的特征空间中去,从而解决目标领域因数据量较小难以获得好的分类模型的问题.
方法:选择亚马逊在线购物网站在书籍、DVD和音乐类目下的中文... 余传明 冯博琳 安璐关键词:文本信息 情感分析 知识迁移 基于LDA模型的评论热点挖掘:原理与实现 被引量:21 2010年 本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。 余传明 张小青 陈雷AutoCAD在车轮设计中的应用 1994年 通过计算机绘图的实践,探索出利用AutoCAD绘制车轮图时,可以实现准确计算型钢的截面积和截面周长,计算车轮轮幅的下料直径等新的功能. 余传明关键词:AUTOCAD 车轮设计 计算机绘图 汽车 国内图书馆学情报学科研机构研究领域的可视化挖掘 被引量:3 2013年 文章采用自组织映射、多维标度和相关统计分析的方法,对2001—2011年间国内47所图书馆学情报学研究机构及其论文关键词进行可视化挖掘。结果发现,在此期间被调查的科研机构所发表的论文共涉及108个、共5类热点关键词,而这些科研机构也可按其研究领域的侧重点分为四大类,各类别的科研机构具有不同的发文特点。 安璐 余传明 杨书会 李纲关键词:图书馆学情报学 多维标度