高等学校学科创新引智计划(B07042)
- 作品数:24 被引量:354H指数:10
- 相关作者:何婷婷夏立新王忠义杨宗凯宋乐更多>>
- 相关机构:华中师范大学兴义民族师范学院湖北大学更多>>
- 发文基金:高等学校学科创新引智计划国家科技支撑计划湖北省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 以关键词抽取为核心的文摘句选择策略被引量:10
- 2008年
- 针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略。通过查询扩展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词。然后通过关键词的重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的得分,最后生成文摘。该文将特征融合引入到词语层面,在DUC2005的语料中测试取得了较好的效果。
- 马亮何婷婷李芳陈劲光邵伟
- 关键词:计算机应用中文信息处理多文档文摘关键词抽取
- 网络热点事件发现系统的设计被引量:35
- 2008年
- 该文设计了一个热点事件发现系统。该系统面向互联网新闻报道流,能自动发现任意一段时间内网络上的热点事件,并给出描述事件发展过程的曲线图。针对网络新闻语料具有数据规模大和时间特征明显两个特性,系统将语料按时间(天)分组,对每天的语料采用凝聚聚类得到微类,选取某段时间内的所有微类,再做Single-pass聚类得到事件列表,利用事件热度计算公式,把候选事件按热度进行排序。采用该系统对2007年新闻语料进行实验,结果表明该系统能取得较好的效果。
- 刘星星何婷婷龚海军陈龙
- 关键词:计算机应用中文信息处理凝聚聚类
- 中文维基百科的结构化信息抽取及词语相关度计算方法被引量:24
- 2012年
- 维基百科作为一个以开放和用户协作编辑为特点的Web 2.0知识库系统,具有知识面覆盖度广,结构化程度高,信息更新速度快等优点。然而,维基百科的官方仅提供一些半结构化的数据文件,很多有用的结构化信息和数据,并不能直接地获取和利用。因此,该文首先从这些数据文件中抽取整理出多种结构化信息;然后,对维基百科中的各种信息建立了对象模型,并提供了一套开放的应用程序接口,大大降低了利用维基百科信息的难度;最后,利用维基百科中获取的信息,该文提出了一种基于链接所对应主题页面所属类别的词语语义相关度计算方法。
- 涂新辉张红春周琨峰何婷婷
- 关键词:语义相关度结构化信息
- 中文维基百科的结构化信息抽取及词语相关度计算
- 本文首先从中文维基百科官方所提供的基本数据中抽取整理出多种结构化信息;接着,对维基百科的知识组织形式进行了抽取架构,实现了一套开放的框架接口,方便了用户对这些信息的获取和使用;在此基础上,进行了词语间语义相关度计算的实验...
- 张红春何婷婷涂新辉周琨峰
- 关键词:语义相关度结构化信息
- 文献传递
- 评价主题挖掘及其倾向性识别被引量:5
- 2012年
- 主要研究如何从在线评论文本中挖掘产品的评价主题,并对其倾向性进行分析。首先采用一种启发式规则和共现概率统计相结合的方法识别文本集合中的名词性短语,再运用LDA模型挖掘潜在的评价主题。然后利用多特征融合的方法计算句子的倾向性,进而根据特征词群统计出各主题的倾向性结果。最后通过对网络汽车评论文本语料的实验证实了该方法的有效性。
- 李芳何婷婷宋乐
- 关键词:LDA
- 基于知识管理的情报研究工作变革
- 2010年
- 在分析传统情报研究工作所面临的问题的基础上,本文首先阐释了情报研究工作与知识管理的关系,进而从理念渗入、机制融入和技术嵌入三个维度,提出了知识管理导入传统情报研究工作的模式;最后以人的智慧为主导、以整合为特色、以服务创新为目标,从战略、体制和业务三大层面,构建了基于知识管理的情报研究工作体系。
- 王伟军甘春梅刘蕤
- 关键词:情报研究知识管理知识创新
- 基于语义理解的文本情感分类方法研究被引量:43
- 2010年
- 文本情感分类方法在信息过滤、信息安全、信息推荐中都有广泛的应用。提出一种基于语义理解的文本情感分类方法,在情感词识别中引入了情感义原,通过赋予概念情感语义,重新定义概念的情感相似度,得到词语情感语义值。分析语义层副词的出现规律及其对文本倾向性判定的影响,实现了基于语义理解的文本情感分类。实验表明,该方法能有效地判定文本情感倾向性。
- 闻彬何婷婷罗乐宋乐王倩
- 关键词:文本情感分类语义理解
- 基于MathML的在线公式编辑器的实现与应用被引量:8
- 2008年
- 在阐述了数学标记语言MathML和公式插件WebEQ的基础上,提出了一种基于MathML的在线公式编辑器的设计,并以文本编辑器FCKeditor为平台进行了实现,最后给出了具体应用与进一步的改进,较好地解决了上述问题。
- 郭威刘三杨宗凯孙建文刘林
- 关键词:数学标记语言
- 基于网络百科全书的中文关联语义知识获取
- 本文提出了一种用语义标签、语义指纹来表示关联语义知识的形式化方法,其中语义标签指代语义中的一个知识单元(也即概念),语义指纹是对语义标签所指代概念的描述,由语义标签的相关词语及其关联度共同组成。本文提出了一种从网络百科全...
- 杨柳何婷婷涂新辉
- 关键词:百科全书语义知识
- 文献传递
- 一种利用关键词提取的面向查询多文档文摘技术
- 针对面向查询的多文档自动文摘,本文提出了一种利用关键词提取技术的文摘句选择策略。通过计算多文档集中词语的查询相关性特征和语料相关性特征,并将词语的两个特征值进行特征融合得到每个词语的重要度,随后通过词语的重要度来给候选句...
- 马亮何婷婷陈劲光李芳邵伟
- 关键词:多文档文摘关键词提取
- 文献传递