您的位置: 专家智库 > >

国家高技术研究发展计划(2010AA012500)

作品数:8 被引量:92H指数:5
相关作者:程学旗郭嘉丰余智华张瑾刘春阳更多>>
相关机构:中国科学院中国科学院研究生院国家互联网应急中心更多>>
发文基金:国家高技术研究发展计划国家自然科学基金北京市科技计划项目更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 7篇自动化与计算...
  • 1篇电子电信

主题

  • 1篇信息表
  • 1篇信息表达
  • 1篇信息检索
  • 1篇信息挖掘
  • 1篇有监督学习
  • 1篇舆情
  • 1篇数据采集
  • 1篇数据挖掘
  • 1篇企业服务总线
  • 1篇情感
  • 1篇情感分类
  • 1篇总线
  • 1篇网络
  • 1篇网络信息
  • 1篇网络舆情
  • 1篇消息处理
  • 1篇码字
  • 1篇蒙特卡罗
  • 1篇蒙特卡罗仿真
  • 1篇格模型

机构

  • 7篇中国科学院
  • 3篇中国科学院研...
  • 1篇北京邮电大学
  • 1篇江西财经大学
  • 1篇国家互联网应...
  • 1篇中国科学院大...
  • 1篇英特尔(中国...

作者

  • 4篇程学旗
  • 3篇郭嘉丰
  • 2篇余智华
  • 2篇张瑾
  • 1篇陈皓
  • 1篇谭松波
  • 1篇戴媛
  • 1篇刘悦
  • 1篇唐皓
  • 1篇戴利云
  • 1篇郭岩
  • 1篇杜攀
  • 1篇林政
  • 1篇虎嵩林
  • 1篇杨鸿文
  • 1篇靳小龙
  • 1篇张凯
  • 1篇梁英
  • 1篇房伟伟
  • 1篇李静远

传媒

  • 2篇中文信息学报
  • 1篇计算机集成制...
  • 1篇计算机研究与...
  • 1篇模式识别与人...
  • 1篇计算机学报
  • 1篇北京邮电大学...
  • 1篇山东大学学报...

年份

  • 3篇2012
  • 5篇2011
8 条 记 录,以下是 1-8
排序方式:
企业集成模式组合建模方法被引量:3
2011年
针对先进制造领域中业务系统集成和服务快速封装问题,提出了一种企业集成模式的组合建模方法。定义企业集成模式单元以描述企业集成模式,支持业务系统功能的调用和模式化的消息处理;采用企业集成模式组合方法实现业务系统间的消息路由功能;使用Petri网描述模式组合,并给出组合的正确性验证算法;实现了企业集成模式建模工具MixEIP,支持以配置的方式构建企业集成模式组合。实验结果表明,该方法不仅提高了集成系统的建模效率,还具有较快的消息处理速度。
陈皓梁英唐皓虎嵩林
关键词:消息处理企业服务总线
面向分面导航的层次概念格模型及挖掘算法被引量:9
2011年
分面导航利用动态多维分类目录组织查询结果,从而有效减轻数据库资源定位过程中的信息过载.现有的分面导航限制用户每次增删一个查询关键字,无法满足对具有丰富语义的导航操作的需求.另一方面,高效的动态目录生成算法的缺乏阻碍了分面导航在大规模数据中的应用.该文提出了层次概念格,对分面导航中不同浏览状态之间的关系进行建模.基于该层次概念格模型,该文设计了若干新的导航操作以支持用户在不同浏览状态之间更灵活地跳转,从而更有效地进行知识发现.为获取该层次概念格以支持导航的灵活性和实时性,该文提出了层次概念格的高效挖掘和索引算法L-Miner.L-Miner以深度优先方式挖掘所有节点,每得到一个新节点,就更新已挖掘节点之间的边.通过对底层格节点的倒排索引,L-Minder可以高效地进行边更新.实验结果表明:L-Miner的速度远快于现有算法,而其构建的索引结构的存储代价更低.
何超程学旗郭嘉丰
关键词:概念格数据挖掘
基于情感关键句抽取的情感分类研究被引量:27
2012年
情感分析需要解决的一个重要问题是判断一篇文档的极性是正面的还是负面的.情感分类的正确率很难达到普通文本分类的水平,因为情感分类更难更复杂.在判断文档的情感极性时,不同的句子具有不同的情感贡献度,所以,对整篇文档的关键句和细节句进行区分将有助于提高情感分类的性能.关键句通常简短且具有判别性,而细节描述句通常复杂多样且容易引入歧义.在关键句抽取算法中,考虑3类属性:情感属性、位置属性和关键词属性.为了更好地利用关键句和细节句之间的差异性和互补性,将抽取的关键句分别用于有监督的和半监督的情感分类.在有监督情感分类中,采用的是分类器融合的方法;在半监督情感分类中,采用的是Co-training算法.在8个领域上进行实验,结果表明所提方法性能明显优于Baseline,从而证明情感关键句抽取算法是有效的.
林政谭松波程学旗
关键词:情感分类关键句分类器融合有监督学习半监督学习
网络舆情信息源影响力的评估研究被引量:29
2011年
文章通过对网络舆情、信息源、影响力等概念的深入研究,构建网络舆情信息源影响力评估体系。评估方法试图从根本上抓住网络舆情信息源影响力的本质特点:除了考虑信息源的表现力,还考虑网民对影响力的反馈,以及信息源转载信息这一行为中隐含的对同行信息源影响力的反馈。在量化影响力时,文章借鉴网络链接分析算法PageRank,提出算法SrcRank对信息源重要度进行排名。实例分析结果表明,评估方法能够客观而合理地评价网络舆情信息源的影响力。
郭岩刘春阳余智华张瑾戴媛
关键词:网络舆情PAGERANK
基于热传导模型的更新摘要算法被引量:1
2012年
更新摘要除了要解决传统的面向话题的多文档摘要的两个要求——话题相关性和信息多样性,还要求应对用户对信息新颖性的需求.文中为更新摘要提出一种基于热传导模型的抽取式摘要算法——HeatSum.该方法能够自然利用句子与话题,新句子和旧句子,以及已选句子和待选句子之间的关系,并且为更新摘要找出话题相关、信息多样且内容新颖的句子.实验结果表明,HeatSum与参加TAC09评测的表现最好的抽取式方法性能相当,且更优于其它基准方法.
杜攀郭嘉丰张瑾程学旗张旭
网络信息的检索与挖掘回顾被引量:18
2011年
随着互联网的蓬勃发展,海量的网络信息成为了迄今为止最大规模的数据资源。如何利用海量网络信息,为人们提供智能应用,更好的解决人们的信息需求,成为了互联网领域的挑战性问题,也催生了对海量网络信息检索与挖掘的广泛研究。该文从信息表达、信息检索与信息挖掘三个方向入手,结合近年来对网络信息相关领域的研究与实践,对网络信息检索与挖掘的发展变化历程、目前存在的问题以及未来的发展趋势进行总结和分析。
程学旗郭嘉丰靳小龙
关键词:信息表达信息检索信息挖掘
Twitter数据采集方案研究被引量:5
2012年
为了能够实时、高效地获取Twitter数据,在分析了传统采集方法的缺陷后,提出了基于Twitter List API和Lookup API的用户数据采集方案。该方案通过对用户进行分类,进而精确控制API的调用频率。经在超过26万Twitter用户和600万条消息的一系列实验证明,通过两套方案的结合可以实现Twitter用户数据高效实时的获取。
房伟伟李静远刘悦余智华曹鹏张凯
关键词:TWITTERLISTAPILOOKUPAPI数据采集
基于判决域半径的码字错误率估计
2011年
针对目前典型通信中对错误概率的估计主要是依靠蒙特卡罗仿真的局限性,给出一种利用判决域的半径来估计错误率的方法,将伯努利实验样本用判决域半径样本替换.由于半径样本所含的信息量更加丰富,可以减少所需的样本数.同时,由于判决域的几何结构基本上与信噪比(SNR)无关,所以估计错误率时不必随SNR重新测量半径,基于同一组半径样本即可估计出任意SNR下的错误率.
戴利云杨鸿文陈晓刚
关键词:蒙特卡罗仿真
共1页<1>
聚类工具0