您的位置: 专家智库 > >

国家自然科学基金(79990584)

作品数:8 被引量:193H指数:5
相关作者:陆玉昌孙建涛田凤占王大亮夏克俭更多>>
相关机构:清华大学北京联合大学烟台职业学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 8篇自动化与计算...

主题

  • 3篇文本挖掘
  • 2篇网络
  • 2篇贝叶斯
  • 2篇贝叶斯网
  • 2篇贝叶斯网络
  • 1篇多项式
  • 1篇多项式拟合
  • 1篇心病
  • 1篇信息处理
  • 1篇信息熵
  • 1篇语义
  • 1篇语义场
  • 1篇数据库
  • 1篇数据挖掘
  • 1篇评估函数
  • 1篇朴素贝叶斯
  • 1篇权值
  • 1篇中医
  • 1篇中医临床
  • 1篇中医诊疗

机构

  • 7篇清华大学
  • 1篇北京联合大学
  • 1篇哈尔滨商业大...
  • 1篇烟台职业学院

作者

  • 7篇陆玉昌
  • 3篇孙建涛
  • 2篇夏克俭
  • 2篇王大亮
  • 2篇田凤占
  • 1篇石纯一
  • 1篇张宏伟
  • 1篇王泉德
  • 1篇孙亚男
  • 1篇鲁明羽
  • 1篇宁士勇
  • 1篇唐焕玲
  • 1篇薛为民

传媒

  • 2篇计算机研究与...
  • 2篇清华大学学报...
  • 1篇计算机应用研...
  • 1篇计算机工程与...
  • 1篇北京联合大学...
  • 1篇Journa...

年份

  • 2篇2006
  • 3篇2005
  • 2篇2004
  • 1篇2003
8 条 记 录,以下是 1-8
排序方式:
Parallel Expectation-Maximization Algorithm for Large Databases
2006年
A new parallel expectation-maximization (EM) algorithm is proposed for large databases. The purpose of the algorithm is to accelerate the operation of the EM algorithm. As a well-known algorithm for estimation in generic statistical problems, the EM algorithm has been widely used in many domains. But it often requires significant computational resources. So it is needed to develop more elaborate methods to adapt the databases to a large number of records or large dimensionality. The parallel EM algorithm is based on partial E-steps which has the standard convergence guarantee of EM. The algorithm utilizes fully the advantage of parallel computation. It was confirmed that the algorithm obtains about 2.6 speedups in contrast with the standard EM algorithm through its application to large databases. The running time will decrease near linearly when the number of processors increasing.
黄浩宋瀚涛陆玉昌
关键词:数据库EM算法
一种面向自动文本摘要特征评价的新方法被引量:1
2004年
自动文本的特征评价方法的研究一直未受到研究者们的重视。以往只是简单地将面向文本集的TF.IDF特征评价方法应用于针对单文本的自动文摘领域,该方法无法排除低频词噪音的影响,特征评价存在明显误差,致使不能准确计算文本特征。文章引入信息熵,提出了针对单文本的特征评价方法TF.IDF.H。实验表明,新的特征评价方法能够准确获得文章主题特征,更好地改善文摘质量。
王大亮孙建涛陆玉昌夏克俭
关键词:自动文摘文本挖掘信息熵
文本挖掘技术研究被引量:79
2005年
文本挖掘是数据挖掘的重要内容之一,其应用十分广泛。对文本挖掘技术的基本概念和理论进行系统地归纳总结,首先给出了数据挖掘、文本挖掘和Web文本挖掘的基本概念及主要研究方向,然后分析了文本挖掘的过程和关键技术,最后对文本挖掘技术进行总结和展望。
薛为民陆玉昌
关键词:文本挖掘数据挖掘WEB文本挖掘
基于HowNet构造语义场的方法被引量:5
2005年
为了能尽量消除传统语义场研究中的主观随意性,提出一种基于HowNet构造语义场的新方法,并充分利用语义场的空间特性,将词语相似度计算引入语义场用于划分语义场结构。计算实例表明:提出的构造语义场、划分语义场结构的方法,有利于计算机自动获得语义场,具有客观性和可计算性的特点,有效排除了以往构造语义场的主观随意性,可应用到各种基于语义的文本处理方法中。
王大亮孙建涛陆玉昌夏克俭王泉德
关键词:信息处理语义场词语相似度HOWNET文本挖掘
文本分类中结合评估函数的TEF-WA权值调整技术被引量:41
2005年
文本自动分类面临的难题之一是如何从高维的特征空间中选取对文本分类有效的特征,以适应文本分类算法并提高分类精度.针对这一问题,在分析比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种结合评估函数的TEF-WA权重调整技术,设计了一种新的权重函数,将特征评估函数蕴含到权值函数,按照特征对文本分类的辨别能力调整其在分类器中的贡献.实验结果证明了TEF-WA权值调整技术在提高分类精度和降低算法的时间复杂度方面都是有效的.
唐焕玲孙建涛孙建涛
关键词:文本分类
用动态Bayesian网络建立宏观经济系统模型被引量:5
2004年
针对限制动态 Bayesian网络方法应用的 Markov假设和转移概率时不变假设 ,研究了如何利用部分观测信息建立宏观经济系统的 Markov模型以及如何建立转移概率具有时变特性的宏观经济系统模型。对不满足 Markov假设的演化过程 ,通过在模型中添加隐藏变量建立 Markov模型 ,并对 EM- EA算法进行扩展 ,使之用于带隐藏变量的动态 Bayesian网络的学习。对不满足时不变性的转移概率 ,应用多项式拟合方法直接从数据构造时变转移概率模型。
田凤占陆玉昌
关键词:多项式拟合
贝叶斯分类算法在冠心病中医临床证型诊断中的应用被引量:32
2006年
在中医药临床个体化诊疗信息平台的基础上,使用中医证型的辨证相关因素,利用信息增益算法进行辨证属性选择,并分别采用朴素贝叶斯和强属性集贝叶斯网络算法建立了中医冠心病临床证型诊断模型。实验结果表明该分类算法在中医冠心病临床诊断模型中具有良好的分类性能。
孙亚男宁士勇鲁明羽陆玉昌
关键词:朴素贝叶斯贝叶斯网络中医诊疗冠心病
多模块贝叶斯网络中推理的简化被引量:30
2003年
多模块贝叶斯网络 (MSBN)引入了模块化和面向对象思想 ,是复杂大系统建模的有力工具 目前 ,如何简化MSBN中局部和全局推理的时空复杂度已成为影响其应用的关键问题 首先分析了用于局部贝叶斯网络推理的两类经典算法的时空复杂度 ,证明了它们本质上的一致性 ,并给出了统一的理论解释 ;进而用实验证明了影响推理复杂度的决定性因素是网络模型相应导出图的导出宽度 ,并指出了可以精确推理的贝叶斯网络族 最后 ,分析了降低MSBN全局推理复杂度的可行性 ,给出了简化MSBN全局推理的指导性原则 .
田凤占张宏伟陆玉昌石纯一
关键词:贝叶斯网络
共1页<1>
聚类工具0