公共文化服务平台

共 8 条记录，以下是 1-8

全选清除导出

排序方式：

Parallel Expectation-Maximization Algorithm for Large Databases: 2006年; A new parallel expectation-maximization (EM) algorithm is proposed for large databases. The purpose of the algorithm is to accelerate the operation of the EM algorithm. As a well-known algorithm for estimation in generic statistical problems, the EM algorithm has been widely used in many domains. But it often requires significant computational resources. So it is needed to develop more elaborate methods to adapt the databases to a large number of records or large dimensionality. The parallel EM algorithm is based on partial E-steps which has the standard convergence guarantee of EM. The algorithm utilizes fully the advantage of parallel computation. It was confirmed that the algorithm obtains about 2.6 speedups in contrast with the standard EM algorithm through its application to large databases. The running time will decrease near linearly when the number of processors increasing.; 黄浩宋瀚涛陆玉昌; 关键词：数据库 EM算法

一种面向自动文本摘要特征评价的新方法被引量：1: 2004年; 自动文本的特征评价方法的研究一直未受到研究者们的重视。以往只是简单地将面向文本集的TF.IDF特征评价方法应用于针对单文本的自动文摘领域,该方法无法排除低频词噪音的影响,特征评价存在明显误差,致使不能准确计算文本特征。文章引入信息熵,提出了针对单文本的特征评价方法TF.IDF.H。实验表明,新的特征评价方法能够准确获得文章主题特征,更好地改善文摘质量。; 王大亮孙建涛陆玉昌夏克俭; 关键词：自动文摘文本挖掘信息熵

文本挖掘技术研究被引量：79: 2005年; 文本挖掘是数据挖掘的重要内容之一,其应用十分广泛。对文本挖掘技术的基本概念和理论进行系统地归纳总结,首先给出了数据挖掘、文本挖掘和Web文本挖掘的基本概念及主要研究方向,然后分析了文本挖掘的过程和关键技术,最后对文本挖掘技术进行总结和展望。; 薛为民陆玉昌; 关键词：文本挖掘数据挖掘 WEB文本挖掘

基于HowNet构造语义场的方法被引量：5: 2005年; 为了能尽量消除传统语义场研究中的主观随意性,提出一种基于HowNet构造语义场的新方法,并充分利用语义场的空间特性,将词语相似度计算引入语义场用于划分语义场结构。计算实例表明:提出的构造语义场、划分语义场结构的方法,有利于计算机自动获得语义场,具有客观性和可计算性的特点,有效排除了以往构造语义场的主观随意性,可应用到各种基于语义的文本处理方法中。; 王大亮孙建涛陆玉昌夏克俭王泉德; 关键词：信息处理语义场词语相似度 HOWNET 文本挖掘

文本分类中结合评估函数的TEF-WA权值调整技术被引量：41: 2005年; 文本自动分类面临的难题之一是如何从高维的特征空间中选取对文本分类有效的特征,以适应文本分类算法并提高分类精度.针对这一问题,在分析比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种结合评估函数的TEF-WA权重调整技术,设计了一种新的权重函数,将特征评估函数蕴含到权值函数,按照特征对文本分类的辨别能力调整其在分类器中的贡献.实验结果证明了TEF-WA权值调整技术在提高分类精度和降低算法的时间复杂度方面都是有效的.; 唐焕玲孙建涛孙建涛; 关键词：文本分类

用动态Bayesian网络建立宏观经济系统模型被引量：5: 2004年; 针对限制动态 Bayesian网络方法应用的 Markov假设和转移概率时不变假设 ,研究了如何利用部分观测信息建立宏观经济系统的 Markov模型以及如何建立转移概率具有时变特性的宏观经济系统模型。对不满足 Markov假设的演化过程 ,通过在模型中添加隐藏变量建立 Markov模型 ,并对 EM- EA算法进行扩展 ,使之用于带隐藏变量的动态 Bayesian网络的学习。对不满足时不变性的转移概率 ,应用多项式拟合方法直接从数据构造时变转移概率模型。; 田凤占陆玉昌; 关键词：多项式拟合

贝叶斯分类算法在冠心病中医临床证型诊断中的应用被引量：32: 2006年; 在中医药临床个体化诊疗信息平台的基础上,使用中医证型的辨证相关因素,利用信息增益算法进行辨证属性选择,并分别采用朴素贝叶斯和强属性集贝叶斯网络算法建立了中医冠心病临床证型诊断模型。实验结果表明该分类算法在中医冠心病临床诊断模型中具有良好的分类性能。; 孙亚男宁士勇鲁明羽陆玉昌; 关键词：朴素贝叶斯贝叶斯网络中医诊疗冠心病

多模块贝叶斯网络中推理的简化被引量：30: 2003年; 多模块贝叶斯网络 (MSBN)引入了模块化和面向对象思想 ,是复杂大系统建模的有力工具目前 ,如何简化MSBN中局部和全局推理的时空复杂度已成为影响其应用的关键问题首先分析了用于局部贝叶斯网络推理的两类经典算法的时空复杂度 ,证明了它们本质上的一致性 ,并给出了统一的理论解释 ;进而用实验证明了影响推理复杂度的决定性因素是网络模型相应导出图的导出宽度 ,并指出了可以精确推理的贝叶斯网络族最后 ,分析了降低MSBN全局推理复杂度的可行性 ,给出了简化MSBN全局推理的指导性原则 .; 田凤占张宏伟陆玉昌石纯一; 关键词：贝叶斯网络

全选清除导出

共1页<1>

国家自然科学基金(79990584)