国家自然科学基金(70171052)
- 作品数:19 被引量:145H指数:6
- 相关作者:蔡庆生耿焕同赵鹏王清毅张巍更多>>
- 相关机构:中国科学技术大学安徽师范大学安徽大学更多>>
- 发文基金:国家自然科学基金安徽省高等学校优秀青年人才基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 互联网上智能Agent软件算法研究
- 给出了Agent和软件Agent的基本概念,阐释了Internet上软件Agent的有关思想.在分析Internet上软件Agent技术应用存在问题的基础上,提出了加权的统计启发式搜索算法和概率逻辑神经网络的AZ模型,并...
- 吴强张巍蔡庆生
- 关键词:AGENT软件AGENT互联网分布式人工智能
- 面向主题的互联网信息智能获取与处理工具被引量:2
- 2004年
- 将人工智能技术与现有Web信息搜索技术有机结合,建立用户查询的个性化模型,提供信息查询的个性化服务,并实现了面向主题的互联网信息智能获取与处理工具.
- 耿焕同陈少军罗永龙
- 关键词:WWW面向主题用户兴趣模型信息检索
- 染色问题的网络特性
- 2004年
- 染色问题是约束满足问题的一个经典问题。通过分析染色问题的经典实例,发现染色问题具备复杂网络中常见的"小世界"特性,即染色问题所构成的网络中,任意两个节点之间的平均路径长度很小,整个系统呈现出高聚集度的特性,以及节点度的特异分布。这些特性是随机图所不具备的,因此,以随机图做染色问题测试集的传统方法是不完善的。在实验中同时发现,染色问题中最小染色数的大小与系统聚集度的大小密切相关,随聚集度的增大,呈指数关系增大。
- 朱孟潇蔡庆生
- 关键词:染色问题约束满足问题网络特性小世界
- 一种基于语义和统计特征的中文文本特征表示方法被引量:10
- 2007年
- 基于关键词集的中文文本特征表示方法难以准确表示文本语义信息,从而导致聚类质量较差.为了解决这个问题,本文将本体论和词共现模型的思想引入到中文文本的特征表示中,并在此基础上提出了一种基于语义和统计特征的中文文本特征表示方法.本方法在统计特征的基础上加入了基于知网和特征项共现的语义特征,实验结果表明该方法更加准确地表示了中文文本的语义信息,使得中文文本自动聚类的质量提高了近18%.
- 赵鹏耿焕同蔡庆生
- 关键词:向量空间模型知网词共现
- 一种基于复杂网络特征的中文文档关键词抽取算法被引量:50
- 2007年
- 关键词抽取是自然语言理解领域中的重要技术之一.本文研究汉语语言所组成的自然语言网络中的复杂网络特性,并根据语言网络中的"小世界"特性和近两年复杂网络研究中部分新的理论成果,提出基于复杂网络特征的中文文档关键词抽取算法.该算法根据文档语言网络中单词结点的复杂网络特征值进行关键词抽取.实验结果表明,本文算法抽取关键词所获得的平均准确率要高于 TFIDF 关键词抽取算法所获得的平均准确率.
- 赵鹏蔡庆生王清毅耿焕同
- 关键词:复杂网络语言网络关键词抽取
- 基于商空间模型的CBR系统被引量:2
- 2006年
- 传统的CBR系统采用平面结构,系统在运行过程中不断学习,范例库将变得越来越大,当范例数超过某一预设的上界时,就会出现“沼泽问题”。为了解决这个问题,该文提出了基于商空间模型的CBR系统,采用分层递阶的立体结构,在运行阶段将惰性学习算法与积极学习算法相结合。实验表明利用本方法构造的CBR系统实现E-mail分类预测时,系统的性能和有效性都得到了很大的提高。
- 赵鹏蔡庆生耿焕同于琨
- 关键词:商空间理论信息粒度分层递阶结构
- 可移植Browser/Server方式的管理信息系统被引量:5
- 2004年
- 构建一个分布式的、客户端调用与管理业务逻辑高度分离的管理信息系统是一个很有意义的问题 .根据三层Browser/ Server分布式体系结构 ,利用 COM组件技术和 XML 通用数据交换技术 ,成功将客户端 ASP调用代码与后台数据库存储的管理业务逻辑有效分离 。
- 张巍袁赣蔡庆生
- 关键词:管理信息系统ASPCOM组件对象模型
- 一种基于加权复杂网络特征的K-means聚类算法被引量:20
- 2007年
- 在分析了传统的基于划分的K-means聚类算法的优越性和存在不足的基础上,根据近两年复杂网络研究中部分新的理论成果,提出了复杂网络加权度、加权聚集度与加权聚集系数的定义,并将数据聚类转换为复杂网络上的节点聚类,提出基于加权复杂网络特征的K-means聚类算法(简称WCNFC算法)。实验结果表明,该算法根据节点加权复杂网络特征值,能够较好地找到聚类中心,有效地避免了对初始化选值敏感性的问题,从而使得聚类质量大大提高。
- 赵鹏耿焕同蔡庆生王清毅
- 关键词:聚类复杂网络
- 一种基于传统VSM和词共现概念的中文文本聚类的研究被引量:5
- 2005年
- 提出了一种利用传统向量空间模型VSM(VectorSpaceModel)和词共现概念共同表示文档特征的新方法,并将该方法应用于基于平面划分的中文文本聚类中.通过实验,表明基于传统VSM和词共现概念的文本聚类方法与传统的单纯基于关键词集的VSM文本聚类方法相比具有更好的聚类性能,具有一定的实用价值.
- 耿焕同陈少军
- 关键词:VSM中文文本文本聚类向量空间模型明基
- 基于CBR的文本自动分类研究被引量:2
- 2005年
- KNN方法是性能最好的文本分类方法之一,但它在分类时要计算待分类文档与所有训练样本的相似度,时间复杂度较大。文中提出了一种基于CBR的文本自动分类方法,先用聚类方法把训练样本库转换为范例库,然后用KNN思想分类。实验结果显示该方法分类的平均召回率和准确率达到了87.07%和89.17%;并且通过分析算法的时间复杂度得知,该方法的分类速度比KNN方法有很大的提高,因此具有很好的实用价值。
- 张婷慧耿焕同蔡庆生
- 关键词:基于范例推理文本自动分类K近邻聚类