河北省科技攻关计划(05213573)
- 作品数:9 被引量:54H指数:4
- 相关作者:袁方苑俊英刘博杨柳刘海博更多>>
- 相关机构:河北大学河北农业大学保定金融高等专科学校更多>>
- 发文基金:河北省科技攻关计划河北省教育厅科研基金保定市科技攻关计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 商务元搜索引擎中域语义映射问题研究被引量:1
- 2007年
- 电子商务元搜索引擎系统将出售相同产品的多个电子商务引擎界面集成在一起,提供统一的访问接口,给用户的访问和产品的比较提供了极大的方便。当涉及的产品域太多时,需要添加一个域映射模块,将用户的常规查询映射到正确的域上。本文采用本体作为信息的组织形式,不但提高了查询的相关性,而且可以扩充涉及的产品域;并且提供了一个记忆模型,提高频繁查找的效率。
- 陈向阳袁方
- 关键词:本体记忆模型
- 基于渐进式丰富词典的分词方法研究被引量:1
- 2006年
- 由于现代社会飞速发展,一些新的名词不断出现,在已有的字符串匹配的分词方法中,大部分的词典是固定的,如果出现新的词,那么就不能被正确识别出来。由此该文提出了渐进式丰富词典的分词方法,把那些不能正确分出来的字符串,利用统计词频的方法记录下来,如果词频达到一定阈值,就可以把它认为是新词,可以把它加入到词典中,使得词典动态的增加。实验证明,该方法在保证分词速度不受影响的基础上,可以提高分词的精度。
- 杨柳袁方霍亮
- 用聚类-分类模式解决聚类问题被引量:8
- 2007年
- 分类和聚类都是常用的数据挖掘方法,分类的优点是准确率较高,但需要带有类别标注的训练集;聚类不需要训练集,但准确率较低。提出一种聚类-分类模式来解决聚类问题,首先通过聚类方法自动形成训练集,然后在训练集的基础上进行分类操作。实验数据表明,提出的聚类-分类模式能够有效提高聚类的准确率。
- 周志勇袁方刘海博
- 关键词:聚类算法
- 基于探测查询的Deep Web实体识别被引量:1
- 2008年
- 目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别.因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并.该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体识别工作,该方法通过提交查询可以在提取数据的同时确定实体的各个属性,根据实体的各个属性进行实体识别.实验表明,该方法具有较高的实体识别准确率.
- 李石生刘海博路小英王亮
- 关键词:DEEPWEB数据抽取
- 改进的KNN方法及其在中文文本分类中的应用被引量:10
- 2008年
- 介绍了基于KNN方法的中文文本分类流程及相关技术,在分析传统KNN方法不足的基础上提出一种改进的KNN方法。该方法在特征选取、权值确定、相似度计算等方面进行了改进,并给出了优化措施。实验表明:与传统的KNN方法相比,改进后的KNN方法在保证分类准确率的同时,使分类效率得到了有效提高。
- 刘博杨柳袁方
- 关键词:文本分类KNN特征选取相似度
- 一种基于类别核心词的概念映射方法被引量:3
- 2007年
- 由于同义词和多义词的存在,使得基于特征词的文本分类方法分类精度不高。近几年,基于概念的文本分类方法得到人们的重视。在此提出一种基于类别核心词的概念映射方法,首先从文本中抽取类别核心词,借助《知网》将特征词映射到基于类别核心词的概念空间,然后在概念空间上完成文本分类工作。实验结果表明,基于类别核心词的概念映射方法及相应的基于概念的文本分类能够有效提高文本分类的精度。
- 苑俊英袁方刘博
- 关键词:文本分类《知网》
- 基于领域知识和决策树的Deep Web数据标注被引量:1
- 2009年
- 数据标注是D eep W eb数据集成系统的重要组成部分。建立了领域标注模型,描述数据标注的思想,根据不同的数据,使用领域知识和决策树两种标注方法,给出标注算法描述,最后以图书领域作为标注对象进行实验。实验结果表明该方法可高效、准确地对D eep W eb数据进行标注。
- 常勇王亮姚增利袁方
- 关键词:DEEPWEB领域知识决策树
- 基于类别核心词的朴素贝叶斯中文文本分类被引量:17
- 2006年
- 从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用.在此基础上提出了基于类别核心词的分类模式,从标题、摘要及关键词中提取类别核心词,通过加权方式,强化它们在文本分类中的作用.基于朴素贝叶斯分类方法的实验表明,提出的方法能够有效提高中文文本的分类准确率.
- 袁方苑俊英
- 关键词:文本分类朴素贝叶斯分类
- 基于用户兴趣的个性化信息检索方法被引量:12
- 2006年
- 目前检索工具的设计大多面向所有用户,而不考虑用户个人的兴趣,导致查准率较低.由此提出一种基于用户兴趣的个性化检索方法.该方法利用ODP,把用户的兴趣映射到一个树形结构上,当用户提出查询时,根据用户的兴趣为其提供相应的检索结果.考虑到人类大脑周期性衰减的生理特点,使用户特征文件随时间动态更新.实验结果表明,所提出的方法能够基于用户兴趣实现信息的个性化推荐,从而更好地满足用户的需求.
- 张瑜袁方
- 关键词:个性化搜索引擎权值