赵鹏
- 作品数:78 被引量:651H指数:14
- 供职机构:安徽大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学经济管理理学更多>>
- 基于改进蚁群算法的数据仓库多连接查询优化被引量:3
- 2012年
- 传统蚁群算法在解决数据仓库查询优化问题时存在过早收敛、收敛速度慢的缺点。为此,对传统蚁群算法进行改进,将伪随机状态转移规则引入最大最小蚁群系统,在每次迭代结束后进行迭代局部搜索。实验结果表明,改进算法在多表连接查询优化中具有较快的收敛速度,能提高最优解的质量。
- 赵鹏王守军龚云
- 关键词:蚁群算法数据仓库多连接查询优化
- 基于模糊邻域粗糙集的信息系统不确定性度量方法被引量:10
- 2017年
- 邻域粗糙集和模糊粗糙集是粗糙集理论中处理数值型数据的两种重要模型.在数值型信息系统中融合两者在不确定性度量方面的优越性,首先引入了模糊邻域粗糙集模型,并在该模型上定义了模糊邻域粗糙度的概念.模糊邻域粗糙度是通过粗糙集的边界域来度量信息系统的不确定性,为了达到更为全面的度量效果,在模糊邻域粗糙集模型中定义了模糊邻域粒结构,并基于该粒结构提出了模糊邻域粒度的概念,模糊邻域粒度是对信息系统分类能力的一种度量.最后,通过将两种度量方法进行结合,提出了一种基于模糊邻域粗糙集的混合不确定性度量方法,并从理论上证明其有效性.实验结果表明,所提出的混合度量方法综合了两种单独度量方法的优点,在数值型信息系统中具有更好的度量效果,因此所提出的不确定性度量方法更具有一定的优越性.
- 徐风姚晟纪霞赵鹏汪杰
- 基于双分支特征融合的场景文本检测方法被引量:5
- 2021年
- 现有的基于深度学习的自然场景文本检测方法一般采用大型深度神经网络作为主干网络进行特征提取,虽然效果显著但检测模型十分庞大,检测效率较低,若直接将主干网络换成轻量型网络则不能提取出足够的特征信息,直接导致检测效果大幅降低.为了降低文本检测模型的规模以及更为高效地检测文本,提出基于双分支特征融合的场景文本检测方法,在采用相对轻量级的主干网络EfficientNet-b3的基础上,使用双路分支进行特征融合进而检测场景文本.一路分支使用特征金字塔网络,融合不同层级的特征;另一路分支使用空洞卷积空间金字塔池化结构,扩大感受野,然后融合两个分支的特征,在小幅增加计算量的同时获取更多的特征,弥补小型网络提取特征不足的问题.在3个公开数据集上的实验结果显示,所提出方法在保持较高检测水平的情况下,可以大幅度降低模型的参数量,大幅度提升检测速度.
- 赵鹏徐本朋闫石刘政怡
- 邻域粗糙集模型的规则提取方法研究被引量:3
- 2018年
- 邻域粗糙集是粗糙集理论中一种处理数值型数据的重要模型,而规则提取是数据挖掘中最重要和最关键的环节,由于数值型数据取值连续,目前在邻域粗糙集模型中的规则提取并没有系统化的方法,本文针对这一问题提出一种特殊的决策规则模型,首先通过对象集的形式来定义决策规则的前件,然后通过求取下近似的方法在邻域粗糙集模型中进行决策规则诱导,最后,通过距离度量来给出决策判别的方法.UCI实验结果表明本文提出的模型具有一定的可行性和合理性.
- 姚晟徐风赵鹏汪杰陈菊
- 关键词:邻域粗糙集
- 实时个性化微博推荐系统被引量:1
- 2018年
- 目前很多社交网络服务对用户的个性化需求考虑得不充分,并且社交网络服务由于需要处理海量数据而难以保障服务的实时性。为了实时响应用户在微博推荐中的个性化请求,提高推荐的效率和质量,提出了一种基于LDA主题模型和KL散度相结合的RPMPS微博推荐模型。RPMPS推荐模型不但通过文档-主题概率分布矩阵获得了用户信息与待推荐微博的主题相似性,而且还通过文档-词来对词频概率进行统计,从而获得用户信息与待推荐微博的内容相似性。最后,基于RPMPS推荐模型构建实时个性化微博推荐系统,并在数据处理过程中对微博进行过滤以缩短系统的响应时间。通过真实数据集验证了系统可较好地满足用户的实时个性化需求。
- 刘慧婷程雷郭孝雪赵鹏
- 关键词:社交网络推荐系统
- 基于数据挖掘技术的范例库维护被引量:11
- 2003年
- 在范例推理系统中,系统的学习会使范例库无限增大,会导致系统的功能不断下降。范例推理学习系统必须有范例库的维护。本文在详细讨论了范例库的维护技术的同时,提出了一个基于数据挖掘技术的维护策略,以保证系统的学习不影响系统性能。
- 赵鹏倪志伟贾瑞玉
- 关键词:人工智能范例库数据挖掘知识库
- 一种基于《知网》的中文文本聚类算法的研究被引量:13
- 2007年
- 针对基于关键词集的中文文本聚类算法中存在的问题,将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法。该算法在中文文本表示中加入了基于《知网》的概念特征,实验结果表明该算法能够更好地将语义相关的中文文档聚集在一起,与传统的基于关键词集的中文文本聚类算法相比,聚类质量得到了较大提高。
- 赵鹏蔡庆生
- 关键词:向量空间模型本体论知网
- 基于信任关系重建和社交网络传递的推荐算法被引量:10
- 2016年
- 传统的协同过滤推荐算法存在数据稀疏和可用用户偏好信息有限的问题。针对数据稀疏问题和联系不可靠现象对传统社交网络推荐带来的影响,提出一种在信任关系重建和社交网络传递基础上的推荐算法。引入去伪存真方法避免联系不可靠现象,根据用户所建立的联系规模改进用户相似度计算公式提高去伪存真准确度。定义预备朋友的概念,为用户推荐预备朋友解决数据稀疏问题。在重建的信任关系上利用社交网络的传递性进行预测评分,并定义二端分布函数调节预测评分提高推荐准确度。在数据集Epinion上进行实验,结果表明,该算法能减小数据稀疏和联系不可靠现象对推荐结果的负面影响,有效降低预测结果的平均绝对误差,提高推荐的准确度。
- 刘慧婷熊瑞瑞赵鹏
- 关键词:信任关系社交网络
- 一种基于词共现图的文档主题词自动抽取方法被引量:37
- 2006年
- 主题词抽取是文本自动处理的基础性工作.在对现有主题词抽取方法深入研究的基础上,提出了一种基于词共现图的文档主题词自动抽取方法;该方法以基于词频统计方法为基础,利用在词共现图形成的主题信息以及不同主题间的连接特征信息自动地提取文档中的主题词,旨在找出一些非高频词且又对主题贡献大的词.实验表明了该抽取方法抽取出的主题词更能准确地符合了作者的主题.
- 耿焕同蔡庆生于琨赵鹏
- 关键词:自然语言处理TFIDF
- 用遗传算法挖掘范例库中的特征项权重的方法被引量:13
- 2003年
- 范例推理的关键步骤在于相似范例的检索,而范例库中的特征项权重起着重要的作用。文章着重讨论了应用于范例库上获取特征项权重的数据挖掘算法,并提出用遗传算法发现范例库上特征项权重的过程与算法,然后进行了实验与讨论。
- 贾兆红倪志伟赵鹏
- 关键词:范例库数据挖掘遗传算法