您的位置: 专家智库 > >

贾俊杰

作品数:9 被引量:11H指数:2
供职机构:西北师范大学计算机科学与工程学院更多>>
发文基金:兰州市科技发展计划项目甘肃省中青年科技研究基金国家自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 8篇期刊文章
  • 1篇学位论文

领域

  • 8篇自动化与计算...
  • 1篇理学

主题

  • 3篇隐私
  • 3篇隐私保护
  • 3篇数据发布
  • 3篇匿名
  • 2篇时间复杂度
  • 2篇数据挖掘
  • 2篇数字图
  • 2篇数字图书馆
  • 2篇图书
  • 2篇图书馆
  • 2篇聚类
  • 2篇关联规则
  • 2篇复杂度
  • 1篇用户
  • 1篇增量更新算法
  • 1篇散点图
  • 1篇数据集
  • 1篇数字图书馆用...
  • 1篇似然估计
  • 1篇图书馆用户

机构

  • 9篇西北师范大学

作者

  • 9篇贾俊杰
  • 3篇王治和
  • 3篇陈菲
  • 1篇马慧芳
  • 1篇朱志强

传媒

  • 2篇计算机工程与...
  • 2篇甘肃科技
  • 1篇计算机工程
  • 1篇西北师范大学...
  • 1篇计算机工程与...
  • 1篇计算机科学

年份

  • 1篇2017
  • 3篇2016
  • 1篇2011
  • 2篇2005
  • 2篇2004
9 条 记 录,以下是 1-9
排序方式:
递增EM算法的图像聚类
2011年
研究在样本子集中实现EM估计的递增EM算法.通过检测子样本的似然判断条件,自动选择样本递增的数量,建立子样本的拟合分布逐步逼进完全样本的高斯模型的过程,改进了传统EM算法在每一步迭代都需要遍历完全样本的计算复杂性以及效率较低的问题.实验结果表明,与EM算法相比,该算法能更早地达到估计值的领域,具有较快的收敛速度,聚类效果显著.
贾俊杰王治和
关键词:图像聚类EM算法高斯混合模型极大似然估计
基于关联规则的数据挖掘算法研究
本文提出的第一种频繁集挖掘算法-Suppoqui算法,扫描1遍数据库,查找出频繁1-项集,然后只扫描1遍最大频繁集长度的结点集合,就可查找出所有的无冗余的频繁集.传统的关联规则挖掘都是基于频繁集来进行的,往往生成过多的规...
贾俊杰
关键词:数据挖掘关联规则
文献传递
数字图书馆中图编码匿名方法被引量:2
2016年
现如今数字图书馆所发布的大部分数据只包含图书资源的相关信息,并没有用户属性与图书资源共同发布的数据,使得分析者不能从现有发布数据中分析出更多的信息,对有些科学研究造成困扰。建立一种用户属性与图书信息共同发布的匿名方式,首先将所有图书使用图书分类号进行重新编码,其次根据重新编码的稀疏情况将整个数据进行划分,最后在每个划分中使用置换方法进行匿名。实验结果表明,最终匿名表的数据具有较高的准确性和实用性,并能够通过散点图的方式直观地看到属性间的关系,为科学研究提供更多有用信息。
贾俊杰陈菲闫国蕾邢里程
关键词:数字图书馆数据发布隐私保护散点图
基于核心词项平均划分相似度的短文本聚类算法
2017年
针对短文本特征极度稀疏、上下文依赖性强等特点,以自顶向下的策略,提出一种基于核心词项平均划分相似度的短文本聚类算法CTMPS。该方法首先在整个短文本语料库中计算词项之间的概率相关性,以此为基础对短文本中词项进行加权,将权值较大的词项作为最能代表该短文本的核心词项形成核心词项集;以信息论为基础,将核心词项作为划分依据计算平均划分相似度,选择平均划分相似度值最大包含该核心词项的短文本形成一类,用此策略反复迭代直到满足要求。最后,实验结果表明,本文提出的方法显著地提高了短文本聚类的性能。
马慧芳朱志强成玉丹贾俊杰
按位归“档”排序算法研究
2004年
针对传统排序算法的比较思想 ,提出了一种简单而快速的排序算法 ,尤其在非均匀分布下的数据效果更加明显 ,该算法在最坏情况下待排数据较多较大时的时间复杂度为O(n) .
王治和贾俊杰
关键词:排序时间复杂度
数字图书馆用户身份匿名化研究被引量:1
2016年
在数字图书馆信息发布中用户身份信息是进行数据分析的重要依据。建立一种保留用户身份的匿名数据发布模型,对用户属性进行合理化选择,采用匿名方式划分用户身份得到用户类,通过用户类与借阅信息的链接得到用户身份与借阅信息的映射关系,从而发布包含用户身份的匿名数据。实验结果表明,保留用户身份的匿名发布能在保障用户安全的前提下,较好地实现数字图书馆数据的可利用性,整体提高数字图书馆的服务质量。
贾俊杰陈菲
关键词:数字图书馆数据发布隐私保护K-匿名
精度归“档”插入排序算法研究被引量:2
2004年
提出了一种在最大值和最小值之间的数据范围内,由待排序数据的落点百分比精确到第一位小数点后经转换所形成的固定"档"住的基础上,利用归"档"统计和直接插入排序所形成的新排序算法—精度归"档"插入排序算法。概算法在待排序数据非极不均匀的情况下,时间复杂度降为D(n),具有重要的实际意义。
王治和贾俊杰
关键词:时间复杂度小数点落点
Suppoqui算法-基于支持度的频繁集快速产生算法
2005年
提出了一种新的关联规则挖掘算法-Suppoqui算法,该算法是通过对集合树进行遍历来求频繁项集,它取消了候选集的求解过程,抛弃了以往传统算法求解频繁项集的思路,因此该算法是高效的。
贾俊杰
关键词:数据挖掘关联规则频繁项集
(α,k)-匿名数据集的增量更新算法被引量:3
2016年
现如今已提出了多种个性化的隐私保护算法,这些隐私保护算法大多是针对静态数据的,而动态新增数据集和原始匿名数据集的同步更新是一个亟待解决的问题。建立一种在(αk)-匿名数据基础上的增量更新方法,对于每个元组计算语义贴近度并选择合适的等价类进行元组更新,使得最终动态更新后的数据也满足(αk)-匿名。算法分析及仿真实验结果表明,算法以较小的信息损失和执行时进行数据动态更新。
贾俊杰陈菲
关键词:数据发布隐私保护
共1页<1>
聚类工具0