国家自然科学基金(61163015)
- 作品数:34 被引量:52H指数:4
- 相关作者:张晓琳刘立新吕庆李玉峰郑春红更多>>
- 相关机构:内蒙古科技大学中南大学包头钢铁职业技术学院更多>>
- 发文基金:国家自然科学基金内蒙古自治区自然科学基金教育部“春晖计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- 社会网络子集个性化隐私保护策略被引量:2
- 2015年
- 现有的社会网络隐私保护通常是基于所有用户完全一致的隐私保护,忽略了用户之间对隐私保护的需求存在差别。针对这一问题,提出个性化隐私保护框架,根据用户不同隐私保护需求提取部分子集,共设置三种隐私保护级别:首先,简单移除原始图节点标签,并为每个节点设置相应的ID值;其次,为保护节点度信息,提出基于动态规划思想的k-d_sub(k-degree_subset)算法;最后,为防止敏感属性被识别将l-diversity与k-d_sub算法结合,提出k-d_l_sub(k-degree_l_subset)算法,添加最少数量的边,降低匿名成本,并且最大化数据效用。实验证明,提出的个性化隐私保护框架有较高的匿名质量,能有效保护社会网络中用户的隐私。
- 张晓琳王萍郭彦磊
- 关键词:社会网络隐私保护子集个性化
- 基于社会网络的(α,k)-匿名方法被引量:1
- 2012年
- 随着网络技术的快速发展,大量在线社会网络的建立和使用,越来越多的人参加到社会网络中分享和交流信息,而在这种交互过程中,会产生大量的数据。这些数据中有些是用户个人生活领域中不愿意别人知道的事情,可以认为它们是用户的隐私。社会网络数据发布的隐私保护成为新兴的研究课题。本文提出了应用于社会网络的(α,k)-匿名方法,采用基于聚类的方法,对节点的属性及节点之间的关系进行保护。每个聚类中的节点数至少为k个,并且聚类中任一敏感属性值相关的节点的百分比不高于α。理论分析和实验结果表明,基于社会网络的(α,k)-匿名方法能在信息损失尽可能小的情况下有效地保护隐私。
- 张晓琳王颖李玉峰
- 关键词:社会网络隐私保护
- 连续概率XML数据查询处理技术被引量:2
- 2012年
- 目前查询连续概率XML数据多采用离散化方法,需要处理大量直方图分段,查询效率较低。本文提出了一种基于p-文档模型的连续概率XML数据查询处理技术,首先利用cont节点扩展p-文档模型支持任意的连续分布,在cont节点中编码概率密度函数以及他们的参数;其次采用twig模式匹配找到符合用户要求的路径;然后根据要查询的连续分布类型确定概率查询应该使用符号表示法、积分法或直方图近似法:标准连续分布通过符号表示法中的参数或复杂的累积分布函数计算查询结果,满足积分条件的非标准连续分布采用积分法,其它情况采用直方图近似法。实验结果表明,该方法在概率查询的精确度以及响应时间上比现有方法更高效。
- 张晓琳郑珍珍刘立新李玉峰
- 关键词:查询处理
- 基于扩展倒排索引的不确定XML关键字查询算法被引量:4
- 2015年
- 现有的不确定XML关键字查询算法均需遍历不确定XML文档,并且算法在执行过程中需要频繁的字符串比较,造成时间浪费。针对上述问题,提出基于扩展倒排索引的不确定XML关键字查询算法Pr E。扩展倒排索引有效地存储了不确定XML文档中节点的相关信息,根据扩展倒排索引即可初始化动态哈希表和序号编码链表,并且Pr E算法在执行过程中利用整数的比较代替了字符串的比较。理论分析与实验结果表明,Pr E算法是一种高效的不确定XML关键字查询算法。
- 牛大伟苏龙超韩雨童张晓琳
- 关键词:关键字查询PRE
- InSearch:一种高效的XML关键字查询算法
- 2016年
- 现有的XML关键字查询算法都是基于前缀编码,而这种编码方式会产生公共祖先重复比较CAR(Common Ancestor Repetition)问题.针对这一问题,提出一种基于区间编码的XM L关键字查询算法In Search(Interval Search).该算法首先建立基于区间编码的区间索引In Index(Interval Index),计算节点之间的最小范围值和最小公共祖先,遍历区间索引计算候选SLCA节点集合,过滤候选SLCA节点集合,得到SLCA节点集合.理论和实验结果表明,In Search算法是一种高效的SLCA节点查询算法.
- 张晓琳郝琨郭丹丹张换香刘立新
- 关键词:XML关键字查询
- 一种适用连续不确定XML数据的索引
- 2016年
- 针对连续不确定XML数据概率阈值范围查询,提出一种新的CUXI索引树。该索引树的构建方法是借鉴U树对空间数据自顶向下递归构建索引树的思想,将连续不确定XML文档中具有相同父亲的叶子节点构建二维数据矩形,在聚类的基础上来构建相应的CUXI索引树,其中叶子节点存储连续不确定数据辅助信息。为了提高查询效率,对连续不确定数据制定了过滤策略,通过遍历索引树过滤掉不满足查询范围的子树。理论和实验结果表明,此索引技术可提高查询处理的性能。
- 张晓琳郭丹丹郝琨
- 无线传感器网络中一种能量高效的skyline查询算法被引量:1
- 2012年
- 针对分布式无线传感器网络环境下的skyline查询问题,提出了KSkySenor算法,有效地从传感器网络中获取更有意义的skyline结果;KSkySenor算法对感知数据进行预处理计算每个元组的支配能力,按照支配能力与各维度值之和对其进行排序,设计了一个基于聚簇的结构用于收集所有传感器读数,提出了一个剪枝方法用于渐进的从传感器网中获取skyline结果集;实验中分别改变传感器网络规模大小、数据维度、支配属性个数k,对KSkySensor算法进行测试,实验结果表明KSkySenor算法与先前的skyline查询处理算法相比具有很高效率,减少了无线传感器网络中的数据传输量,延长了网络生命周期。
- 张晓琳唐文斌魏朋佩王颖
- 关键词:无线传感器网络
- 动态社会网络隐私保护方法研究被引量:11
- 2012年
- 针对动态社会网络数据多重发布中用户的隐私信息泄露问题,结合攻击者基于背景知识的结构化攻击,提出了一种动态社会网络隐私保护方法。该方法首先在每次发布时采用k-同构算法把原始图有效划分为k个同构子图,并最小化匿名成本;然后对节点ID泛化,阻止节点增加或删除时攻击者结合多重发布间的关联识别用户的隐私信息。通过数据集实验证实,提出的方法有较高的匿名质量和较低的信息损失,能有效保护动态社会网络中用户的隐私。
- 张晓琳李玉峰王颖
- 关键词:隐私保护图同构泛化
- 一种有效的不确定数据概率频繁项集挖掘算法被引量:8
- 2012年
- 针对PFIM算法中频繁概率计算方法的局限性,且挖掘时需要多次扫描数据库和生成大量候选集的不足,提出EPFIM(efficient probabilistic frequent itemset mining)算法。新提出的频繁概率计算方法能适应数据流等项集的概率发生变化时的情况;通过不确定数据库存储在概率矩阵中,以及利用项集的有序性和逐步删除无用事物来提高挖掘效率。理论分析和实验结果证明了EPFIM算法的性能更优。
- 刘立新张晓琳毛伊敏
- 关键词:不确定数据
- 一种基于序列的不确定XML小枝匹配方法被引量:1
- 2014年
- 针对目前不确定XML小枝模式查询处理方法中繁复的结构连接操作和不便于概率阈值过滤的缺点,提出一种新颖的基于序列的不确定XML小枝模式查询处理方法。该方法包括不确定XML序列索引的建立以及基于序列匹配的查询算法,与现有的不确定XML查询处理方法相比不需要繁复的结构连接操作,而且可以灵活地进行三次概率阈值过滤。理论分析和实验表明,该方法便于概率阈值过滤,同时具有较高的查询效率。
- 张晓琳王鹏
- 关键词:小枝模式