胡琪
- 作品数:2 被引量:7H指数:2
- 供职机构:贵州大学计算机科学与技术学院更多>>
- 发文基金:基础研究重大项目前期研究专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于HBase的RDF数据存储方案研究与设计被引量:5
- 2016年
- 针对RDF数据的存储问题,文章提出一种利用分布式数据库HBase以及设计数据库的Rowkey进行有效存储的方案,主要利用HBase与RDF数据的特点,使用经典的BKDRHash算法对谓词进行散列计算,将散列值与谓词作为主键,实现数据的存储。有效设置HBase的Rowkey不仅避免出现节点堆积现象,BKDRHash算法的使用也保证了数据的完整性。为证明该存储模式的有效性,文章实验选择利用Map Reduce将数据生成HBase内部存储格式HFile文件进行并行加载。实验证明,针对这样的存储模式,当数据量很大时数据加载性能较好。使用LUBM测试集进行仿真实验,证明该方案是有效的。
- 王媛媛吕晓丹胡琪吴鸿川
- 关键词:语义网RDF数据HBASEMAPREDUCE
- 基于进化算法的社会网络数据k-匿名发布被引量:2
- 2016年
- 基于科学发展的需要,越来越多的社会网络数据被共享发布。为保证发布数据中个体的隐私不被泄露,必须将数据进行隐私保护后发布。针对结点度的再识别攻击,提出一种改进的进化算法对社会网络发布的数据进行k-度匿名(CEAGA),将EAGA算法中的适应度函数与循环结束条件进行改进,得到最优的k-度匿名序列,之后按照得到的k-度匿名序列对匿名图进行构造,得到最优的k-度匿名社会网络图。实验结果表明,改进后的进化算法不但降低了对原社会网络图的修改,并且对图结构性质的保持也优于EAGA算法。
- 胡琪蒋朝惠吕晓丹
- 关键词:社会网络隐私保护进化算法