10.3321/j.issn:0372-2112.2008.10.027
数据表k-匿名化的微聚集算法研究
数据表的k-匿名化(k-anonymization)是数据发布时保护私有信息的一种重要方法.泛化/隐匿是实现k-匿名的传统技术,然而,该技术存在效率低、k-匿名化后数据的可用性差等问题.近年来,微聚集(Microaggregation)算法被应用到数据表的k-匿名化上,弥补了泛化/隐匿技术的不足,其基本思想是:将大量的数据按相似程度划分为若干类,要求每个类内元组数至少为k个,然后用类质心取代类内元组的值,实现数据表的k-匿名化.本文综述了微聚集算法的基本思想、相关技术和当前动态,对现有的微聚集算法进行了分类分析,并总结了微聚集算法的评估方法,最后对微聚集算法的研究难点及未来的发展趋势作了探讨.
k-匿名、泛化/隐匿、微数据、微聚集、隐私保护
36
TP309.2(计算技术、计算机技术)
国家自然科学基金60773094,60473055;上海市曙光计划07SG32;上海市浦江人才计划05PJ14030
2009-01-06(万方平台首次上网日期,不代表论文的发表时间)
共9页
2021-2029