DOI：10.3321/j.issn:0372-2112.2008.10.027

数据表k-匿名化的微聚集算法研究

引用

摘要：

数据表的k-匿名化(k-anonymization)是数据发布时保护私有信息的一种重要方法.泛化/隐匿是实现k-匿名的传统技术,然而,该技术存在效率低、k-匿名化后数据的可用性差等问题.近年来,微聚集(Microaggregation)算法被应用到数据表的k-匿名化上,弥补了泛化/隐匿技术的不足,其基本思想是:将大量的数据按相似程度划分为若干类,要求每个类内元组数至少为k个,然后用类质心取代类内元组的值,实现数据表的k-匿名化.本文综述了微聚集算法的基本思想、相关技术和当前动态,对现有的微聚集算法进行了分类分析,并总结了微聚集算法的评估方法,最后对微聚集算法的研究难点及未来的发展趋势作了探讨.

关键词：k-匿名、泛化/隐匿、微数据、微聚集、隐私保护

所属期刊栏目：36

分类号：TP309.2(计算技术、计算机技术)

资助基金：国家自然科学基金60773094,60473055;上海市曙光计划07SG32;上海市浦江人才计划05PJ14030

在线出版日期：2009-01-06（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：2021-2029

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

数据表k-匿名化的微聚集算法研究