首页 . 管理学 . 管理科学与工程 . 大数据与知识管理 . 大数据 . 大数据安全 . 隐私保护

数据挖掘匿名保护

/anonymous protection of data mining/
最后更新 2023-02-25
浏览 160
最后更新 2023-02-25
浏览 160
0 意见反馈 条目引用

在大型数据集寻找发现可行信息的过程中,以匿名化模型对商业机密或隐私内容进行保护处理,防止大量敏感字段泄露的处理技术。

英文名称
anonymous protection of data mining
所属学科
管理科学与工程

随着大数据时代的来临,数据爆发式增加,共享使得信息道德出现危机。

原始数据集具有个体标识属性、准标识属性、敏感属性、非敏感属性等特性。攻击者会通过链接攻击、同质性攻击、相似性攻击等方式窃取用户敏感属性数据,利用数据挖掘技术加以提炼,获取威胁用户隐私安全的信息。

科学的数据挖掘系统应保证挖掘信息完整准确的同时,限制挖掘个人隐私信息的能力。匿名化是数据挖掘保护个人隐私的最主要技术。

常见的四种匿名保护模型为K-匿名隐私保护模型、L-多样性模型、(α,k)-匿名模型、t-closeness模型,其中K-匿名隐私保护模型应用广泛,针对一次性静态单敏感属性数据,K取值影响隐私保护度和数据可用性。

匿名技术主要包括泛化技术、抑制技术、扰乱技术、有损连接,以一般化、隐藏敏感属性、加入噪声值、损失连接等方式进行匿名化处理。

判断数据匿名化程度的方法有可辨别度量法、匿名表效用度量法、泛化层次度量法、分布距离度量法,通过度量隐私保护度和数据完整可用性来评价方法的有效性。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!