数据分析与知识发现

Advanced Search

基本情况

首页 > 行业动态

超越加密：在确保调查结果准确的同时兼顾保护消费者的隐私

消费者数据被地方政府、营销机构和社交媒体公司等各种组织不断收集。这些组织在收集数据时会确保匿名性和机密性，但是，现有的数据隐私法律并不能保证不会发生数据泄露事件。根据最近的一份报告，仅在2019 年就发生了2 000 多次数据泄露，其中34%是由调查的内部人员泄露的。此外，根据开放数据运动和《信息自由法》（Freedom of Information Act）的要求，部分地方政府机构需要收集并向公众公开敏感数据。

数据隐私方面的法律要求进行加密，在某些情况下，需要将原始数据转换为“受保护的数据”，然后再发布给外部各方。但是德雷塞尔大学的Matthew Schneider 博士认为这还不够。他认为：“加密能起到一定的作用，但是不能防止数据泄露。这和电子邮件密码保护类似，具有加密密钥访问权限的内部人员很容易导致数据泄露。从风险的角度来看，保守的做法是假定所有数据最终都会泄漏出去，因此，应该先进行转换，再在内部进行共享。”

近日，发表在Journal of Marketing Analytics 上的一篇论文提出一种新的方法，该方法可以永久性地改变调查数据集，能够在数据共享时保护消费者的隐私，同时数据集仍然保持的一个可接受的准确度。

文章作者认为，调查数据通常保存在组织内部，但是其用途往往超出最开始的设定：“数据库和客户信息已成为一种资产，在商业结盟时具有十分重要的价值。调查数据越来越多地用于调查对象级别的分析（Respondent-level Analytics），例如与其他专有数据集进行链接，在随后的大量数据使用中，无法确保隐私。”此外，“开放数据中也存在很多隐私风险，因为它们无法像地方政府那样花费大量预算和资源聘请统计学家、经济学家或计算机科学家解决隐私保护问题。而数据保护通常取决于数据的使用方式。”

设计一个能有效保护消费者隐私的方法时，最主要的挑战是确保调查结果的准确性。作者提出的方法是建立在基因组测序应用程序使用的一种技术之上。“我们的方法本质上是将调查数据集中的人口统计数据进行‘洗牌’。但是，与以前的方法不同的是，仅在保持对分析人员至关重要的变量之间的相关性时才对数据进行混洗。隐私保护是在消费者级别上进行的，同时保持了数据的准确性，因此其对于最终用户仍然是有价值的。”

（编译自：https://www.sciencedaily.com/releases/2020/04/200417125512.htm）

（本刊讯）

发布时间: 2020-07-07 浏览： 1366