首页 理论教育 如何处理数据挖掘过程中个人隐私保护的问题

如何处理数据挖掘过程中个人隐私保护的问题

时间:2022-04-23 理论教育 版权反馈
【摘要】:三、如何处理数据挖掘过程中个人隐私保护的问题媒介社区是按照商业模式运行的,媒介社区要追求经济效益的最大化,而在追求经济效益的过程中,极容易出现一些危害成员的行为。数据挖掘势必会涉及成员隐私问题。事实上,隐私权、肖像权和名誉权同属于人身权中不同性质的权利。

三、如何处理数据挖掘过程中个人隐私保护的问题

媒介社区是按照商业模式运行的,媒介社区要追求经济效益的最大化,而在追求经济效益的过程中,极容易出现一些危害成员的行为。数据库是媒介社区的核心资源,为建立数据库而进行的数据挖掘在媒介社区中具有重要的作用,但在进行数据挖掘的时候,尊重和保护个人隐私是一个商业伦理问题。

数据挖掘势必会涉及成员隐私问题。早在1998年,安·卡沃凯恩(Ann Cavoukian)就发表了一篇题为《数据挖掘:以破坏隐私为代价》的报告,引起了很大的轰动。该报告剖析了数据挖掘与隐私之间的关系,指出数据挖掘可能是个人隐私提倡者未来10年所要面对的“最根本的挑战”。

案例1

2006年,分众集团收购的凯威点告公司(现名分众无线)主要从事手机WAP网站广告、短信彩信广告、无线IM及各种创新的无线互动营销业务。据2008年央视“3·15晚会”报道称,分众传媒全资子公司———分众无线掌握了中国5亿手机用户中约一半用户的信息,并拥有小区业主、工商企业主、车主、手机大客户、公务员、保险以及银行贵宾、房地产投资者等九大业务,掌握手机用户的职业、住址、收入甚至消费取向。同时,分众无线已将国内主要短信群发公司收编旗下。完成资源整合以后,获取了更多信息。央视报道称,这些信息由分众花钱从各种渠道获得,随后对手机号码进行归类和细分,分众无线或是垃圾短信的最大制造源。遭央视“3·15晚会”曝光后,2008年4月1日起,分众无线被迫剥离短信业务。

案例2

试用网(www.itry.cn)成立于2006年1月,是中国首家体验营销门户网站。上线仅68天就得到美国著名风险投资公司IDG的投资,2006年底又经国内著名移动商务服务商亿美软通公司的再次注资扩大发展。试用网在为消费者提供产品试用、评论分享、折扣优惠等体验应用的同时,实现了为商家提供品牌推广、获取销售线索、进行市场调研、建立用户俱乐部等全方位的营销推广服务。独具特色的营销模式使它在短短的一年里就迅速积累了300多万名忠实会员,且正以每日5 000个新增会员的速度增长,其中80%的会员为活跃用户,即80%的试客每月都会参与各种试用活动。这些试客大多是20—35岁之间、月入3 000元以上的高学历人士,女性居多(出自该网站统计数据)。试用产品涵盖各行各业,包括彩妆、护肤、个人护理、香水、饰品、个性生活、食品、饮品、保健产品、报刊书籍、影视音乐、电影、摄影、折扣券、网络、游戏、数码、美容、美体、美发等等领域。除了产品试用活动外,试用网还为试客提供了各种交流互动平台,包括体验评论区和试客论坛。试用网规定会员在网上填写个人资料时需将自己的详细资料包括身份证号码如实填报。随着试用网的发展,不断有用户质疑个人资料填报后如何保证其数据安全的问题。在舆论压力下,2009年3月2日,试用网发布公告,向因为个人资料安全问题造成不便的试客表示歉意,并决定从即日起用户只需提供姓名、手机、电话、通讯地址等个人信息,不再要求填写身份证号码,同时还制定了紧急方案,对已经提交试用申请的用户身份证资料进行加密保护。

从上面这两个案例可以看出,个人隐私保护已经不再仅仅是数据挖掘中的伦理问题。对于媒介社区而言,我们要找到的仅仅是“老李们的需求”而不是“老李的写真”,具体的个人信息对于媒介社区意义并不大,媒介社区要挖掘的是某一类人群的需求。法律保护、技术创新和行业自律是媒介社区中个人加强隐私保护的三个手段。

(一)法律保护

公民的个人信息是指一切属于自然人的消息与情况内容,如身高、爱好、身体状况、收入、财产等。隐私权概念起源于美国。美国国会1974年的《个人隐私法》规定,信息关系人对个人信息传播享有控制权,公民个人有权决定在何种程度上公开自己的个人信息,未经许可的披露、公开、使用都构成对公民隐私权的侵犯。隐私权制度是人类文明发展到特定阶段的产物。公民信息隐私权是自然人享有的对个人的、与公共利益无关的个人信息,是对私人活动和私有领域进行支配的一种人格权,其本质是与公共利益、群体利益无关的个人“私事”,其范围限定在个人信息、私人活动的私有领域范围。公民享有个人信息不被窥视、侵入、干扰、非法收集和利用的权利。

英国1984年的《数据保护法》第5条规定:只有经过登记并被批准为数据使用人之后,该人才有权力使用个人数据。虽然这部法律颁发的时候还没出现数据挖掘这一事物,但却为后来数据挖掘中的隐私权保护提供了法律依据。

我国在上世纪70年代末80年代初,才开始逐步将隐私权和与之相关的一系列权利列入我国的宪法和其他法律。但值得注意的一点是,我国对于隐私权的立法,至今尚没有相应的直接规定;对隐私权的保护,还只是散见于一些法律、法规、规章中。民法作为我国现行最基本的保护公民各项人身权利的法律,也没有将隐私权作为公民的一项独立的人格权加以保护,而只是简单地规定了与公民的隐私权有关的肖像权、名誉权。事实上,隐私权、肖像权和名誉权同属于人身权中不同性质的权利。由此产生的结果是法律保护隐私权的实际效力减少,隐私权寻求法律保障的实际可诉性、可操作性降低,不利于受害者寻求法律救助。

因此,我国还需要在民法典中明确隐私权保护的法律地位,制定相关的隐私权保护法,在制定法律的过程中还应强调增强常规法规的技术性,即与高科技的网络技术相接轨。

(二)技术保护

技术保护就是从技术实现方式上通过改进挖掘算法、关联规则等方面来优化数据库。为了保护顾客的隐私,R.Agrawal等人早在2000年就提出了隐私保护数据挖掘的新算法,Chris、Clifton等人也合作研究了分布式数据挖掘来保护信息用户的隐私权。

如果从保护个人数据安全的角度来看,目前已有很多成熟的相关技术。如果从技术上保护个人数据,将会增加挖掘者收集数据的难度,不利于数据挖掘的发展,这就需要研发可以保持隐私的挖掘算法和挖掘方法。以下的分析让我们看到了更多的希望:“自《全球技术革命》于2001年发布以来,保护隐私的研究取得了新的进展,并提升了研究兴趣。因此,有理由对2020年的隐私保护状况持乐观态度。由计算机科学家、工程人员及社会科学家等组成的跨学科团体,正在研发能够提供新技术和算法以保护消费者隐私的工具。”[14]

(三)行业自律

很多国家从行业自律的角度去尊重客户隐私,保证个人隐私安全。出于对信息产业发展的保护,各国都采取了慎重的隐私保护政策,除去美国立法外,大都采取业界自律的方式,如TRUSTe隐私认证、BBBOn Line隐私认证等。我国的网络服务业尚未形成统一的自律性质的行会协会,竞争还处在无序状态。企业为了能在竞争中取得优势地位,往往采取恶意侵权的方式,很多网站过度收集个人资料,在不必要的情况下要求收集个人的身份证号码、地址等信息;有的网站没有像之前承诺的那样采取保密措施保护个人隐私,致使用户身份被盗,遭遇信用卡诈骗问题;有的网站对收集的个人信息进行技术分析,挖掘出一些个人未透露的信息,从中获得有商业价值的信息并用于生产经营;有的是多家网络公司对登记资料实行共享,甚至转卖个人资料;有的网站还通过制订专门的隐私权条款,或以某些条款单方面免除自己侵犯他人隐私权时所应承担的法律责任,或以格式条款的形式强制个人授权其对信息进行收集、使用,以免除自己侵犯个人隐私权时所应承担的法律责任。

2000年5月,Amazon,e‐Bay,AOL,Lycos等联名向400多家同行发出倡议,强调要以行业自律的方式尊重客户的隐私权,要让客户清楚地知道其个人数据究竟是何时及如何被使用的。

以上三个方面,无论从哪个角度来看都是对隐私进行的被动保护。媒介社区中的数据挖掘与一般的商业行为中的数据挖掘不同,媒介社区中的数据挖掘不需要具体到某一个成员的信息,媒介社区中的数据挖掘是针对某一类人群的数据进行挖掘,只需针对某一类人群的共性需求进行挖掘即可。

案例[15]

数字营销面对的最急迫的问题就是与身份及隐私相关的问题。不知不觉中,网络上已经出现了在过去还很陌生的窃取身份问题。“窃取身份”这个名词是在20世纪80年代后期出现的,到2006年为止,单单在美国就已经造成了500多亿美元的损失。

保护隐私是目前令人关注的议题。在2006年的美国在线数据外泄事件后,人们开始警觉到底可以从网络中取得多少个人数据。2006年8月4日,美国在线公布了65万名客户在3个月中被搜索的记录(事实上谷歌只是美国在线搜索服务的提供者),这在当时看来似乎只是提供实际数据作为学术之用,而记录上也仅仅显示了身份证号码。但8月7日,美国在线发现了错误而将数据自网络上移除。不幸的是,在那三天之中,这批数据就被复制散播到了世界各地,直到现在还可在网络上找到相关数据。8月9日,《纽约时报》的记者们仅仅循着那批搜索记录所提供的数据,就成功地辨识出编号4417749的客户,还在她家里访问了她!编号17556639的客户是另一个被众多网友关注的目标,因为他想杀他的太太。

同年8月14日,一个非营利的消费者隐私保护团体———The Electronic Frontier Foundation———向美国联邦贸易委员会(FTC)提起了对美国在线的诉讼并请求调查,因为美国在线违反了自己的客户数据保护条款和联邦贸易委员会条款。

据报道,美国在线的首席技术官于8月22日请辞,两名员工被解雇。9月3日,美国在线用户对美国在线提出诉讼并准备采取集体诉讼。

在事件发生18个月后,谷歌同意在搜索记录中隐匿个人数据,但谷歌并购Double Click的举动引起了人们对个人隐私的更多疑虑,因为Double Click拥有大量由植入客户端的cookies来追踪用户浏览而取得的记录,谷歌可以轻松地将这些浏览记录和搜索记录及电子邮件相连,但谷歌宣称只使用非个人数据来提升广告的精准度。

在网络有能力提供客制化服务之前,数字营销人需要先详细了解消费者。数字营销人员和消费者之间对客制化所带来的好处以及为此而需付出的隐私代价必须有所取舍,这将是本世纪不可避免的主要营销问题。只有消费者愿意透露他们的个人偏好,数字营销策划人员才有可能提供个人化的服务。信赖是数字营销策划关系成功的关键,而传统营销在建立顾客信赖方面迄今仍做得不够好。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈