薛孚 陈红兵:大数据隐私伦理问题探究

来源:未知 作者:未知 时间:2015-10-20
  

 
 

20世纪以来,科学技术的发展使人类社会步入信息化高速发展阶段。随着社交网络、物联网、云计算等技术的发展。在世界范围内数据呈裂变式增长,推动大数据浪潮扑面而来。大数据时代带来了巨大的商业价值,给人们生活提供便利,影响人们的生活和思维方式,引起了各界广泛关注。Nature杂志于2008年第一次推出Big Data专刊“Big Data:Science in the Petabyte Era”[1],Science杂志在2011年2月推出专刊“Dealing with Data”[2],大数据关于大数据定义、特征、用途、前景等各方面的文章层出不穷。但是,数据的公开和共享带来的隐私伦理问题的新挑战不容忽视。
探究隐私问题的意义在于隐私问题关乎人的权利问题。伦理学界从不同的角度对隐私进行了伦理辩护。一种观点认为,隐私应被看做是一种天赋的人的基本权利。它的价值是内在的、终极性的,是与人类尊严不可分割的一种条件和权利[3]16,被动地防御他人对私生活的干扰。另一种观点认为,隐私是由人的基本权利而衍生的权利,具有工具价值。“隐私权不是基本的权利,因为对于人的隐私的每一次侵犯,已经是对于某些其他权利的侵犯。”[4]199-210尽管伦理学界对隐私、隐私权的看法不能取得一致意见,但他们都认为隐私对个人的存在具有重要价值。本文试图从科技伦理视角审视大数据时代对隐私的新挑战,以期寻求合理的解决之道。
一、大数据时代隐私伦理问题的新挑战
1890年美国学者Warren和Brandeis在《隐私权》一文中将隐私界定为“不受干涉”或“免于侵害”的“独处”的权利。[5]5这一定义被理解为是传统意义上的消极隐私。[6]658依据这个意义,隐私一般指的是个人不愿他人干涉与侵入的私人领域,与人的私密方面相关。隐私具有个体自决性,即个人具有决定隐私的对象、范围等的能动性。如个人的某些信息愿意与某些人分享,但是并不愿意对社会公开。当个人不愿被其他人知道的信息泄露时,隐私就受到了干涉。
随着现代信息技术的发展,斯皮内洛指出:“信息已经成为一种商品”,个人产生的数据超出了其控制范围成为组织之间交易的商品,“这些变化可能对隐私构成了侵害”。[7]162而隐私权是人应该享有的道德权利,从作为人的权利的角度进一步探究,隐私的道德基础的一个关键问题便是控制有关自己信息的权利。[7]169此时,隐私的内涵超越了“当事人不愿他人干涉的个人私事和当事人不愿他人侵入或不便侵入的个人领域”,而扩展为个人“控制、收集和使用个人信息的权利”[8]5-12。
大数据时代,前所未有的数据挖掘、数据预测以及更全面的监控,造就了更具可能性的数据使隐私控制更困难。所以大数据时代的隐私秉承了信息时代的含义并与数据化结合,这种数据化的隐私可以被定义为主体控制、收集和使用个人数据的权利。就此而言,传统的消极隐私逐渐扩展为积极隐私。从消极隐私和积极隐私的区别来看,消极隐私关涉人的自由受到了侵害,而积极隐私涉及个人丧失自身信息(数据)的控制权。本文中的隐私包含消极隐私和积极隐私双重意蕴。大数据不同于传统隐私问题的伦理新挑战表现如下。
1.数据挖掘——被二次利用的隐私
数据挖掘指通过对数据的二次乃至多次分析发现其潜藏的价值,为组织所用。这种二次利用涉及的隐私问题,不仅仅是对传统隐私问题的放大,而且是一种颠覆。因为积极隐私中控制自身数据的能力,在数据搜集时可以通过主体的知情同意来实现。但是,在进行数据挖掘时这种知情同意很难实现,即使是在主体授权下使用个人数据的组织,有时也不能保证应用中语境的完整性,很多数据在收集的时候并无意用作其他用途,而最终却产生了很多创新的用途。[9]197所以组织无法就未来尚不明确的某种数据挖掘征得个人同意,并且二次挖掘中向上亿的数据原初产生者逐一征求同意是不具现实操作性的,组织往往自行决定是否挖掘,所以在这个过程中个人不知不觉失去了控制自身数据的权利。
数据挖掘的隐私伦理挑战表现为两种情况,一种是数据挖掘预测消费倾向,影响个体消费未来行为。例如,谷歌公司将通过搜集用户的搜索浏览购物记录,分析出用户购物趋势、度假意向等量身向其投递广告。用户数据在未授权和不知情的情况下被利用,这直接干涉用户的隐私,而且这种广告往往能够导致其最终的消费,从而影响用户自决的权利。同时这种商业行为变相使用个人信息使其产生商业价值,这种收益是否应该向用户回报呢?这是一个触及用户隐私的问题,值得进一步思考。
另一种是数据挖掘引发身份泄露。对于数据的二次开发,一些原本不危害个人隐私的数据,通过数据挖掘也可能关联出个人隐私。例如美国在线曾公布大量匿名化处理的旧搜索数据以供研究,但是《纽约时报》还是通过把关键词综合分析后,发现数据库中的某号代表的是佐治亚州利尔本的塞尔玛·阿诺德。[9]198-199可见数据挖掘能够将原本看似不涉及个人隐私的数据关联起来,暴露个人的身份信息。
进一步分析,数据挖掘使个人数据被二次乃至多次利用,而不在主体的控制之内。这种数据所有权的丧失侵犯了主体的隐私权。大数据时代,主体失去了数据的所有权,即失去了控制有关自身信息的权利,从而造成隐私伦理问题。
2.数据预测——被预测的隐私
通过大数据可以预测出个人未来的身体状况等关系到个人隐私的信息。例如,保险公司通过大数据预测个人未来的身体情况及患有重大疾病的可能来决定是否为其提供保险;银行通过大数据预测出个人未来的偿还能力,评价出其信用等级来决定是否为其提供贷款。某些组织甚至能够通过大数据预测出个人犯罪的可能。对个人未来的预测严重侵犯了现实生活中的隐私,这些被预测的隐私直接影响到个人名誉。名誉不受个人控制违背了自主原则,自主是道德义务的必要条件,在行动中以主体的自主权来实现,也就是个人具有自主权来塑造自己的生活,维护自身的名誉。如果名誉不受个人控制,人便没有被作为应该受到尊重的人来对待,这种名誉的失控昭示着自主权的淡化。
3.更全面的监控——无处躲藏的隐私
大数据时代数据即是资产,人们更热衷于数据的采集和挖掘,因此组织和个人的行为方式皆因大数据的发展而转变。组织热衷于通过终端传感器,网络浏览记录等途径公开或者秘密的采集数据,这其中必然包含个人数据。例如,个人身份数据、社交网络主动上传数据、信用卡刷卡数据、手机通讯记录、医院看病记录等。在这种全景监控下,不论是否意识到主体的隐私都被侵犯。例如,美国棱镜门事件,特工司诺登披露美国政府通过网络通信对全世界的电子邮件、网上聊天记录、电话通讯等数据实施秘密监控,危害个人隐私。从康德哲学的观点出发,当主体隐私不被尊重的时候,主体的自由就受到干涉,而人的自由意志与尊严,正是人之所以为人的基本道德权利,所以对隐私的侵犯是对人的基本道德权利的侵犯。
二、大数据时代隐私伦理问题的根源剖析
鉴于以上大数据隐私伦理问题表现,寻求问题根源尤为重要。本章将从技术性、社会性、现实性、个体性等方面层层探寻问题的根源所在。
1.技术性根源:海量数据的共享与挖掘
大数据本身就意味着共享,众多领域的数据共享是大数据时代的前提和关键特征之一,也是隐私失控的开始。从语义学的角度来看,维基百科定义:“大数据是指所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。”[10]这只说明了其数量大的特性。目前比较得到认可的是“大数据”具有4V特性,即数量大、种类多、速度快和潜藏的价值。数量大、种类多、速度快为更全面的数据搜集和共享提供了条件,个人数据也包含其中。而潜藏的价值是数据挖掘的目的所在,指原本看似不相关的数据通过挖掘可能发现被忽略的有价值的联系。潜藏的价值还在于行动预测,这是“大数据”与过去传统意义上的“数据”概念最大的不同。从以上特征不难发现,数据共享与挖掘的过程中,某些原本属于个人隐私的数据也将共享。
2.社会性后果:主体身份的数据化
主体身份的数据化是指,个人的身份乃至行动以数据的形式在数据平台呈现,导致个体在社会中表征成各种数据的集合。这种数据化是一把双刃剑,其积极的方面是,从日常生活、医疗保健等方面给人们带来便利;其消极的方面是潜伏着隐私问题的可能性,因为主体的身份信息呈现高度的公开化透明化实时化,几乎没有隐私可言。人成为数据的表征,不是主体想把自身塑造成什么样的人而是客观的数据来显示主体是什么样的人。如人们在认识某人时往往通过大数据如身体参数、健康情况、信用记录等了解他,而忽略了人性中的性格、爱好、品格等因素。这严重影响人的本质属性,丧失人的主体地位,是一种技术异化。这正是问题的原因之一,即人在利用大数据改造自然的过程中,技术过程和结果反而成为支配人、压抑人的力量。
3.现实性原因:数据共享平台中各利益相关者的利益多样性
在复杂的技术系统中,数据的共享与挖掘是造成隐私问题的直接原因,但技术离不开社会,共享与挖掘是基于社会中的各个组织与用户来实现的,这个新型系统中的各个主体才是带来隐私伦理问题的根源所在。因为在这个系统中组织与用户往往从自身的利益出发,以追求利益最大化为目标实施行动,这可能侵害到其他利益相关者的利益,其中关乎用户的利益可能涉及隐私。进一步分析,各利益相关者的利益多样性导致的伦理失衡似乎是大数据隐私问题的深层伦理根源。
用户与组织间价值优先级不同。用户的价值以个人的权利为优先级,在享受大数据带来便捷的同时要求保留隐私;而组织的价值关注搜集数据产生利益,是功利主义的,而往往忽略伦理道德诉求。所以在大数据产品的设计阶段就埋藏了隐私问题的种子。组织包括公司、政府等利益相关者。以政府为主导的设计,其价值优先级是国家和全体公民的利益;以公司为主导的设计,其价值优先级是公司商业利益。例如美国著名超市Target公司的数据挖掘项目,研发的系统可以预测顾客的购物倾向。系统预测了一位少女顾客可能怀孕,并将妊娠用品广告发送给她,她父亲看到后很生气,但该系统的预测是准确的。这样的大数据应用泄露个人隐私,是功利主义的,伦理责任与人文关怀被放在公司的利益之后,偏离了社会的道德规范。
4.个体性原因:个体隐私观与相关行为的转变
个体隐私观与相关行为的转变,是带来伦理冲击的又一原因。个体隐私观分为清晰的和模糊的两类,即一部分人具有明确的隐私观,而另一部分人的隐私观较为模糊,隐私意识尚未觉醒。同时具有清晰的隐私观的个体根据隐私观的不同又可划分为开放的隐私观与狭窄的隐私观。基于此,从如下三个方面进行分析。
(1)隐私观与行为的开放化
大数据时代,人们对于个人隐私泄露的划分与接受底线正在向前推移,个人隐私观日趋开放,隐私意识在大数据中被冲淡了。这导致个人信息是否公开,公开程度的相关伦理决策点持续向前推进,改变人们的价值观乃至法律。如CNN电台报道,八十年代美国的个人录像带租赁记录是保密的,国会颁布了一套视频隐私保护法来保护它避免被泄露。但是当脸书流行,人们呼吁在脸书上分享视频浏览信息合法,这直接促使上诉法令改变。然而人们越认同数据共享认同,组织越容易搜集数据,这更为隐私问题提供滋生的土壤。
(2)狭窄的隐私观与被动行为的矛盾
大数据的发展带来个体行为的转变,行为的转变带来观念的转变。但有时个体价值观的重新校正还未跟上行为的变化,也会造成伦理失衡。面对大数据,个体的选择权显得微不足道,某些人虽然具有明确的隐私意识,但常常默认数据被组织搜集。例如,若想使用某软件,需要同意其搜集个人相关信息的服务条款。尽管如此,个体在观念上还没有完全接受隐私数据共享及其一系列后果,这可能产生矛盾。
当然任何问题都具有两面性,价值观的转变直接影响到解决隐私伦理问题时决策的平衡,随着大数据普及,也许在今天看来的伦理问题在不久的将来将演变成全世界共识的社会契约,那么原先的伦理问题自然就不药而愈了。
(3)模糊的隐私观与行为的转变。
大数据时代已经改变了人们的行为习惯,某些个体虽然在行动上沉迷于这些转变,但是隐私观模糊。并未意识到隐私数据被共享。例如人们热衷于微信朋友圈、微博、facebook等网络平台,习惯于将一些文字、照片、视频等共享到网上,其中数据往往涉及个人隐私,如家庭住所,个人喜好等等,但使用者却丝毫没有察觉这种潜在的危机。当这些信息切实被公司搜集利用时,他们才恍然大悟,这样的意识与行为的偏差也可能带来隐私伦理问题。
三、大数据隐私问题的伦理反思与应对
既然数据的共享与挖掘不可避免,数据共享背后的问题值得我们深思:当数据涉及个人隐私的时候如何共享这些数据才是道德的?在这里可以借鉴康德对绝对命令的第二条阐释“不论对己还是对人,在采取行动的同时应当永远把人视为目的,永远不要把人仅视为手段”[11]36。简而言之,这一道德律令强调的是尊重。这可以通过提高数据用途透明度,调整个人隐私观,寻求合理的伦理决策点,搭建共同价值平台等方式来实现。
1.提高数据使用中的价值透明度
尽管对于技术是中立的还是负载价值的是学者们持续讨论的议题,技术乐观主义者和悲观主义者都有各自的观点,但笔者认为技术是负载价值的。在使用大数据技术的过程中,无论是工程设计过程还是产品的使用过程都暗含着价值,但是使用者往往不知情。消费者在进行购物行为的时候往往不会注意到其个人信息已经被搜集和利用,这就需要组织在使用不同数据过程中提高其负载价值的透明度。承认和尊重人们对未知的恐惧,明确告知用户哪些数据被搜集和使用,可能被使用的范围,数据用途的价值倾向,以及需要承担的风险,这符合与道德决策相关的自主原则、知情同意原则。康德及其他哲学家强调,人之为人的要素之一便是自决的能力。[7]52将选择权回归个人,有助于在大数据的应用中减少风险推论的冒险性。为了增加可行性和控制成本,使用涉及个人数据的具体操作中,可以以公告或邮件的形式通知个人,同时保留个人拒绝的权力至少是要求匿名的权力,并保证在使用数据时语境的完整性。
2.调整个人的隐私观
大数据时代,既然个人的隐私观是产生隐私问题的重要原因之一,那么促进社会中的主体增强隐私意识,调整隐私观念是解决问题的必由之路。增强隐私意识有助于形成适合自身的隐私观,达到隐私行为与观念的统一,减少矛盾的形成。增强隐私意识还有助于在使用大数据相关产品的同时注重隐私保护。例如有选择的使用软件;在分享文字、照片的时候尽量避免敏感的个人信息;当公司行为侵犯到个人隐私的时候具有维权意识。当然目前个人的选择权还是相对弱势的,这需要个人在大数据时代调整自己的隐私观,使观念与时代相适应,并不断寻求更能保护自身隐私的行为方式。
3.搭建共同价值平台
组织与个人具有共同的价值,有助于减少在行动中涉及隐私问题时因利益多样性而产生的矛盾。在大数据产品设计和服务过程中,将个人价值与组织价值相结合,使各方在隐私问题上达成初步共识。这要求各方在行动时聚焦如何解决问题,而不是将时间浪费在通过道德界定解决哪些问题。一方面提高组织与组织中成员的价值一致性,有助于降低成员与组织之间在隐私问题上的矛盾,提高工作效率;另一方面提高组织中管理者、工程师与用户价值的一致性,在产品设计时考虑到用户的可接受程度,生产出符合共同价值的产品,以减少涉及隐私问题时产生的矛盾。
4.寻求合理的伦理决策点
在大数据产品设计的过程中,伦理决策点尤为重要,它将影响到对数据使用的深入程度。组织和个人通过调查与协商寻找利益平衡的伦理决策点,达到观念的一致,将成为缓解这种问题的可行之路。由于作为决策主体的组织和个人往往都从自身的利益出发,很难客观地进行决策,可以引入第三方机构客观调研,共同寻找伦理决策点。第一,进行深入道德调查,通过问卷及用户同意书等方式展开伦理对话,得知其他人是怎么认为的。第二,分析调查结果,进行处理和评估,明确要设计的产品是否与已确定的价值观相符,用户可接受的范围。第三,结合双方的需求达到价值可接受。最后,告知决策结果,如何分享和使用这些数据。第三方机构进一步发展,将可能成为个人数据代理机构,即个人授权第三方机构帮助管理其个人数据。目前还没有成熟的具备这种能力的机构,往往是组织自身在充当这个角色,发展成熟的第三方机构是客观要求。
当然,解决大数据隐私伦理问题并非一朝一夕可以做到的,还需要完善的政策、法律法规、教育及其他相关方面配合,这也是有待学者们深入研究的问题。
综上所述,在大数据带来的变革中,个人和组织需要在风险和创新之间找到伦理平衡点,规避大数据隐私伦理问题,才能使大数据健康发展。尊重个体的价值,提高价值与行动的一致性,是工程师和哲学家们需要共同关注的话题。
【参考文献】
[1]Nature.Big Data[EB/OL].[2012-10-02].http://www.nature.com/news/specials/bigdata/index.html.
[2]Science.Special online collection:Dealing with data[EB/OL].[2012-10-02].http://www.sciencemag.org/site/special/.
[3][美]阿丽塔·L.艾伦,理查德·C.托克音顿.美国隐私法:学说、判例与立法[M].冯建妹,等,译.北京:中国民主法制出版社,2004:16.
[4]Volkman R.Privacy as Life,Liberty,Property[J].Ethics and Information Technology,2003(5):199-210.
[5]Warren S D,Brandeis L D.The Right to Privacy[M].Harvard Law Review,1890:5.
[6]吕耀怀.信息隐私问题的伦理考量[J].理论与探索,2006(6):658.
[7]理查德·A.斯皮内洛.世纪道德:信息技术的伦理方面[M].北京:中央编译出版社,1999.
[8]Mason R O.Four ethical issues of the information age[J].MIS Quarterly,1986,10(1):5-12.
[9]维克托·迈克尔-舍恩伯格,肯尼斯·库克耶.大数据时代[M].浙江:浙江人民出版社,2013.
[10][EB/OL].[2014-05-02].http://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B0%E6%8D%AE.
(原载《自然辩证法研究》2015年第2期)
 

 

首页 |  中心概况 |  中心通知 |  中心讯息 |  中心成果 |  飓风论坛 |  人才培养 |  学界动态 |  景德书讯 |  招生信息
您是访问本站的第 位嘉宾
版权所有:湖南师范大学道德文化研究院 电话:0731-88872593 地址:长沙市麓山路36号 邮政编码:410081