当前位置: 首页 > 数据分析师 > 数据分析师实战技能 > 数据分析师数据分析 > 大数据入侵隐私到底有多可怕

大数据入侵隐私到底有多可怕

发布时间:2020年09月29日 09:51:50 来源: 点击量:729

【摘要】大数据入侵隐私到底有多可怕隐私,现代社会的一项基本价值,正在迅速退出大数据时代人们的生活。没了隐私,如何生活?然而,日复一日,我们

大数据入侵隐私到底有多可怕

隐私,现代社会的一项基本价值,正在迅速退出大数据时代人们的生活。

没了隐私,如何生活?然而,日复一日,我们被告知:放弃一点隐私,完全值得。因为,换来的是领先国际的科学管理和高技术创新,一种市场空前繁荣、办事越来越方便的新生活!更何况,人不干坏事心不惊,干嘛害怕与大数据为伴?

如此看来,倒是那些执着于隐私意识的人心虚,不愿做贡献了。道理竟可以这样讲,人的尊严与自由得让位于所谓科学管理、创新和市场,这里面,一定有什么难言的隐情吧。

原来,新兴的电商资本有一种贪欲:依靠实时实地收集用户的隐私信息,由此全面掌握并准确预测消费者的行为,用于营销、开发各种产品。只不过,未经许可攫取用户的隐私,至少依照现行的法律是违法的。所以就需要一套冠冕堂皇的说辞,借用一些时髦的话语,然后才能否定,并最终让人们忘却隐私信息的初始产权;才能拿“洗过”的跟没“洗过”的数据,在交易所公开合法地买卖。今天,手机和电脑用户,谁没有被“瞄准式广告”(targeted advertising)跟踪追逐过?仿佛广告熟知了你从小到大的一切,包括早已遗忘的某一次浏览、点赞、选购或者退货记录。当然,如果你觉得烦人,可以点击“关闭”,把它当一只苍蝇赶开。但是,假若你以为这是电商收集隐私的主要用途,那就大大地小看了资本“创新”的能耐。

听说过“消费者剩余价值”(consumer surplus)吗?就是商品成交时,消费者能够,或潜意识中愿意支付的最高价和实际支付价之间的差额。差额越小,商家的利润就越高。例如,客人愿意花二十元买一样商品,定价十五元,便留下了五元消费者剩余价值。不用说,消费者要的恰好相反,希望物美价廉。淘宝网、双十一、饭店、超市,一切消费,都可以上演一场买卖之间的剩余价值拉锯战。常言道,知己知彼,百战不殆;信息,就是决定这拉锯战(学者称博弈)胜负的关键。消费者的支付意愿或价格承受力,依其生活需求、财力、心情、环境等各样因素,可有很大的差异和波动。弄清楚这些因素同商品定价、市场营销策略等的复杂关系,就能获取消费者剩余价值。基于这一认识形成的理论和实践,即以价格歧视(price discrimination)为导向的动态定价系统。其基本策略,便是同一商品以随时变动的不同价格出售给不同的买家;其着眼点不在商品的质量或成本,而是随时发现并引导、控制每一个消费者的需求和支付意愿。

价格歧视大致有三个类别。大数据之前,因为没有工具来大规模获取个人消费行为的真实数据,商家只能通过划分消费者群体,对特定群体的一般或平均需求和支付意愿做一估计,据此实施第二级和第三级价格歧视。前者即按数量定价,类似于近年流行的团购:购买量越大,单位价越低。后者则是分群体定价,例如,公园门票分外地游客和本地居民两个价。这种简单的价格歧视随处可见,但“吸金能力”有限,因为定价基于大略估算的某个平均值,而非每个消费者不断变化着的需求和支付意愿所包含的剩余价值。后者才是商家真正心仪的东西:第一级价格歧视。

大数据让电商看到了曙光。大数据追踪、记录信息,描写并预测行为模式的能力,正是第一级价格歧视所必需的。大数据来到我们中间收集隐私,无声无息成就的便是这个。没错,人们照常用电脑、玩手机、交朋友、过日子,隐私却高速海量地流入了电商的数据库,无限期地保存起来,不管是收入、职业、行踪、心理、人际关系,还是消费需求、偏好、支付能力和意愿,没一件落下。接着,商家用算法处理数据,剖析用户隐私,发现他的行为模式,预测他的购买意向、每一次欲望和感情的波动。商家变得比消费者自己还要了解消费者。然后,就可以把数据分析的结果付诸使用了,如瞄准式广告的推送。而消费者对广告的每一次反应,都生成对特定商品的行为数据,这些都是大数据的素材,用以激活智能算法自我学习、自我调节的功能。这样循环往复,不断完善,大数据做出的预测就越来越精确;第一级价格歧视的条件也就成熟了!研究表明,由瞄准式广告推出的商品,其平均价格一般比传统广告要高(艾斯特夫)。更让商家激动的是,用互联网浏览行为数据甄别人群,实施第一级定价歧视,非常有效,被瞄准的消费者(如周二周四白天上网,并浏览wiki)可接受高出他人一倍的定价,而商家获利高达全部消费者剩余价值的百分之四十二(西勒)。

说到利润,商家的喜往往是消费者的忧,没法双赢。我们来看一个实例。“按使用保险”(UBI)是一款大数据汽车保险,正迅速占领多国市场。它被保险商吹得神乎其神,既能大大降低险费,又能有的放矢地改善参保人的驾驶习惯,使道路更加安全。UBI不同于传统车险的一个特点是,第一次把个人驾驶行为的“真实因果数据”(true causal data)引入了风险评估模型,据此量身定价,设置参保人的险费和保单理赔。它是这样操作的:在车上安装实时探测(telematics)装置,联网追踪驾驶行为、车况、路况和周边环境,上传至保险商的数据库。该装置的数据采集功能极强,除了时间、地点、公里数,连急刹车的次数和用力强度,急转弯的次数和弧度,是否听收音机、音量强度,是否接打电话、声调情绪如何,都一一记录。当然,常规的类聚群体变量,风险评估模型也照旧使用,如年龄、性别、婚姻状态、居住地、职业、受教育程度、健康状况、信用得分等;再加上环境变量,如区域天气、治安、路段事故发生频率等。如此,UBI的风险评估模型所用的变量参数,从传统的数十个、上百个,一下飙升到一百多万个!有了这样精密的大数据分析,保险商就可以识别并预测各种差异细微的风险。风险评估不再是类型化的平均值估算,而是十分接近参保人的真实风险,使得第一级定价歧视能够实施了。统计表明,UBI在美国上市不久,个人风险评估预测的准确度,较大数据之前提高了三倍。可以预见,随着个人驾驶行为数据的迅速积累、智能算法的自学和调节,风险评估型将进一步趋于“真实因果”,从而大大降低保险商的理赔风险,其利润的增长也可想而知了。

那么,参保人在失去隐私,被一刻不停地追踪记录之后,能得到什么好处呢?

这个问题的答案因人而异。如果参保人被评估为低风险,他的险费很可能会下降。但只要上路,就会有风险,而UBI保险商掌握了参保人的所有风险信息,包括隐私,很容易在保单上做文章,瞄准风险设定条款,将随机风险和遗留风险尽可能多地放到参保人身上,压缩参保人的实际受保护(即理赔)范围。

但如果参保人被锁定为高风险,情形就更不妙了。既然有“真实因果数据”的记录和预测,保险商就有充分理由将他的险费和保单设定在与风险相匹配的水平上。结果险费上涨,直逼事故发生后损害赔偿的实际费用;或者,罗列排除条款,严格限制理赔条件和范围。这样,车险在事实上失去了风险集体分担的基本功能,成了损害赔偿专项费用的事先存放。可以想象,因为难以承受大幅上涨的险费和苛刻的保单条款,多数高风险驾驶人将不得不离开车险市场。

也许有人会说,即便如此,大数据保险对消费者整体和全社会仍有好处。因为知道了哪些人有高风险及不安全行为的细节,保险商就能有的放矢地提出建议,敦促他们改正。这样,总体风险就会下降,道路也就更安全了。这的确是美好的憧憬。不幸的是,保险商恐怕不会对此感兴趣。帮助高风险人士改正驾驶习惯,成本太高了,保险商还得披露自己的风险评估模型和操作细节,承担遭调查和打官司的风险。何况另有一种简单、诱人的市场策略可供选择:以第一级价格歧视,用高额险费和排除条款将高风险人士驱逐出本公司的服务范围。保险商从来就不欢迎高风险人士,总是想方设法甄别他们、剔除他们。只是过去不容易办到。现在,有了大数据技术,瞄准了歧视就只是举手之劳。而高风险人士一旦受市场排斥,无力购买保险,不能合法驾驶,生活、工作都大受影响,反弹是必然的。他们很可能豁出去,非法上路。据统计,2010年美国有百分之十二点六的驾驶人没有车险,给道路安全和社会秩序带来极大的隐患。

所以,UBI在实际运作中,并没有兑现保险商宣传允诺的众多好处,无论对参保人,还是对社会大众。难怪,美国州保险专员联席会议的2015年UBI研究报告直言不讳:从消费者和公共政策角度看,UBI 走的是一条歧路,是市场的失败。报告提醒我们,大数据是工具,效用取决于掌控者。我们不能只期待大数据的好处,而忘记了掌控它的电商同消费者和公众的利益有冲突。资本的本性是追逐利润,我们的隐私就成了他们榨取利润的利器,而经常损害我们的利益,综合表现在以下各个方面。

首先,随着用户隐私流入商品交易平台,大数据急剧扩大了市场信息的不对称。网络时代,日常消费不再是简单的货币商品交换;买方不仅要支付货币,还得交出隐私,才能成交,无论自愿与否。结果,电商可以实时追踪用户行为,攫取隐私,对消费者了如指掌。而后者面对铺天盖地的瞄准式广告,接受的只是为他定制的诱惑性信息。同时,他又被眼花缭乱的“创新”手段挟持,不得不配合商家的追踪,否则,就会遭到互联网屏蔽,被市场抛弃,而难以正常生活。更有甚者,用户还无法得知自己的哪些隐私被交易平台掌握,被谁利用,会有什么结果。常有媒体专家提醒消费者:多加小心,谨防网上暴露身份隐私,必要时,可以考虑匿名、用不同的方式上网、做假动作迷惑数据收集者。但是,大数据的追踪哪里是躲避得了的?在这虚拟同真实高度重合的时代,要在网上装扮一个人,你就得在生活中变成那人,告别自己。或者,你希望让网络世界“忘却”自己,但那是要有足够的财力和权位才能做到的。“被忘却”的权利,现在是奢侈品里的奢侈品,普通人哪敢奢望。于是,市场对大多数人越来越神秘,第一次,真的变成了一只“看不见的手”;对少数人,却是用隐私大数据编织的一张大网,捕捉的不是别的,就是消费者剩余价值。

其次,大数据的红利分配是弱肉强食的。照理说,用户交出了隐私(往往是被迫或不知情),电商才有了大数据的“食粮”和巨大收益。可是用户得到的是什么?是无数商业兼公关广告加上专家学者的鼓吹与不断重复的一个许诺:隐私数据换来“高大上”的商品和服务,投入市场造福于消费者。然而,这诺言在法律看来,并没有约束力。因此,许诺者不必受任何监督,也不用承担任何义务。即使利用隐私信息,开发新产品、新服务,赢了红利,也不会与消费者分享。甚至,可以拿用户隐私做损害用户利益的事,也无须承担法律后果。例如,商家在大数据交易中买卖隐私数据,挣了大钱,但拥有数据初始产权的消费者却一无所得(详见拙文《大数据卖的就是隐私》,《上海书评》2015年7月19日)。又如,电商盘剥消费者剩余价值,消费者在法律上没有任何救济手段,大数据的控制者成了红利的绝对占有者。而可怜的消费者就必须承受双重的侵害:交出隐私不算,钱袋还被掏空。

第三,生活必需品因为消费多,特别容易受到大数据市场营销策略的攻击,是消费者的软肋。大数据推动新的市场伦理规范,要求大家接受第一级价格歧视演绎的原则和实践,视商家利润最大化为理所当然。生活必需品就难逃厄运了。消费者个体的生活必需品需求弹性小,支付意愿刚性,大数据算法可以便利准确地用隐私数据分析预测出来,恰好是第一级价格歧视的理想靶子。这不是预言,而是现实,如Airbnb租房定价算法。医疗保险业更是首当其冲,药品价格乱象丛生。据报道,某抑制癌症呕吐的药,在美国,用保险购买三十天剂量是九百美元,而不用保险,仅需四十五美元。能这样定价,就是大数据的功劳:医药资本吃透了医保系统的“消费”意愿和支付能力,是针对新出炉的奥巴马全民医保进行利润最大化的做法。当医药业、保险业同大数据联手,利用DNA等高度隐私的信息,又能轻而易举地锁定有潜在高风险的患者,或以价格歧视等手段将他们逐出市场,或疯狂提价,榨取患者(消费者)的剩余价值。这噩梦般的医保失控的前景,在引领大数据技术的美国已经浮现;在我国,医改屡屡屈服于商业逻辑,更有青出于蓝之势。也许,天真的人们还在寄希望于市场竞争与那只“看不见的手”自动调节。但是,这念想被大数据斩断了。

这是因为,第四,隐私信息的滥用,提高了市场准入门槛,会促成垄断。自从有了大数据,囤积消费者隐私和高端算法处理已经成为许多企业参与市场竞争的前提条件。一切产品设计、定价营销都要依靠“真实因果”或实时追踪的消费者行为数据的优化。投资者也期待企业拥有这些条件。而有效的数据和算法,只有通过长时间、大规模的营运才能获得。后来者很难加入竞争,弱小的竞争者也很容易被击垮或吞并。例如车险,先行的大保险商已经甄别、留住了低风险、高利润的客户;剩下的在市场上寻找车险的,多数是高风险驾驶人,基本上没有利润潜力,甚至是赔本的买卖。UBI的迅速发展就是这市场垄断趋势的一个注脚。消费者交出了隐私,得到的却是永远瞄准着自己的商品定价。而公众的消费被大数据定价和营销手段割裂,碎片化的个体消费者的市场谈判力极低。所以才有这样恶劣的涨价:今年美国Turing制药公司给艾滋病非专利药Daraprim重新定价,猛涨五十五倍,从十三点五美元升至七百五十美元一片。它钻的是该药毒性大、处方需严格控制的空子,通过大数据限制配药,使潜在竞争者拿不到该药来测定成分和药性。而新药研发必须向联邦药品管理局(FDA)证明新药的同等药性,否则不会获批。就这样,消灭了竞争而形成垄断。对失去了隐私的患者,疯狂提价就成了宿命。尽管Turing公司后来迫于舆论压力,答应降低涨幅,但它居然能够宣布涨价五十五倍,而公众没有任何法律手段来抵制,不能不说是社会的悲哀。

第五,大数据之下,个人隐私及信用评估被少数公司垄断,公众所能选择、获得的服务就受到越来越多的限制。《金融时报》称,今年初,央行已授权八家机构试行信用评估系统,目标是到2020年建成覆盖全国的评估系统。问题是,这些巨无霸信用系统,拿什么做标准,用哪些数据,如何评分、使用,谁来评分、使用,公众即隐私交出方是完全蒙在鼓里的。一切由掌控隐私、生产大数据的电商说了算,毫无透明度。例如据报道,某智能手机厂商旗下的金融服务机构正在试验一个信用评估系统,其评估数据包括用户的财务记录、网购产品和使用该厂品牌手机的频率等。这样的信用评估,不是在鼓励或变相强迫消费者使用特定产品,是在干什么?还一举两得,排斥了竞争。

入侵隐私,是大数据的“基因”性格。我们需要大数据,但只要使用它,这性格就会发作。如果不加以节制,受侵害的就是广大消费者,遭破坏的则是平等、公正、互相关爱的社会基本准则。怎么办?对这类搅局型新技术,我们的唯一对策,大约就是严格的、民主的监督了,就像对核能和一些化工产品的安全监督。大数据不应例外。但大数据很特殊,看似无邪无害,不仅有用,还很神奇。它入侵隐私是无声息的、非暴力的;它还用海量的数据为自己营造了貌似客观、科学、公平的形象。它目标性强,在损害他人利益的同时,为掌控者谋取暴利,因而受到强势资本集团的推崇和保护。因此,我们真正要应对的不是大数据技术,而是躲在幕后的掌控者。这就需要公开辩论,加强民主监督,并立法规定数据的财产性质,即确认用户享有隐私数据的初始财产权。这应该是必须跨出的第一步。因为进入大数据时代,民主参与和知情权、财产权一样,不应是少数人的奢侈品或可有可无的消费选择,而是老百姓日常生活的必需品;是我们保护隐私、不让钱袋子被人掏空的唯一可行的一条新路。这条路能不能走通,则要看民众的觉醒、民众的发声了。

分享到: 编辑:wangmin

就业培训申请领取
您的姓名
您的电话
意向课程
点击领取

环球青藤

官方QQ

扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群

绑定手机号

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

环球青藤移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载
环球青藤官方微信服务平台

刷题看课 APP下载

免费直播 一键购课

代报名等人工服务

课程咨询 学员服务 公众号

扫描关注微信公众号

APP

扫描下载APP

返回顶部