隐私计算的产品观、时空观与价值观
导语:在各行各业都在谈数字化转型的当下,隐私计算从技术角度出发为跨机构之间的数据安全计算提供了可行的解决方案。基于隐私计算可以取得“数据孤岛互联”、“数据隐私保护”和“业务发展”三者间的平衡和共同发展。隐私计算能够激活数据生产要素的合规流动与价值共享,其意义是非同寻常的。
隐私计算即 Privacy-PreservingComputation,也称隐私保护计算,是在保护数据隐私的前提下,实现数据流通和价值挖掘的技术体系。
隐私计算是近几年新兴的事物,如何全面的理解隐私计算呢?笔者试图从产品角度、时空角度和价值角度进行解读,权且称之为:隐私计算的产品观、时空观和价值观。
01 隐私计算的产品观
如何从产品角度来认识隐私计算呢?
从产品定位来说,隐私计算本质上是一种工具型产品,是一种增强型的技术服务。
作为一种跨域数据融合与安全计算的工具,隐私计算承担了“架桥修路”的责任,为数据“流动”架起了桥梁和管道。相信在不远的将来,隐私计算将成为大数据与人工智能等领域不可或缺的基础设施。
从目标用户的角度来看,隐私计算适是为行业客户服务的。这些行业客户一般来说都是离数据比较近、对外部数据引入的需求较旺盛,同时这些客户有大致分类两类,一类是用隐私计算的方式来做基础的查询和分析的,另外一类就是做联合建模用的。
隐私计算解决了客户的什么问题呢?这个需要从数据源和业务需求方两个方面来说。从数据源的角度来说,不脱敏的数据一般都不敢往外放,但是数据脱敏后的价值又会大打折扣,导致无人问津,所以数据源希望自己的数据能安安全全的卖个好价钱,而且每一次卖出后都不会带来乱七八糟的“后遗症”。
从业务需求方来说,当然希望能借助外部的数据来解决自身业务上的一些问题,比如提升营销的精准度或者降低赔付率等,这些指标可都是真金白银,1%的增加或降低都可能带来很高的营收变化。
随着数据监管政策的严厉化和严格化,数据源在没有拿到用户授权的情况下是不敢将涉及用户隐私的数据对外输出的,同样业务需求方对于来路不正的数据也不敢轻易采购。所以,安全的买卖数据或者基于数据的价值与结果是数据源和数据需求方的共同诉求。
将隐私计算做成产品时,隐私计算产品应该如何设计呢?
因为隐私计算涉及到加密算法、通信协议等,有较高的技术门槛,学习和解释成本较高,从普适性和实用性角度来说,隐私计算产品在设计时应该将复杂隐藏起来,而最终提供给用户的是简单易用,即所谓“复杂其内,简单其外”。
所以,通过无代码或低代码的方式、可视化操作界面来突出易用性是对隐私计算产品的基本要求。
隐私计算产品的应用场景有哪些呢?
通常有三类:
- 第一是联合查询,即进行多方数据隐私求交与融合,对共有样本补充标签;
- 第二类是联合计算,即多方隐私数据进行联合计算,共同得到结算结果、做统计分析,支持加减乘除运算、支持统计运算和比较运算;
- 第三类就是联合建模,即在多方数据都不出域的前提下,联合进行机器学习和模型训练,这就是通常所说的联邦学习。不论是横向联邦、纵向联邦还是混合联邦,最终都是要做到“数据可用不可见、数据不动模型动”。
再来说说隐私计算的产品形态。目前,市面上比较多的是卖软件产品,1个节点包含哪些功能,每账户1年1个license需要付多少钱,这种情况下通常会把联合查询、联合计算和联合建模的功能都放进去,适合于卖给对隐私计算有高频、刚需的头部客户。
比如:持牌金融机构、电信运营商等,因为他们数据需求量大或者数据调用频繁,面临数据合规的严监管;隐私计算的另一种产品形态就是SaaS服务,适用于单次数据调用量少、数据调用频次低的尾部客户,有这类需求的小微企业客户数量还是比较巨大的。
面向尾部客户的计费策略就比较灵活,可以按天、按周、按月等方式来收费。
02 隐私计算的时空观
首先亮出自己的观点,之所以要从时空的角度来理解隐私计算,是为了证明隐私计算的应运而生是有其客观规律的。
第一是全球性的个人隐私保护已成为趋势,隐私计算的全球化已显露端倪。通用数据保护条例(GDPR)于2018年5月生效,是欧盟对有关个人数据保护治理的更严格监管要求的回应。
不遵守GDPR的行为将导致严重的财务后果,最高可处以全球总年营业额的4%或2000万欧元的罚款,以较高者为准。
GDPR在许多方面影响了这些新的法律框架和司法管辖区。例如,瑞士和阿根廷正在修订其本地数据保护法律,以实施与GDPR紧密匹配的规则。
将本地隐私法律与GDPR匹配的根本原因是需要促进对本地企业的这两项法规的遵守,并允许这些国家与欧盟之间的数据自由流通。我们还发现,寻求欧盟做出新的适当性决定的司法管辖区有所增加。
例如,欧盟和日本(这两个地区的隐私保护方法截然不同)之间的协议允许个人数据在强大的保护保障基础上在两个经济体之间自由流动。
正在实施新数据和隐私保护要求的其他区域包括:澳大利亚的《隐私修正案法》(应报告的数据泄露),印度的《个人资料保护条例草案》等等。总之,收紧个人数据、加强个人隐私保护是一种全球化的趋势。
其次,国内隐私计算已出现南北之争的态势。南有微众银行的杨强教授,北有姚期智院士,两位是隐私计算领域的领军人物。
微众银行代表隐私计算的开源阵营FATE,华控清交代表着多方安全计算的MPC阵营。1982年在姚期智教授在《安全计算协议》(Protocols for SecureComputation)里发表一篇文章里提出“百万富翁设想”,并发布了一个名为“多方安全计算”(SecureMulti-Party Computation,简称MPC)的理论框架。
而杨强教授则是FATE的代言人,杨强教授是微众银行首席人工智能官,国际人工智能学会理事长,香港科技大学教授,他是联邦学习领域的国际领军人物。其实,联邦学习最早是有谷歌在2016年提出来的,后有杨强教授在中国发扬光大了。
不管是多方安全计算还是联邦学习,最终都是为了实现跨机构之间的数据安全融合。所以,从全球化到本地化,从南方深圳到首都北京,从多方安全计算到FATE,隐私计算的不同技术流派都能解决同样的问题。
第三,从时间维度来看,隐私计算将推动大数据与人工智能行业进入新一轮周期。权威机构Gartner在2019年技术成熟度曲线报告中首次将隐私计算(其称为机密计算)列为处于启动期的关键技术。世界经济论坛2019年9月发布的白皮书认为,隐私计算技术将成为释放金融服务行业新价值的关键技术。
我国的隐私计算技术产业化也在近年来快速启动。蚂蚁金服、腾讯云、百度在2019年纷纷推出了各自的MPC产品。
在大数据行业经历过18-19年的低潮后,隐私计算为大数据行业带来了新的希望,在隐私计算的推动下,新兴的拥有隐私计算技术与能力的数据科技公司将脱颖而出,收复曾经失去的大数据市场,带动大数据与人工智能行业进入下一轮增长的周期。
隐私计算在时间维度的另外一种理解就是,通过对数据以在线的方式进行安全计算、及时性计算,能及时应对市场的讯息万变,用数据来输出即时反应,为市场竞争赢得时间。
第四,数据的时空特性决定了隐私计算的时空属性。数据作为新的生产要素,其时空特性为其赋予了流动性和外部性。数据跨越时间、跨越空间界限才能真正诠释数据全球共享与连接的理念。隐私计算正是推动数据跨越时间和空间的有力武器。
通过隐私计算的技术,可以使得数据跨地域、跨行业、跨机构之间实现长期的、可持续性的安全融合计算。数据在时空隧道中川流不息,密文计算在虚拟世界中持续进行,现实世界与网络世界相伴相生、携手前行。
隐私计算与隐私泄露相生相克,密文计算与明文计算相向而行,时间的积累产生了空间,数据、算法与算力共同生产出价值,隐私计算为增强数据在时间和空间上的流动性而生。
03 隐私计算的价值观
隐私计算的最大价值是什么?是来自于隐私的价值、计算的价值,还是隐私计算的技术的价值?好像是,又好像都不是。以下从市场价值、应用价值等角度阐释下隐私计算的价值。
先看看隐私计算的市场价值。根据情报和市场研究平台MarketsandMarkets最新报告中指出,2019年全球数字身份解决方案市场规模达到137亿美元,2024年,该市场预计将增长至305亿美元,2019-2024年预测期内的年复合增长率(CAGR)为17.3%。
再看看隐私计算的应用价值。目前多方安全计算在金融行业的主要应用场景包括普惠金融、智能风控、智能营销、合规反洗钱和资产管理等。
比如在普惠金融方向,基于多方安全计算平台与政务数据融合,横向打通的数据包括税务、交通出行数据、水电燃气数据、公安数据、征信数据等,可以赋能普惠小微金融。
笔者认为,隐私计算的最大价值在于让数据连接更易实现。
做隐私计算就是要做跨机构之间的数据应用场景的撮合,隐私计算是润滑剂、加速器,能让跨机构的数据融合更易达成,隐私计算技术服务商唯一要做好的一个定位就是连接器,要成为对参与数据融合的所有机构都有好价值的桥梁和纽带。
基于隐私计算技术,实现了数据所有权与使用权分离。数据的所有权不转移(敏感信息仍需用户授权),而使用权做大了细分可控(对数据的采集、存储、使用、转让、共享及公开披露区分管理)。
隐私计算驱动了数据价值的输出,实现了数据可用不可见、数据不动模型动,不交易数据本身,只交易数据的计算结果。
因此,隐私计算对数据源的价值在于:可以合规的输出更多维度、更多类型的数据价值;隐私计算对数据需求方的价值在于:可以合规的获得更多想要的数据价值。
让数据价值更易获得!所以,隐私计算其实是数据连接的新进化,是一种新的数据连接形式,是打破数据壁垒的一种技术化的变通方式。
总而言之,不论从产品角度还是价值角度来看隐私计算,隐私计算都是一件了不起的事情。可以说,隐私计算是具有划时代意义的,有了隐私计算这个强大的工具,以前做不了的事情现在都有很大可能性可以重新做起来、而且有可能做成!
也就说是大数据时代时代做不了的事情,到了隐私计算时代是很有可能可以做到的!再回头看看,大数据时代所经历过的种种震荡,不禁觉得豁然开朗。隐私计算将把能大数据平台、数据中台、人工智能、边缘计算、物联网等带入到一个崭新的高度!
#专栏作家#
黄小刚,微信公众号:大数据产品设计与运营,人人都是产品经理专栏作家。拥有超过10年的BI应用咨询与解决方案实战经验、5年大数据产品设计与管理经验。一个非主流的大数据应用专家,一个非著名的数据产品经理。
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
- 目前还没评论,等你发挥!