打破数据壁垒,隐私计算站上风口

南方产业智库
+ 订阅

“数据新价值”深调研特别报道③

3个互不相识的人,在不知道每个人具体工资的情况下,如何计算出工资平均值?

答案是,3个人把每个人的工资拆成3份,自己留1份,另两份随机发给其他2人,这样整个网络内就有9份工资碎片,每个人掌握其中3个碎片,对每个人的3个碎片求和,再对三个“和”求和,最后得出平均值。

这只是一个最简单的隐私计算模型。在明文数据相互保密的前提下,隐私计算可以进行高效数据整合和计算,加速数据分享。这为打破数据壁垒、连接数据孤岛和建立数据确权机制提供了新的技术。

9月1日,我国第一部有关数据安全的专门法律——《数据安全法》正式施行,成为数据安全保障和数字经济发展领域的重要基石。该法明确提出,发展与安全并重,在强调数据安全的基础上鼓励数据应用和流通,同时鼓励相关技术的研究与应用。

1

数据使用面临重重障碍 

“数据孤岛”频发

数据作为新型生产要素的重要性急剧上升。同时,反复出现的数据安全与隐私泄露问题也愈发被大众关注,数据使用与隐私保护之间的矛盾日益突出。

华控清交副总裁宋巍就谈到,大量有价值的数据在公共机构手中,“藏在闺中人不识”。

同样,互联网采集了很多公众数据,但《数据安全法》实施后,互联网也不敢轻易“交出”数据,加剧了数据垄断。

“五六年前,社会普遍对数据安全的要求非常粗放,只讲最后的效果,而不谈过程的合规与安全。但随着《数据安全法》《网络安全法》等一系列法规的出台实施,这就好比在企业头上悬着一把达摩克里斯之剑,让企业在考虑开放或使用数据的同时,带着深刻的合规安全担忧,这极大地规范了市场行为,但从另一个角度来讲,也加剧了数据孤岛现象。”深圳洞见科技CEO姚明指出。

企业要想获得数据怎么办?宋巍说,两家互联网公司拥有的数据维度不一样,因为没有一个平台可以推动数据互换,各自想要对方的数据,最后就去并购,反而加速了垄断的形成。

“大家都是在想办法收集数据,但很少想到怎么开放数据。”宋巍说,一边是数据没有派上用场,一边却需要投入重金存储数据。

翼方健数首席科学家张霖涛也注意到,医院科研人员需要数据时,常常到各个科室拿U盘复制,过程还需要科室领导、院领导层层签字;医院交换病历或者影像数据,医生之间各自打电话要样本,整个过程也不是在系统或平台上完成。

1

“可用不可见” 

新技术为数据协作护航

“数据市场将打破数据孤岛的架构和平台。”浙江大学求是讲席教授任奎说,一个完整的数据市场,一般包括四个研究方向,数据脱敏、数据确权,数据溯源和数据定价,这些研究方向都与隐私计算密不可分。

何谓隐私计算?即两个机构联合建模为需求方提供服务,但数据的原文不会被各方看到,甚至不用出数据库,做到数据“可用而不可见”,从而保护数据隐私。

“在不让渡数据所有权的情况下,隐私计算可以推动数据治理从静态走向动态。”姚明通过风控场景举例:客户想去A银行借贷,A银行也非常想知道客户在B、C、D银行的负债情况,但是客户的信息对银行来说都是高度保密的,银行也不希望外部掌握自己客户的信息。

基于银行提供的历史样本数据,在各方原始数据都不出库的情况下,通过隐私计算技术建立风险预测模型,A银行得到的是一个风险评估结果,以评分或评级方式展现不同风险状况。

同样,政务数据可以服务于金融行业,基于隐私计算技术的政务金融联合建模,能够更帮助金融机构建立更精准的风控模型。

“过去,银行对借贷申请主体做上门尽调,动辄几百页的资料短时间内根本看不过来。”姚明说,现在,隐私计算技术有助于打消数据合作方之间对于数据安全的担忧和顾虑,进而增强银行使用外部数据的能力,提升风控管理的效率和效果,促进普惠金融发展。

深圳星云的客户也集中在金融等领域,公司创始人陈沫说,银行在贷前、贷中、贷后都会有精细化运营,客户在银行贷了一笔钱,这笔钱其他银行是不知道的,其他银行只有借助外部数据才能进行风险预测,因此展开异业合作也是必然的。“比如,我去银行申请一笔信用贷,银行就会非常关注在工商、社保等方面的数据,那么银行就可以判断,发放多少贷款、客户是否有逾期风险,等等。”

随着数字化转型的加快,过去银行贷款的风控是离线的,需要两天后才出报告,而现在是“秒贷”,这些都在倒逼银行风控需要借助新技术来实现。

通过手机App下载了多个借款App,从不同的渠道进行了贷款的人对银行来说,属于高危客户,甚至存在欺诈,但银行并不掌握这些数据,而是掌握在手机应用商店手中。“当然,不可能将这些数据直接给到银行,只是经过用户授权利用这些数据建模,银行看到的报告是客户画像。”陈沫说,过去金融、互联网等企业积累了很多数据,但较为封闭,数据只是为自己所用,而未来则是使用别人的数据,或给别人用数据。

“过去,你要把数据放在一个平台上运行,交易中数据也就要给到别人、数据就可以被他人控制,而现在,通过抽取统计数据和模型使用,也可以保证数据不会被操作方看到。”张霖涛说。

1

站上新风口 

百亿市场规模待发

隐私计算在金融、医疗等行业已经形成了一套相对成熟的应用机制。北京市大数据中心副主任、市经信局大数据应用与产业处处长唐建国举例说,工商银行北京分行应用金融专区,通过隐私计算,筛选出了高价值客户名单,也可以像互联网金融那样,做到快速放贷、快速审核,降低交易成本,提供3.5%的年贷款利率产品。

他还表示,疫情防控期间,为助力企业复工复产,北京金融公共数据专区汇聚了200多万市场主体,形成了20多亿条数据,委托北京金控集团数据计算、授权经营,经过整理后的数据给金融、保险机构提供增值服务,如首贷中心面向没有贷款经历的中小企业提供融资支持,“我看到了可喜的成绩,上万家中小企业获得了首贷中心的业务支持,将近400多亿的金融产品”。

2021年,被业内称之为“隐私计算应用元年”,微众银行和毕马威报告预测,国内隐私计算系统的销售和服务收入在三年内有望达到100亿至200亿元。

面对数据流通给隐私计算行业带来巨大的商业机会,陈沫表示,行业已经探索出三种商业模式,第一种是销售算力扩容;第二种是销售牌照;第三种是技术服务。对星云来说,三者的营收相互持平。

一个新兴的隐私计算产业链正在成形。在星云科技所在的深圳,汇聚了超过300家大数据企业,也已经形成了较为完备的大数据产业链,涌现出了诸如微众银行、深圳星云、洞见科技等一批区块链与隐私计算服务企业。

而在9月,珠海市正式发布《珠海市关于加强隐私计算在城市数字化转型中应用的指导意见》,成为国内首个以“隐私计算”命名的城市级政策文件。

■观点

中国科学院自动化研究所研究员曾毅:

应建立更完善的用户“知情—同意”机制

试图保护用户数据,代价是牺牲其它方面,隐私计算在落地中还存在一些障碍。例如,它回避了一个关键问题,即用户知情同意权,用户是否同意把自己的数据,以模型的形式改善或服务于其他的企业和应用?如果没有,这就违反了用户知情同意权。这似乎是为了解决问题A引入了问题B,更完善的用户“知情—同意”机制需要进一步建立。

同时,差分隐私是隐私保护中应用比较多的技术,但为了保护隐私而使模式识别率下降10%到30%,可能很多企业也会犹豫。【记者】郜小平

编辑 邵玉梅
版权声明:未经许可禁止以任何形式转载
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开