打破平台数据“自然垄断”,技术做了什么?|数据新价值⑦

南方产业智库
+ 订阅

3个人,互不相识,在不知道每个人具体工资的情况下,如何计算出平均值?

答案是,3个人把每个人的工资拆成3份,自己留1份,另两份随机发给其他2人,这样整个网络内就有9份工资碎片,每个人掌握其中3个碎片,对每个人的3个碎片求和,再对三个“和”求和,最后得出平均值。

这只是一个最简单的隐私计算模型。类似这样的计算,在华控清交为客户研发的产品中,每天都在大规模进行,行业称之为“隐私计算”——在明文数据相互保密的前提下,进行高效数据整合和计算,做到既分享数据,又保证被分享的明文数据不流失,而且可以规定数据的用途和用量。这为打破数据壁垒、连接数据孤岛和建立数据确权机制提供了新的技术。

“未来数据流通的主体,应该是数据的特定使用权而不是数据本身。”华控清交副总裁宋巍说。

1

数据交易的新使命

在宋巍看来,数据天生存在两大特性:首先,数据被“看见”即可被无限复制,且复制成本几乎为零。

其次,数据可被多方同时、重复使用,一旦被泄露或复制,就无法限制用途,存在滥用风险。

“明文数据”的大规模流通几乎是不成立的。数据的价值在于其承载信息的不对称性,明文数据被复制和传播,从理论上说数据价值就丧失。数据流通的主体不是明文数据本身,而是数据的特定使用价值。

而隐私计算则把数据可见的具体信息,做到“数据可用不可见”;同时,可以规定数据的具体用途和用量,通过计算合约把数据的使用价值精确限制到具体算法和使用次数,实现数据“用途可控可计量”;让数据的特定使用价值流通起来。

“如果医院采集了大量病患者数据,这些统计数据是属于国家、医院还是个人?”宋巍说,虽然数据来自个人,并不意味着,这些数据就无法使用。

再比如,研发一款新药、新疗法,这些数据虽然都是在个人身上进行统计,如何来界定数据的权属?有一点相对明确的是,数据可以在不泄露个人信息的情况下使用。

在他看来,如果一上来就界定数据是谁的,就陷入了一个是或否的二元理论,而在保护个人信息安全的情况下,应用大样本量还是可行的。

“数据交易不是某种数据所有权的让渡,而是让大家在一起,有人贡献数据、模型和算法,最终获得一个计算结果的过程。”宋巍说,以前的观念是把具体的信息保护好,现在,随着隐私计算的爆发,让外界看到,数据也可以安全地流通。

1

谁来开放共享数据?

隐私计算需要大量的数据,这就要推动数据共享,目前还面临不少难题。

宋巍说,首先,大量有价值的数据掌握在政府手中,藏在闺中人不识,缺乏盈利的动力,只是被动存储了大量数据。

比如,卫健委拥有大量的健康数据,以怎样的方式来公布这些数据?医疗行业的数据分类分级还需要进一步细化。

同样的,互联网采集了大量公众数据,是不是只有它能够用,以及能不能对外开放,否则,容易加剧互联网“数据垄断”。

还有让企业面临的困惑是,其掌握的数据并不是多和少的问题,而是精确与否的问题。“两家互联网公司拥有的数据维度不一样,因为没有一个平台可以推动数据互换,各自想要对方的数据,最后就通过并购的方式实现,这反而加速了垄断的形成。”宋巍说。

“很多人都是在想办法收集数据,但很少想到怎么开放数据。”宋巍说,对一些传统企业来说,它知道数据很有价值,一边是数据没有得到用场,一边却是需要投入资金来维护数据。如果推动数据开放与互换、让数据产生价值,自然就有动力将数据治理更好。

他举了个例子:如果患者在不同医院做的CT也能得到互认,这就是对数据价值的一种认可,在提高社会效率的同时,才能引导参与方投入到数据治理中来。

“对拥有数据的一方来说,应该有数据平权的责任和意识,有意识的推动数据开放共享。”宋健说。

1

将催生评级机构等产业链

积极推动供需双方共同参与、激活数据要素,宋巍认为,还应该建立起从事先评估到事后评价的一套相对完善的评价机制。

“例如,在事先评估方面,将源数据描述给他人,告诉潜在的买家,利用源数据可以做什么。”宋巍说,数据提供方可以做出一个“样例数据”,在不暴露源数据的情况下,让数据需求方明白数据作用

而事后评价机制则是一个重复博弈的过程,宋巍认为,就好比消费者在淘宝上看到图片再下单,事前消费者知道产品大概是怎样,到货之后是否符合预期,反复交易就是一个重复博弈的过程。

“最后,还必须眼见为实。”宋巍说,虽然结果出来了,但很少人会去真正研究背后的算法、代码是如何生成的,只是因为反复在使用,需求方相信结果是可信的,因此也需要对过程进行检视。

对数据交易的买卖双方,都应该有一个数据信用评级机构,来给参与方进行信用评级,“为什么消费者可以信任在淘宝上买东西,是因为有平台信用担保”。

“数据要素市场将衍生出一系列的数据经纪、数据咨询、数据保险、数据审计、数据治理等服务。”宋巍说,类似证券交易市场一样,围绕公司上市融资延伸出一个庞大的产业链。

通讯员/受访者 华控清交 供图

在他看来,外部监管也是激活数据要素的重要因素。大家把注意力放在了鼓励数据交易上,但很容易忽视数据监管的重要性,导致把数据“偷出来”交易,不再行业监管范围之内,“为什么很多P2P走上了庞氏骗局?就是因为P2P不被监管”。

宋巍总结,如果要推动数据流通以更友好、更低成本方式进行,要推动更多开发者一起来参与,对政府来说,则是标准与基础设施建设先行,这也是避免“数据孤岛”的一项重要措施。

内容链接

数据不出库也能“画像”,银行如何识别“高危客户”?|数据新价值⑥

不掌握数据,这家企业怎么打破流通壁垒|数据新价值⑤

原始数据不出库,隐私计算如何打破“数据孤岛”|数据新价值④

后台不互联,健康码如何实现跨境互认|数据新价值③

数据合规推高企业成本?应用与安全之间还差这个原则|数据新价值②

“数据新价值”系列调研报道①《数据安全法》今起实施,安全大考如何作答

【策划】陈韩晖

【统筹】程鹏 赵兵辉

【记者】郜小平

【出品】南方产业智库


编辑 马华
版权声明:未经许可禁止以任何形式转载
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开