微众银行首席AI官杨强:大数据是人工智能的石油,是离不开的燃料

南方+ 记者

4月25日—26日,2021人工智能与机器人国际研讨会在香港中文大学(深圳)举行,本次大会以“历史转折期的科技”为主题,汇集了20余位中外院士和60余位业界专家,重点围绕人工智能和机器人技术、5G、数字技术等议题分享研究成果、研讨技术难题和交换创新见解,意在为我国目前在人工智能与机器人领域面临的技术挑战和关键应用难题寻找解决方案。

25日下午,国际人工智能联盟主席、微众银行首席AI官杨强出席了大会并发表《人工智能与数字治理》主题演讲。杨强讲述了如何利用联邦学习和迁移学习的方法解决AI在落地实施中遇到的困难。

分散在各地的数据能不能聚合成大数据?

“大数据是人工智能的石油,是离不开的燃料。”杨强说,人工智能的成功有三个主要因素:算法的进步、算力的进步和大数据的汇聚。有了大数据以后就可以建立一个更好的模型,这个模型让我们能够表达世界上我们想表达的东西。我们给予的数据越多,这个向量就会越精确。

“如果我们可以合法合规地将分散的数据聚合成大数据,那么人工智能就可以进一步向前发展。”杨强说,我们不能简单地把数据聚合起来,一个原因是数据代表资产、代表生产要素。大家对于数据的归属和数据的价值都有非常严密的保护,自己的数据不想跟别人分享。第二个是数据隐私。公众对于数据隐私保护的要求越来越高,各国的政府也纷纷出台对数据保护的法律法规。当前,从政府到企业到社会都面临同样的问题,就是如何建立一个完整的合规的数据市场。

对此,杨强表示,首先从技术的层面我们要考虑有没有足够的工具可以用来建立这样一个数据治理的方法论。在此前提下,联邦学习应运而生。联邦学习是数据不动模型动,数据可用不可见,可以实现知识的共享,而非数据的共享。

联邦学习的前沿研究

杨强说,我们可以研究一个机制,使每一个数据的拥有者在生态中收益,那么这个生态就稳定。同时我们又要保证公平、透明,尤其是大家在沟通和共同建模的时候所面临的联邦学习平台一定要透明。所谓透明是大家可以自己去发现这样的一个平台是没有“后门”的,不可能有数据的泄露。所以我们公开了全世界第一个联邦学习的开源系统,叫做FATE。FATE现在超过700家企业机构在使用,有大概几百家高校在使用,还有一个非常大的社群在不断地加入新的功能模块。

同时我们也在积极地推动建立国际国内的行业标准,这些标准从各个方面都使得这样的一个生态有据可寻,大家按照同一个语言在沟通。比方说我们今年3月份发布的IEEE P3652.1《联邦学习架构和应用规范》是第一个联邦学习国际标准。

我们也看到很多的应用,比如5G和联邦学习可以紧密地结合。因为5G和工业互联网联系密切,工业互联网中有很多的数据产生者,有很多边缘计算单位,联网以后每一个单位都可以建立自己的部分模型,加起来就变成一个全局模型。这个全局模型在边缘计算的基础上可以更好地支持各种情况。

我们也进行了一系列的前沿研究,包括联邦学习的自动化,就是用AutoML帮助联邦学习。杨强说:“我们不需要我们的合作伙伴要有很多人工智能的知识,才可以进入到联邦学习的生态里面来。他们可以用AutoML设计联邦学习的深度网络。”

联邦学习解决金融行业应用的痛点

联邦学习可以应用于反洗钱。不同的银行都很关注客户里面有没有人到不同银行做洗钱的动作,只有把这些银行汇聚起来才能够发现这种行为。但是之前大家又担心自己的数据会不会泄露给其他的银行。现在利用联邦学习,数据可以保留在本地,模型可以共同建立起来,共同的模型可以来发现这种多方参与的洗钱行为。

第二个是联邦学习可以应用于金融机构的风险管理,帮助我们提高信贷风控的能力。把互联网公司、金融科技公司、银行、小贷公司、第三方支付、数据、票据公司等公司联合起来,将坏账进行细分,就会知道哪部分用户风险很高,哪部分用户风险很低,这样欺诈的识别率会大幅提高。

第三是可以把联邦学习应用于推荐系统。比如网上书店和网上影院,如果它们之间进行横向联邦,最后的结果是能够更加精准地做个性化的推荐。

【记者】金永胜

【摄影】谢昊燃

【海报设计】栾艺婷

编辑 孙梦圆
版权声明:未经许可禁止以任何形式转载
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开