颜宁最新演讲:曾是AI“迷妹”,现在仍看好,但看到其局限

南方+ 记者

02:06

颜宁50²论坛最新演讲:曾是AI“迷妹”,现在仍看好AI未来,但看到其局限

11月27日,在南方科技大学、腾讯公司共同主办的第二届“青年科学家50²论坛”上,南方科学大学校长薛其坤、著名结构生物学家颜宁、著名植物生物学家朱健康、著名细胞生物学家于洪涛等多位国内外顶尖科学家与获得“科学探索奖”的青年科学家线上“云聚”,畅聊科学领域前沿话题。

普林斯顿大学教授、深圳医学科学院创始院长颜宁在题为《AI在结构生物学中的未达之地》的演讲中指出:“我不是让大家不要做AI,事实上我非常看好AI的未来,我只是说他们现在还是非常有局限性的,希望有更大的数据库,有更强的算力,并且最重要的是有更新的算法,真的能让AI变成我们结构生物学的一个重要工具。”她也表示,深圳医学科学院很快就会问世。

颜宁在青年科学家50²论坛演讲。

人工智能和大数据技术被认为正在成为当今科学发现的新范式。AlphaFold2在2021年横空出世,点燃AI for Science热潮。AI技术一举将蛋白质3D结构预测的精度从60%提升到90%以上,也入选了《Science》杂志评选的2021年度最重要的科学突破之一。但人工智能是否真的无所不能?

颜宁回顾说,AlphaFold横空出世,自己的第一反应是很激动、希望使用AI,但后来却经历了从AI的“迷妹”到“粉转黑”的过程。

因为它们预测出来的结构只达到我们2017年的水平,没有一个新鲜的,没有一点点surprise(惊喜)。这个很好理解,为什么?是因为它是基于我们已经deposit的结构做预测。如果我们自己还没有做出来,它也缺乏一个训练的database(数据库),所以它也没有办法预测出新的,所以那个时候我就清晰地知道了 AI的局限性。”颜宁说。

颜宁在青年科学家50²论坛演讲。

颜宁在演讲中表示,今天的AI对于预测新的构象目前无能为力,对于研究药物小分子的相互作用无能为力。“为什么?因为蛋白质是20个氨基酸(构成),它的序列与结构是个非常好的对应关系,但我们到了小分子,它是一个无穷的化学世界,所以想要去计算它,难度就大得很。”

她提醒说,大家用AlphaFold预测时要谨慎,因为对比发现预测出来的结构与真正的实验数据有差距,这种差距对于制药来说可以是“差之毫厘、谬以千里”,所以,自己在短时间内自己并不看好AI可以真正取代实验技术。

当天,论坛主持人、中国科学院院士、南方科技大学生命科学学院院长张明杰在介绍颜宁出场时表示,5天后颜宁将成为“普林斯顿大学前教授”。他总结说,颜宁的演讲告诉我们,尽管AI、理论计算一直对生命科学起着重大的作用,但生命经过几十亿年的进化,现在至少还是个实验科学,如果不做实验很难真正解码生命最本质的现象。

今年11月1日,颜宁在2022深圳全球创新人才论坛上表示,为深圳这个充满活力的“梦想之都”所吸引,自己即将从美国普林斯顿大学辞职,全职到深圳创办深圳医学科学院。此后,网上流传着一个关于结构生物学家颜宁回国“真实原因”的说法,称AlphaFold2等人工智能系统的问世,让结构生物学家面临“失业”困境。

11月11日,颜宁在个人微博发文表示:“简而言之,我专注的电压门控钠离子和钙离子通道的几个关键问题(electromechanical coupling, ion selection, MOA of drugs and toxins),AlphaFold在我们过去解析的诸多结构的基础上,去年的预测达到了我们2017年的水平;今年依旧停留在我们2017年的水平(这里仅针对Nav/Cav)。在与专门做结构预测的AI团队合作,他们做预测我们做实验,测试新型小分子与蛋白的相互作用,迄今为止预测无一正确。”

她在微博中指出:“结构生物学不仅仅是看到Fold(折叠),更要理解蛋白质的动态变化,要理解与其他生物大分子或者调节小分子的相互作用,要理解在细胞原位里的状态,这些都是AI目前尚无能为力的领域,因为尚没有足够的数据库去训练它。举个例子,我们Cav2.2的结构去年发表晚了,尚未放在数据库里被AlphaFold用来训练,所以它预测的模型就与实验结构严重不符。真正的研究者都乐于拥抱技术进步,善用各种技术去探寻、解答自己感兴趣的问题。事实上,我期待AI越来越强大。”

【记者】马芳

【剪辑】朱洪波

编辑 王玮
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开