AI总爱“胡说八道”？国内科学家只用一招就破解|探科技_南方+

本文收录于专辑#探科技#

Hello大家好！欢迎收看本期《探科技》。

人工智能技术的高速发展，为人类生活带来的撼动无需赘述。然而，就在AI以前所未有的速度和力度冲向千行百业之时，许多问题也逐渐暴露出来，比如：知识更新代价大；不擅长深度推理，不懂得分析和判断……更离谱的是，AI还经常会一本正经地胡说八道。

在一年一度的科创盛会——2023 IDEA大会上，IDEA研究院执行院长、AI金融与深度学习研究中心负责人郭健就举了这样一个真实的例子：

不久前，他曾向ChatGPT提问，《天龙八部》里的段誉和《射雕英雄传》里的洪七公，谁的武力值更高？按理说，依托GPT-4这一最强的语言大模型，ChatGPT的表现不会差。

谁曾想，它一上来就连犯了两个事实性错误：

其一，ChatGPT说段誉担任过丐帮帮主，但事实是段誉压根没有入过丐帮；

其二，它说段誉曾拜慕容复为师，问题是这两人是情敌关系，怎么可能和平共处呢？

而在逻辑推理阶段，ChatGPT的分析也非常简单粗暴。它认为，段誉太年轻，武学经验太少；而洪七公实战经验丰富，因此论武力值，肯定是洪七公更胜一筹。

——以年龄、经验论功夫的高低？不得不说，这样的判断也太过草率了。

那么，我们应如何弥补大模型在思维能力上的缺陷？

前不久，IDEA研究院团队研发了Think-on-Graph（思维图谱）技术，让更擅长意图理解和自主学习的大模型，与更擅长逻辑链条推理的知识图谱强强联合，形成优势互补。如此一来，大模型学会了“思考”，懂得通过搜索推理的方法得出最优答案。

比如，面对“段誉和洪七公谁的武功最高？”这个问题，Think-on-Graph技术能实现长链的、逻辑化、更为严谨的推理，从功夫的门派、分支入手，深入分析两人与敌人对打时的胜负关系，最终得出与ChatGPT完全相反，却更加合理的答案——段誉的武功高于洪七公。

这一能力的提升，不仅仅能提高问答互动的准确率，其更大的价值在于，将在未来帮助人类更高效、更科学地完成决策和预测。比如，在向大模型提问：“如何提升广州经济”等复杂问题时，它将能凭借超强的长程联想能力，为人类提供意想不到的解决思路。

IDEA研究院还推出了视觉提示（visual prompt）模型T-Rex。研发团队表示，在真实应用场景中，许多罕见、复杂物体难以用文字充分描述，而视觉提示的加入能够有效解决这一痛点；直观的视觉反馈与强交互性，也有助于提升检测的效率和精准度。

除人工智能技术外，在此次大会上，IDEA研究院还发布了计算机科学领域其他分支的创新内容，比如名为“MoonBit月兔”的编程语言，及区块链并行智能合约语言GCL等。

“在大家都看到的问题里，找到大家都找不到的方法。”会上，IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋表示，近年来，IDEA研究院一直致力于创造一个架构，让科学家头脑、企业家素质、创业者精神能够自由碰撞，严谨产出。

成立三年以来，IDEA研究院带来一批已经或正在走向大市场的优秀创业项目。其中，既有主打AI for Scientists的AI科研产品ReadPaper，也有为数据要素可信流通提供硬件级安全保障的SPU机密计算协处理器、SPU-G异构AI协处理器，还有基于自研知识图谱与生物医学领域大模型的脑卒中智能防护产品StroCare，等等。

“做科研既要有耐心，也要对趋势有足够深刻的思考，还要建立让创新能够开枝散叶、生生不息的机制。”他呼吁，“生逢大时代，IDEA研究院愿与各界同仁一道，创新智能技术，创造伟大企业，推动数字经济。”

【视频/文字】南方+记者许隽