通用还是专用?京东给出这个答案|大模型冲击波

南方产业智库
+订阅

无

7月13日,京东在2023京东全球科技探索者大会暨京东云峰会上正式发布京东言犀大模型,同时发布言犀AI开发计算平台。会上透露,该平台已经启动预约注册,预计8月正式上线。

一人干五人份工作

在峰会现场,京东展示了金融领域AI营销运营平台。可以看到,使用者通过简单的对话和操作,就能生成营销活动,覆盖从运营策略制定、快速搭建活动页面、批量生成营销文案和素材,到数字化投放等方面。

过去这套流程需要产品、研发、算法、设计、分析师五类职能人员,如今减少到一人;过去2000次人机交互次数也减少到少于50次。在大模型能力的加持下,营销方案的生产效率有了百倍提高。

京东探索研究院院长何晓冬介绍,言犀大模型支持语言、语音、视觉、多模态等,70%通用域数据,结合30%的行业数据,实现基座模型+垂直领域模型的精调,可服务于零售、金融、教育、政务等领域。何晓冬透露,计划在2024年上半年全面开放大模型能力,向产业输出定制化模型。此外,京东也在探索从语言大模型走向多模态数字人交互,而具身智能也将是京东探索研究院未来重点探索方向。

京东集团CEO许冉在京东云峰会上表示,大模型在京东内部已经取得明确的实践效果。京东在内部大量的业务场景都在深入探索大模型的应用,包括智能客服的水平提升、通过大模型优化产品搜索和推荐效果等。

京东推出言犀大模型

落地产业,拒绝“貌合神离”

通用还是行业,在大模型竞争进入白热化阶段,内部也开始出现路线分歧。何晓冬曾将通用大模型比作“高中生”,产业大模型比作“本科生”。

京东健康京医千询大模型就是一个典型的例子。与通用领域相比,医疗领域的大模型可谓是“貌合神离”。基于医疗场景的特殊性,容错率极低,这对语言大模型提出了更高的要求。

此外,目前已经发布的医疗大模型大都聚焦于文本数据。但是医疗数据中有超过90%的数据是来自于医学影像,因此,只有融合医学影像、文本、语音、视频等多模态信息的大模型才能契合实际需求。

京医千询大模型建立在言犀通用大模型基础上,通过京东健康超过亿级的高质量医患对话数据和大规模医学知识图谱构建。最大的特点是有共情和交互能力,可以理解复杂模态,包括图片、影像的医疗数据来做自主推理决策。

在大会现场,京东演示了将通用大模型转化为健康产业大模型的操作。通常来说,从数据准备、模型训练到模型部署,客户完成这套流程需要10余名科学家花费一周时间,而利用言犀AI开发计算平台,只需要1-2名算法人员在数分钟就能完成;通过平台模型加速工具的优化,还能节省90%的推理成本。

大模型终将进入现实世界

创造产业价值是大模型的目标。许冉展示了京东评价大模型价值的公式:大模型的价值=算法×算力×数据×产业厚度的平方。除了追求技术的先进性,京东还格外关注产业厚度——看重技术能在多少产业场景中切实应用,为社会真正创造价值。

京东自身的发展就来自产业场景,自身拥有包括零售、物流、科技、健康、工业、产发等多个领域的产业实践,为京东积攒起每年数百亿条的优势交互数据。训练京东言犀大模型的数据库,就由70%通用数据与30%数智供应链原生数据组成。这些产业数据和行业know-how。

在这轮技术热潮中,未来大语言模型技术下一步的关键走进现实。“还有多模态,如果想达到深层的涌现智能,必须进行深层次融合,真正做到多模态的通用人工智能,才能够说通用人工智能实现了。”京东探索研究院科学家,大模型训练与推理系统负责人薛超提到:大模型最终会从数字世界走入实体世界。他认为,物理实体世界拥有很大的创新空间,包括工业制造、机械臂、自动驾驶车,以及像波士顿动力的机械狗,这样在现实物理世界就变成了一个大的训练、培养环境,实现了机械智能,给物理实体世界带来更多自动化和潜在价值。

◎内容链接

动嘴即可改设计,人人都能做“甲方”|大模型冲击波

不争一时的腾讯,为何一口气发布50多个方案?|大模型冲击波

我有一个分身,可以和“自己”聊天|大模型冲击波

“数字员工”何以成为生产运行多面手?|大模型冲击波

一键生成,AI“神笔”让人人皆是“马良”|大模型冲击波

“服务者”如何促进生态繁荣?|大模型冲击波

南方+记者 黄晓韵

编辑 马华
+1
您已点过

订阅后可查看全文(剩余80%)

更多精彩内容请进入频道查看

还没看够?打开南方+看看吧
立即打开