AI大局观 | 科大讯飞魏思:人工智能已准备好为世界赋能

南方+ 记者

AI大局观

站在第三次人工智能浪潮的风口:人工智能已准备好为世界赋能

文|科大讯飞华南人工智能研究院院长 魏思

当前,人工智能的第三次浪潮已经到来,其广阔前景和战略意义日益凸显,且正在全球范围内引发全新的产业浪潮。

人工智能从技术阶段上主要分为计算智能、感知智能和认知智能三个阶段。计算智能是让机器具备能存会算的能力,目前人工智能的计算能力已经超过了人类。感知智能是让机器能听会说,在这一领域,人工智能已超过了绝大多数的人类。

认知智能是人工智能的高级阶段,科学家们期望推动机器拥有类似人类的智慧,甚至具备各个行业领域的人类专家的知识积累和应用能力。在认知智能领域,中美两国都已经进入无人区。

2017年12月11日,国家科技部将认知智能国家重点实验室交由科大讯飞承建,这是继科技部公布科大讯飞位列国家首批新一代人工智能开放创新平台之后,把探索人工智能顶尖领域的任务交给科大讯飞。

人工智能拒绝神化,技术与应用都需脚踏实地

在人工智能时代,我们一直认为,人工智能是用来延伸人类能力而非替代人类,不是说用技术去替代某些行业的工作,而是希望人机耦合互动提高效率。例如速记行业,人工转写准确率是80%,机器转写在大部分场景下的准确率是95%以上。将来最好是让速记员和“讯飞听见”合作,可能一个人带着100台机器去100个会议,并做到正确率100%的会议记录转写。

今天的人工智能助手可能只能帮我们解决10%的工作,但很快,它就能帮我们可以解决30%甚至80%的工作,5年以后希望人工智能能够帮我们解决90%以上的工作。与此同时,人类可以去做更具创意的事情。人机耦合互动,是未来人工智能最有希望做成,而且也是最满足社会伦理价值观的模式。

人工智能已准备好为世界赋能

人工智能的概念很宏大,但真正的成功会依赖于垂直渗透,核心技术的持续突破,使得机器通过学习顶尖专家知识,达到一流专家水平,并超过90%的普通专业人士。因此,人工智能已准备好为世界赋能。

这是否意味着以后人工智能的世界只要有算法,机器就可以无所不能了呢?我们认为,在绝大部分领域中,用人工智能改变世界,需要具备三要素:核心技术、行业数据、领域专家。

通过和教育部考试中心共建人工智能联合实验室、和中国医学科学院北京协和医学院共建医学人工智能研发中心、和最高人民检察院共建创新研究院,科大讯飞正在努力搭建平台,用最好的数据和专家去训练具有核心技术的人工智能系统,让人工智能更好地服务于教育、医疗、司法等各行各业。

人工智能+应用才是硬道理

科大讯飞在2015年正式发布AIUI平台,吸引和鼓励开发者们使用顶尖的人工智能技术去做各个细分领域的市场。截至2017年12月,讯飞开放平台累计终端数超过15亿,开发者团队达到50万家,日均交互次数已达40亿。

我们认为,将来决定人工智能发展的是整个产业链的发展,整个产业生态的繁荣才能推动整个人工智能的成长。同时,我们还把人工智能生态延伸到技术创新的科学家,让每一位科学家的源头技术创新成果可以集成到AIUI平台上,不仅赋能开发者,也能成就科学家。

在华南地区,我们成立了科大讯飞华南人工智能研究院,将围绕自然语言理解、图像识别、大数据基础平台、云计算平台等核心技术方向开展研究工作。

在教育领域,我们的英语智能学习平台“E听说”提供了涵盖英语听说考试、教学、练习全场景的学习及备考解决方案,科大讯飞希望通过人工智能技术使因材施教成为现实。在医疗领域,科大讯飞的语音电子病历、医学影像辅助诊断系统、导诊机器人等产品可以大大节约一线医生的时间。

“人工智能+”时代正在来临,未来人工智能会像水和电一样无处不在。科大讯飞将继续坚守在人工智能的道路上,为中国的人工智能产业作出应有的贡献,用人工智能建设美好世界。


2017年AI商用一线报告

“hello,我是林志玲,祝您一路好心情哦”。对于高德地图导航的用户来说,这样的语音一定不陌生。但你可能不知道,这并不是一字一句录制,而是借助了科大讯飞的语音识别功能。只需要3小时的声音素材,就可以合成所需要的声音。

2017年11月,国家科技部宣布将依托科大讯飞建设智能语音国家新一代人工智能开放创新平台。包括BAT在内的国内外互联网巨头也纷纷抢滩智能语音领域,发展势头正旺。

在翻译、家居、车载等多领域广泛应用

当你回到家,说声“叮咚叮咚,我回来了”:灯自动打开,窗帘自动闭合,空调启动,电视自动打开并跳转到你平时最常看的频道,客厅里响起你喜欢的音乐——京东和科大讯飞合作推出的叮咚智能音箱就是这个智能家居场景的“总导演”。

叮咚(DingDong) A1人工智能音箱。图片来源:网络

近几年,国外的微软、苹果、亚马逊,国内的科大讯飞、腾讯、百度、阿里等企业,无一不在紧锣密鼓地推进智能语音的商业应用落地。

2011年,苹果Siri语音助手正式亮相。以Siri的发布为引爆点,智能语音应用领域由传统行业向移动互联网等新兴领域延伸。在2017年苹果WWDC开发者大会上,Siri的智能化进一步提升,加入了实时翻译功能、支持上下文的预测。

智能语音设备之外,中国企业在语音转写技术、语音输入法方面也走在了商业应用的前沿。

在2017年的全国两会上,李克强总理作《政府工作报告》,科大讯飞的产品 “讯飞听见”利用人工智能实时语音转写技术,首次在政府工作报告网络直播中实现同步字幕直播。此外,智能语音输入应用让讯飞输入法用户突破5亿,截至目前,已支持22种方言语音输入,方言识别准确率达90%以上。

2017年11月,国家科技部宣布将依托科大讯飞建设智能语音国家新一代人工智能开放创新平台。

科大讯飞股份有限公司品牌管理部总经理、华南公司副总裁吴骏华向记者表示,智能语音将成为人机交互的新入口。作为平台企业,科大讯飞会把人工智能核心技术开放出来。

智能语音5年内将像水和电一样无处不在

智能语音是人工智能技术的重要组成部分,包括语音识别、语义理解、自然语言处理、语音交互等。

目前,在语音识别方面,科大讯飞、百度、 苹果、谷歌等主流平台识别准确率均在96%以上,稳定的识别能力为智能语音技术的落地提供了可能。

“ 科大讯飞在语音识别方面已经做到98%了。”吴骏华表示,在国际语音合成大赛(Blizzard Challenge)中,科大讯飞连续十二年蝉联第一名。接下来,科大讯飞还要做多方言语音识别。目前,讯飞已经做到了识别22种方言。

百度在2017年宣布ALL IN  AI之后,也在语音智能方面持续发力。百度度秘事业部总经理景鲲表示,目前,语音识别准确率达97%,支持27种语言互译。”

除了语音识别之外,语义理解是目前各大企业需要攻克的技术难关。微软亚洲研究院院长洪小文博士指出,要做到百分之百的语义理解,是一个AI complete问题,只有解决了其他AI问题才有可能。“比如,你去参加一个鸡尾酒会,周围非常嘈杂,你讲的话里面十个有九个字我都没有听清,因为你讲的内容我大概知道,我能够猜出来。但如果用语音识别,可能会失败。在具体的应用场景,还包括视觉、知识的综合使用,这是语音人工智能未来的挑战。”

国家政策层面,也在大力推动智能语音的发展。去年12月14日,科技部印发《促进新一代人工智能产业发展三年行动计划(2018-2020年)》,明确对智能语音的发展做出展望,“到2020年,实现多场景下中文语音识别平均准确率达到96%,5米远场识别率超过92%,用户对话意图识别准确率超过90%。”

对于未来智能语音的普及推广,吴俊华表示,在政策和行业的双重推动下,预计未来5年内,智能语音会像水和电一样无处不在。”

以智能音箱为载体,智能语音成为人机交互新方式

享有“互联网女皇”称号的玛丽•米克尔发布的2016年互联网趋势报告中,超过十分之一的篇幅论述语音识别交互带来的改变。报告称,智能语音交互有望成为下一代人机交互新范式。

记者梳理发现,目前智能语音的参与者中,可以分为互联网巨头企业、智能语音公司、初创企业三种类型。不论哪种类型的参与企业,无一例外都开发了同一款产品——智能音箱。

去年7月,百度收购美国语音交互技术公司KITT.AI,就在同一天,阿里发布智能音箱“天猫精灵X1”。此前,京东联合科大讯飞推出了“叮咚音箱”,腾讯云发布了“小微”。而国外智能音箱竞争大战早已打响,随着亚马逊Echo打开智能音箱的市场,谷歌的Google Home、苹果的Home Pod、微软的Invoke陆续上线。

纵观国内外市场,智能音箱市场引爆之势呼之欲出。

据Research and Markets研究报告显示,全球智能语音市场将持续显著增长,预计到2020年全球语音市场规模将达到191.7亿美元。近日,Canalys公布的报告也预测,2018年将是智能音箱普及的一年,相比2017年出货量的3000万台,2018年的出货量预计将达到5630万台。

【出品】南方财富 南方+ 南方视觉

【策划统筹】谢思佳 陈韩晖 何勇荣 彭琳 程鹏

【采写】彭琳 姚翀

【视频剪辑】万稳龙 李赫

【实习生】韩谦

【校对】杨远云

编辑 许晓冰
加载全文
版权声明:未经许可禁止以任何形式转载
热门评论
快来抢沙发

    继续阅读
    还没看够?打开南方+看看吧
    立即打开