“做机器人时代的 Wintel”,4月6日,智能芯片公司地平线在深圳举办技术开放日,地平线希望,让每一辆车都搭载地平线的智能计算方案。
地平线成立至今已有8年,共推出两个系列的芯片,分别为征程系列和旭日系列。前者聚焦自动驾驶领域,迭代了三代车规级智能驾驶芯片。
2019年8月,地平线正式发布征程2,这是中国首个车规级自动驾驶芯片;2020年9月份发布征程3芯片,2021年7月发布中国首款高性能大算力、专为高等级自动驾驶芯片设计的征程5。
截至目前,地平线征程系列芯片获得20多个车企的定点合作、120个车型的前装定点、50多个已量产车型,征程系列芯片整体出货量达到280万片,以及100多家生态合作伙伴,包括一些“爆款”车型,如长安UNI系列、理想ONE、理想L8。
地平线联合创始人兼CTO黄畅说,自动驾驶有望降低96%车祸,尤其是重大车祸事件,这个过程中每个毫秒延迟的改善都是对车内和车外生命的一种重视。
然而,一辆自动驾驶车辆装备的传感器,通常分辨率是两三百万像素起,前视可达800万,未来会使用1500万、1600万像素摄像头,再加上激光雷达、毫米波雷达走向图像化,车上“武装到牙齿”的传感器越来越多。
“估算一下,一辆自动驾驶车辆,如果不对数据压缩或结构化处理,一天能够收集几百TB的数据。如果有2000辆自动驾驶汽车,每辆车产生约1000TB数据,几乎和2015年互联网整个数据量相当。对数据脱敏处理之后传输到云端,并和其他车辆搜集的数据汇合一起,将有助于大大提升自动驾驶方案的安全性。”黄畅说,这要求车端有非常强的数据分析能力和计算能力。
算力是新的“水电煤”,但同时意味着成本,同时,高算力不意味着就一定能带来更好的用户体验,尤其自动驾驶,一些高端车型在量产时配置很高算力即所谓“预埋”,但一年以后发现完全可以用一半甚至更低的价格获得同等算力,“这还挺尴尬的”。
“当你提升物理算力的时候,实际上付出更多成本,却并没有带来真实算力提升。”黄畅说,真实算力就是这个算法每秒钟处理多少帧图像,而不是理论上每秒钟能进行多少次计算。
此外,摩尔定律已经接近极限,而且面临越来越多功耗和存储难题,整个系统工程的演进已经开始逼近物理极限,后摩尔时代增长芯片优化路径不仅仅需要先进的工艺制程,还需要封装架构,包含软件和硬件的架构才能支撑高速成长,应对指数级爆炸式智能算力的需求。
“当大家都在讲Tops,每瓦或者每美元所能带来峰值算力的时候,实际上我们真正想要的是,每瓦或者每美元能获得的处理速度。与处理算法的速度相比,其实有很大的不相关性。”黄畅说。
其中一个关键是算法的效率。Open AI搞出了ChatGPT,过去9年时间里平均每9-14个月在达成图像识别、语音识别和自然语言处理的任务精度相同的条件下,比之前半导体摩尔定律还快,这就是算法发展在持续优化。
“一个算法部署在计算架构上,真正有效利用率受限于带宽、计算架构,受限于计算器件是否适配,软件是否能够充分调度硬件上所有的计算器件,并且把带宽利用到极致。”黄畅说,当峰值物理算力适配越来越先进算法时,到底有百分之多少能够真正用起来,这个数值往往被很多人过去忽略,高的能到60-70%以上,比较差可能1%都不到。
当摩尔定律发展趋缓,如何提升算力,取决于各家公司技术,上下差别可达几十倍,就据要求在算法和软硬结合的架构优化上更彻底。2020年MIT学者也发过一篇论文时指出,后摩尔时代计算性能提升在于软件工程、算法、硬件架构联合优化。
黄畅说,把算法部署到硬件上,要做很多的适配,要把性能提升做很多种优化,同时意味着大量的人工工作,要深刻理解算法硬件和软件架构才能做到这一步;面向未来,地平线已经把算法也引入到开发过程中,用机器就可以自动优化每个算法、优化每条指令,从而大幅去降低开发门槛。
而征程 5 就是搭载了地平线最新一代 BPU 叶贝斯深度学习引擎,通过 BPU 计算架构设计与深度神经网络的协同,在硬件不变的情况下,征程 5 通过工具链和编译器优化,就可以将图像速率从 2021 年的 1283 帧/秒提升至 2022 年的 1531 帧/秒。
黄畅说,和竞争对手相比,这款芯片处理速度实际上高很多,比如踩刹车输出最快能够做到60毫秒的时间,整体功耗不超过30瓦。
【记者】郜小平
订阅后可查看全文(剩余80%)