此链接为临时预览链接!

大模型“上车”进行时

2023-10-16      科创板日报      作者:徐昊

大模型“上车”进行时

微信图片_20231017072944.jpg

当深度智能化成为决战电动赛道下半场的制胜要素,各大车企和科技企业研发聚焦的重点开始围绕AI大模型、大算力推进。

10月12日,上汽集团旗下智己品牌第三款车型LS6上市。伴随新车交付,智己正式上线了GPT大模型;同时,按照计划,10月开始城市NOA公测,2024年IM AD进入占用网络阶段并进入通勤模式,2025年实现全场景通勤。

此前一日,毫末在其2023 AI Day上介绍了DriveGPT大模型的最新进展和实践。

随着生成式人工智能ChatGPT的横空出世,大模型“上车”也成为车企“决战”智能化的重要抓手。除了上述公布各自最新进展的毫末和智己,广汽集团此前发布了广汽AI大模型平台,将搭载于高端智能轿跑昊铂GT;奇瑞旗下高端品牌星途宣布,其全新系列星纪元ES将首搭科大讯飞的星火认知大模型LION AI;吉利则将发布“行业首个全栈自研的全场景AI大模型”。蔚来、小鹏、理想、创维汽车等新势力车企,以及科技大厂的百度、阿里、华为、腾讯等,也均在布局大模型“上车”。

微信图片_20231017072951.jpg

“自动驾驶和智能汽车将是大模型技术赋能实体经济的最佳场景之一,业界普遍认为大模型率先上车落地的场景是智能座舱。”在2023全球智能汽车产业大会上,百度集团智能驾驶事业群组总裁李震宇谈及了其对大模型“上车”的理解。

智舱、智驾是大模型“上车”两大重要的应用场景,这在业内已成共识。以智舱为例,在大模型加持下的智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,让车内助手在未来有能力像真人一样与用户交流,可以理解并满足用户在车内场景的深层次需求。

“我举个例子,比如说挂P档时很多人喜欢刷手机,但是有安全隐患。我们会通过大模型,把像抖音这类的功能加载到车机内容,挂P档的时候可以看,在行驶过程当中可以听。”在智己CEO刘涛看来,大模型将为用户提供“英式管家服务”。“基于大数据和大模型,根据用户喜好的车载内容会陆续上车,这是非常有想象空间的功能。”

与智己类似,科大讯飞星火认知大模型“LION AI”也为奇瑞星纪元ES提供了这样的功能。据奇瑞汽车执行副总经理、研发总院院长CTO高新华介绍,“大模型第一个阶段主要为智能座舱应用的AI云助理,这个助手不仅需要具备常规的导航、音乐、通话和测控功能,还需要具备理解用户的需求,提供个性化的服务,甚至能够与驾驶员共情,这需要在自然语言处理,情感视觉等方面能够取得显著的进展。”

在智驾能力上,大模型降本增效的能力更为突出。足够丰富的真实世界数据、大规模神经网络训练、强大的车端硬件和软件是自动驾驶发展的支柱。大模型会自动进行长尾场景的自我训练和模拟。

“大模型、大数据、大算力将成为自动驾驶公司迈入3.0时代的关键标志。”毫末智行CEO顾维灏表示,大数据、大模型3.0时代,在感知阶段,通过海量数据训练感知基础模型,学习并认识客观世界的各种物体;在认知阶段,则通过海量司机的驾驶行为数据,来学习驾驶常识,通过数据驱动的方式不断迭代并提升整个系统的能力水平。

以毫末DriveGPT对于训练数据规模提升的能力为例,截至目前,DriveGPT共计筛选出超过100亿帧互联网图片数据集和480万段包含人驾行为的自动驾驶4D Clips数据。在此之前,毫末曾介绍,DriveGPT给行业带来的一个显而易见的优势正是成本的降低。以场景识别为例,利用DriveGPT,毫末在使用数据过程中,逐步建立起一套基于4D Clips驾驶场景识别方案。在行业中,给出正确的标注结果,一张图片需要约5元;如果使用DriveGPT的场景识别服务,一张图片的价格将下降到0.5元。

顾维灏认为,车端未来的演进路线一方面是逐步全链路模型化,另一方面是逐步大模型化,即小模型逐渐统一到大模型内,大模型也可以逐步提升车端的感知能力,在通讯环境较好的地方,大模型甚至可以通过车云协同的方式实现远程控车。最终,在未来车端、云端都是端到端的大模型。

“AI大模型在处理文本、获取和加工数据、建立场景的训练和迭代方面的优势,将会对人机交互智能化和智能驾驶方面起到加速推动作用。”中国工程院院士、清华大学教授、国家智能网联汽车创新中心首席科学家李克强对此评价道。



免责声明:版权归原作者所有,文中观点仅供学习交流,不代表本站立场,如有侵犯版权,请及时联系邮箱info@taiqiauto.com