首页> 汽车> 高速端到端 /AI 推理可视化上线 体验理想 V7.0 版本

高速端到端 /AI 推理可视化上线 体验理想 V7.0 版本

2024-12-27 17:59:01

在 11 月份全量推送完车位到车位的 V6.5 版本之后,理想汽车在 12 月底即将迎来新一轮 OTA 升级。

这一次则是 V7.0 版本的推送。

体验版本为 V7.0.0 E2E+VLM Beta 7.2 版本

和 V6.5 版本针对车位到车位、全国高速收费站 ETC 通行等场景不同,这一次理想汽车除了针对高速场景的升级外,针对智驾也引入了全新的交互设计。

所以接下来我们就从这两个升级点来聊一聊理想 V7.0 版本。

一、 AI 推理上线 路线选择 / 注意 /VLM 更详细

首先就是 AI 推理这个功能。

如果不是理想汽车的内测用户,大家在听到「 AI 推理」可能会有点陌生,如果是内测用户,那你可以在评论区留下对「 AI 推理」上车的看法。

AI 推理界面

在过去有图、有规则的智驾时代,信息输入和输出都是规则化的,在规则化之下可视化的显示也就会比较单一。

但随着无图时代以及 VLM 等系统上车,各种判断和可能性也就更丰富。

所以在新的规则之下,理想汽车想把系统尽可能无尽的还原给用户,也是希望通过这个「 AI 推理」来告诉用户这套系统的能力。

这套系统简单说就是把系统能力可视化,把系统的思考和判断告诉用户。所以 V7.0 版本就在智驾 SR 界面上多了一个「 AI 推理」打开按键。

AI推理打开按键

打开之后我们可以看到整个中控大屏的右侧 2/3 界面分为了三个板块。当然,我们也可以把这个显示界面移动到副驾娱乐屏。

AI 推理界面

这三个板块分别是左上角的端到端模型输出行驶轨迹的思考过程、左下角注意力系统以及右侧的 VLM 视觉语言模型。

其中,左上角端到端模型输出行驶轨迹共有十条路径,每个路径代表一种模型输出结果,最终系统选择一条老司机概率最高的轨迹来执行操作。

端到端模型输出十条行驶轨迹

左下角 Attention( 注意力系统 ) 则是展示车辆感知到的交通和环境路况信息,系统会以热力图形式展示注意力系统的工作状态。

热力图形式展示注意力系统的工作状态

其中颜色更暖 ( 偏红 ) 的区域代表对智能驾驶决策影响更大的区域,颜色更冷 ( 偏蓝 ) 的区域代表对智能驾驶决策影响较小的区域。

最后就是 VLM (视觉语言模型) ,这里则是以对话形式展示视觉语言模型的感知、推理和决策过程。

VLM 视觉语言模型

所以「 AI 推理」其实就是理想汽车针对当下无图智驾的一种交互理念的创新,本意是一种系统能力的展示,通过能力的展示让用户可以更放心、更安心的使用理想的智驾。

AI 推理可以在副驾屏显示

但从实际体验来看,个人觉得这套「 AI 推理」信息密度过高,并且整个信息更新也相对较快,其实在真正使用智驾的时候对其参考并不多,但好在可以取消显示,属于一种展示的拓展,偶尔可以炫炫技。

二、全场景端起来了 高速无图也来了

除了「 AI 推理」之外,这一次 V7.0 版本还有一个比较大的升级,那就是端到端的高速上车。

在原有城市基础上,本次高速环路和高速路场景 NOA 也升级为端到端模型。

这也就意味着随着 V7.0 版本的推送,理想汽车将用端到端技术这一套架构实现城市、高速环路、高速路等场景的智能驾驶。

高速及环路的端到端上车带来的好处就是不再依赖先验信息,体验上用户不会再因为高精地图的缺失带来 NOA 降级,全程无断点,体验也更一致化。

当然了,因为没有了先验信息,同时也是架构的初次切换,一些能力的表现和过去依靠先验信息的系统表现也确实会有所不同。随着学习的深度提升,后续表现肯定也会不断优化。

这一次我们也再次去跑了下深中通道,简单的体验了下。因为在今年 7 月份我们曾经驾驶理想 L 系列车型,当时还是 6.0.0 beta 3 版本,那个时候还只能全程 LCC 使用。

这一次我们驾驶 V7.0 版本则是可以全程 NOA 通过深中通道,而且全程并未出现任何的降级,包括较长的隧道、桥上以及下桥。

正在加载 视频播放器。 播放视频 播放 静音 当前时间0:00 / 时长0:00 加载完成: 0% 0:00 媒体流类型直播 尝试直播,当前为延时播放直播 剩余时间-0:00 1x 播放速度 2x 1.75x 1.5x 1x, 选择 节目段落 节目段落 描述 关闭描述, 选择 字幕 字幕设定, 开启字幕设置弹窗 关闭字幕, 选择 音轨 Picture-in-Picture全屏

This is a modal window.

打开对话窗口。Escape键将取消并关闭对话窗口

文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置恢复全部设定至预设值完成 关闭弹窗

结束对话窗口

2倍速 NOA 在深中大桥行驶的视频

包括在同乐收费站有一段路,在 12 月 18 日我使用 V6.5.1 版本的 NOA 到这里还是会降级为 LCC。这一次我们驾驶 V7.0 版本刚好经过这里,全程 NOA 通过,没有再降级。

正在加载 视频播放器。 播放视频 播放 静音 当前时间0:00 / 时长0:00 加载完成: 0% 0:00 媒体流类型直播 尝试直播,当前为延时播放直播 剩余时间-0:00 1x 播放速度 2x 1.75x 1.5x 1x, 选择 节目段落 节目段落 描述 关闭描述, 选择 字幕 字幕设定, 开启字幕设置弹窗 关闭字幕, 选择 音轨 Picture-in-Picture全屏

This is a modal window.

打开对话窗口。Escape键将取消并关闭对话窗口

文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置恢复全部设定至预设值完成 关闭弹窗

结束对话窗口

6.5.1 版本在此处还会降级,V7.0 则不会降级

基于此情况之下,我们也来简单聊一聊 V7.0 版本的高速去高精地图上了端到端后的表现。

除了全程无断点的表现之外,V7.0 版本在匝道转换方面给我留下了比较深的印象。

过去我们在高速上使用智驾时,遇到匝道转换或驶离匝道场景时,系统一般会在距离匝道 1-2 公里处开始处理变道等动作。

这一次使用 V7.0 版本遇到最极限的一次是在距离匝道还有 370 米时才发起第一个变道动作,而且此时车辆还处于三车道的最左侧车道。

正在加载 视频播放器。 播放视频 播放 静音 当前时间0:00 / 时长0:00 加载完成: 0% 0:00 媒体流类型直播 尝试直播,当前为延时播放直播 剩余时间-0:00 1x 播放速度 2x 1.75x 1.5x 1x, 选择 节目段落 节目段落 描述 关闭描述, 选择 字幕 字幕设定, 开启字幕设置弹窗 关闭字幕, 选择 音轨 Picture-in-Picture全屏

This is a modal window.

打开对话窗口。Escape键将取消并关闭对话窗口

文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置恢复全部设定至预设值完成 关闭弹窗

结束对话窗口

距离匝道 370 米处,开始第一次变道驶离匝道

最终惊险的完成了此次匝道转换。

可以看到相较于过去的 1-2 公里处开始处理转换,这个版本在这个匝道的表现确实非常的极限,个人觉得可以再优化下。

不过在准备下高速的匝道转换时,系统的表现就没那么极限了,在距离出口 700 多米时开始向右发起变道,距离和效率把控的都不错。

正在加载 视频播放器。 播放视频 播放 静音 当前时间0:00 / 时长0:00 加载完成: 0% 0:00 媒体流类型直播 尝试直播,当前为延时播放直播 剩余时间-0:00 1x 播放速度 2x 1.75x 1.5x 1x, 选择 节目段落 节目段落 描述 关闭描述, 选择 字幕 字幕设定, 开启字幕设置弹窗 关闭字幕, 选择 音轨 Picture-in-Picture全屏

This is a modal window.

打开对话窗口。Escape键将取消并关闭对话窗口

文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置恢复全部设定至预设值完成 关闭弹窗

结束对话窗口

距离 700 米处,发起变道驶出匝道

而且在驶入匝道遇到一分二道路情况下,系统并不是快速的向左车道或是向右车道进入车道里,而是比较“拟人化”的骑着中线然后再并入车道。

正在加载 视频播放器。 播放视频 播放 静音 当前时间0:00 / 时长0:00 加载完成: 0% 0:00 媒体流类型直播 尝试直播,当前为延时播放直播 剩余时间-0:00 1x 播放速度 2x 1.75x 1.5x 1x, 选择 节目段落 节目段落 描述 关闭描述, 选择 字幕 字幕设定, 开启字幕设置弹窗 关闭字幕, 选择 音轨 Picture-in-Picture全屏

This is a modal window.

打开对话窗口。Escape键将取消并关闭对话窗口

文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置恢复全部设定至预设值完成 关闭弹窗

结束对话窗口

在一分二道路上,骑线行驶的同时驶入道路中

V7.0 版本在体验连续性、效率和拟人化方面确实不错,但我们也遇到了一些不舒适的点。

例如在深中通道行驶时,当我们从隧道出来会有一次「导航更新」,这个时候系统把车速从 70km/h 快速降到 55km/h,体感及安全感都不是很好。

正在加载 视频播放器。 播放视频 播放 静音 当前时间0:00 / 时长0:00 加载完成: 0% 0:00 媒体流类型直播 尝试直播,当前为延时播放直播 剩余时间-0:00 1x 播放速度 2x 1.75x 1.5x 1x, 选择 节目段落 节目段落 描述 关闭描述, 选择 字幕 字幕设定, 开启字幕设置弹窗 关闭字幕, 选择 音轨 Picture-in-Picture全屏

This is a modal window.

打开对话窗口。Escape键将取消并关闭对话窗口

文字 Color 白黑红绿蓝黄紫红青 Transparency不透明半透明 背景 Color 黑白红绿蓝黄紫红青 Transparency不透明半透明透明 窗口 Color 黑白红绿蓝黄紫红青 Transparency透明半透明不透明 字体尺寸 50%75%100%125%150%175%200%300%400% 字体边缘样式 无浮雕压低均匀下阴影 字体库 比例无细体单间隔无细体比例细体单间隔细体舒适手写体小型大写字体 重置恢复全部设定至预设值完成 关闭弹窗

结束对话窗口

出隧道后会出现地图更新降速问题

当然了,因为是首次把高速和高速环线切到无高精地图+端到端大模型技术方案,所以在能力表现方面出现点波动也属正常。随着模型训练数量的提升,后续这方面的问题也会被慢慢 OTA 优化掉。

但在没优化之前,大家使用智驾也一定要小心,无论使用哪家智驾都不可大意,安全才是第一位。

编辑总结

以上就是这一次理想 V7.0 版本带来的两个比较重磅的更新内容,「AI 推理」把系统更丰富的能力可视化,有需求的小伙伴可以去参考这个「AI 推理」看系统能力,不需要的也可以直接关闭。

高速 NOA 在去高精地图加上端到端大模型后,也让理想在城市和高速都采用了同一套技术框架。从体验来看,在效率和拟人化方面确实有提升,但也还需要继续优化。不过,随着模型数量的提升,后续高速 NOA 升级也会变的更快。

本文来源:https://m.enjoybar.com/newarticle/653121.html