数据文件,请登录您的会员账号进行下载!

银河科技三20260625_导读

2026年06月26日 00:40

关键词

VRA 自动驾驶 机器人 感知 定位 决策 规划 控制 大模型 3D特征提取 语言模型 实验模型 隐性规则 显性规则 算力芯片 相对位置 实时性 轨迹信息 加塞 安全性

全文摘要

当前人工智能技术在自动驾驶和机器人领域展现出显著进展,尤其物理A物理I技术对提升生产力至关重要。自动驾驶聚焦于L2加和L4级别,强调运动控制与决策大脑在机器人技术中的应用。讨论了端到端算法和基于语言模型架构(VRA)的优劣,这些技术在提高效能方面发挥关键作用。算力芯片,特别是英伟达产品,在支持这些技术发展中占据领先地位,关注CPU与AI算力、功耗及量产时间成为焦点。整体而言,对话揭示了技术现状,指出了未来发展方向和面临的挑战。

章节速览

00:00 物理AI在自动驾驶与机器人领域的软件突破与应用

讨论了物理AI在自动驾驶和机器人领域的软件进展,包括自动驾驶L2+和L4级别产品的商业化应用,以及机器人运动控制的成熟度与大脑智能的不足。强调了软件突破的重要性,并提及算力芯片在物理AI中的作用。

01:39 端到端算法与VRA模式解析

对话介绍了两种端到端算法路径:纯端到端算法直接识别物理世界,无需转换为语义信息;VRA模式通过语言模型解释场景,将识别信息转化为语义理解,辅助决策。

03:42 VRA系统中一段式与两段式算法的对比分析

讨论了VRA系统中的一段式和两段式算法分类,重点分析了机器人领域中感知、定位、决策、规划与控制的复杂性,以及一段式和两段式算法在数据传递损耗和速度上的优劣。指出一段式算法在数据传递损耗和处理速度上的优势,同时提及头部企业在实际应用中的一段式算法趋势。

06:50 VRA架构:快慢系统融合的创新实践

对话介绍了VRA架构的核心理念,即快慢系统融合以提升实时性与决策效率。快系统负责即时反应,类似人类直觉,适用于高速场景下的快速响应;慢系统则用于深度思考,解决复杂场景决策问题。VRA架构通过简化慢系统的思考过程并将其转化为模型,以满足对延迟敏感的实时应用需求,如高速驾驶和机器人抓取任务。

10:34 VR系统架构与3D特征提取

讨论了VR系统中3D特征提取的重要性,以及语言模型和action生成在系统中的作用,强调了3D特征生成对感知效果的影响,展示了从感知信息编码到轨迹生成的完整流程。

12:04 实验模型在AI理解与预测世界中的应用

实验模型通过学习显性和隐性规则,旨在理解当前世界并预测未来。显性规则如交通法规已被较好掌握,而隐性规则,例如在加塞情况下的博弈策略,目前多采用安全让行,需进一步优化。头部厂商在理解世界方面已取得不错进展,但隐性规则的处理仍有提升空间。

13:59 预测未来与理解世界:仿真模型的挑战与应用

讨论了使用仿真模型预测未来和理解世界中的挑战,包括生成式AI在还原物理属性和复杂环境方面的局限性,以及四足机器人在仿真环境中训练的有效性。强调了仿真模型在传感器数据还原和理解世界规则上的作用,指出当前预测未来的能力仍需强化。

17:11 特斯拉及中国智能驾驶发展动态

对话围绕特斯拉进入中国市场展开,讨论其在临港建设训练中心、招募测试员进行本地化训练与数据采集,以及智能驾驶领域的梯队划分。提及B厂对自研方案的谨慎态度,以及L4级别自动驾驶的政策性市场现状,特别指出深圳全域开放测试区域的举措。

19:50 L4自动驾驶技术在国内外市场的发展与挑战

对话讨论了L4自动驾驶技术在美国和国内一线城市的表现及挑战。在美国,vivo的表现优异,但成本高昂;国内,小马、文远等企业在北京、深圳等地运营良好,正积极出海至中东、欧洲等地。因国内政策模糊,企业面临网约车市场竞争及成本压力,出海成为趋势,以规避国内风险并利用海外高打车费的优势。

22:00 自动驾驶技术进展与端到端模型应用

对话深入讨论了特斯拉FSDV14的强化版端到端模型,强调其在北美市场的优异表现及自研软硬件带来的优化。提及华为的事业模型架构,以及L4自动驾驶市场向端到端技术路线的转变,指出L2与L4技术正趋于一致,共同推动实验模型的发展。

25:15 机器人技术与VLA架构的挑战

讨论了特斯拉在L2技术路线与机器人算法上的联系,指出垂直场景复杂性使得物理训练难以实施,而VLA架构虽为主流但面临语言模型幻觉难题,导致任务组合困难,多数公司仅能完成单一具体任务。

28:33 物理AI芯片选型关键因素分析

分享了在选择物理AI芯片时应重点关注的几个方面,包括CPU算力、AI算力、功耗以及大模型支持性能。CPU算力对于处理非AI任务至关重要,而AI算力直接影响到芯片的智能处理能力。功耗问题尤其在机器人应用中成为重要考量,风冷方案更受欢迎以控制成本和体积。此外,量产时间和对大模型的支持能力也是评估芯片的重要标准。

要点回顾

OpenAI的大语言模型和其他垂类应用最终在现实世界中带来生产力提升的重点落地领域是什么?

重点落地领域主要在物理I,具体包括自动驾驶和机器人领域。

目前在软件方面针对物理I有哪些突破或进展?

目前软件方面在物理I领域的突破集中在两个方面,首先是基础概念的介绍,其次是关于自动驾驶的发展现状,分为L2++和L4阶段,并且已有部分L2++级别的车型可供消费者购买并上路使用,以及在特定区域推出的RoboTaxi服务作为较好的落地产品。

在机器人领域目前的研究进展如何?

目前机器人的运动控制部分做得相对不错,但在大脑这一块尤其是在不同垂直领域的应用方面,大家做得还比较一般。

能否简单解释一下端到端算法的概念以及业内对它的分类?端到端算法中的一段式和两段式有何区别?

业内对端到端算法有两种分类,一种是纯端到端算法,即通过AI model直接识别物理世界,类似人类对三维物体的直觉识别;另一种是VRA模式,其中会通过一个语言模型解释场景和重要信息,协助决策,这一模式下也分为一段式和两段式。一段式是指将所有模块整合进一个AI模型中,通过共享特征向量传递信息,而两段式则是将感知预测定位和决策规划分别由各自的AI模型完成,两者间通过明确参数传递信息。一段式相比两段式具有数据传递损耗更小、速度更快的优势,且目前量产上车的头部企业大多采用一段式设计。

数据文件,请登录您的会员账号进行下载!