亚搏app注册登录官网
热点资讯
你的位置:亚搏app注册登录官网 > 亚搏app下载 > 亚搏app 特斯拉AI负责人埃卢斯瓦米关于全自动驾驶FSD顶层逻辑深度拆解

亚搏app下载

亚搏app 特斯拉AI负责人埃卢斯瓦米关于全自动驾驶FSD顶层逻辑深度拆解

发布日期:2026-02-05 13:19    点击次数:184

亚搏app 特斯拉AI负责人埃卢斯瓦米关于全自动驾驶FSD顶层逻辑深度拆解

特斯拉 AI 顶层逻辑深度拆解:从 FSD 到 Optimus,如何通过“数据压缩”创造物质丰沛?

在近日举行的 Skill 大会上,特斯拉 AI 副总裁、AI 团队负责人阿肖克(Ashok Elluswamy)进行了一场极具深度的公开演讲。作为马斯克推特招募、在特斯拉效力 12 年的 AI 掌门人,阿肖克首次系统性地拆解了特斯拉 FSD(全自动驾驶)与 Optimus(人形机器人)背后的底层逻辑。

特斯拉不仅仅是在造车,它正在构建一个能够理解物理世界的“通用基础模型”。

一、 终极使命:创造“极大物质丰沛”

{jz:field.toptypename/}

阿肖克在演讲开头便明确了特斯拉 AI 团队的使命:创造全球范围内的极大物质丰沛。

这一宏大目标通过两个路径实现:

1、FSD(全自动驾驶):提供低成本、可扩展的交通方案。目前 Robotaxi 已在奥斯汀公开运营,完全由 AI 驱动且无安全员。

2、Optimus(人形机器人):旨在自动化所有物理工作。它遵循“向下兼容”原则,能够直接使用人类的工具和设施,无需为机器人重建基础设施。

通过 AI 替代人类劳动,特斯拉希望让商品和服务的成本趋近于零。

二、 范式转移:端到端神经网络取代模块化

传统的自动驾驶系统是模块化的,分为感知、预测、规划和控制等环节。但阿肖克指出,这种模式存在 “抽象泄漏”和信息损耗。

• 传统痛点:感知模块如果只告诉规划模块“前方有车”,而丢失了刹车灯是否亮起、车身是否晃动等细节,决策就会打折扣。

• 端到端(End-to-End)方案:特斯拉将所有模块合并为一个神经网络。输入是 8 个摄像头的原始视频流、导航指令、运动状态和音频(用于听警报声);输出直接是控制指令(转向角、加速度、刹车)。

这种系统能处理极其复杂的“长尾场景”,例如在积水坑与对向车道之间做整体性权衡,或耐心等待一群正在横穿马路的鸡。

三、 10 亿比 1 的“压缩奇迹”

阿肖克分享了一组震撼的数字:特斯拉系统每 30 秒需要处理约 20 亿个 Token 的数据(包含 8 个高像素摄像头的视频流及历史信息),而最终的输出仅为两个数字——转向角和加速度。

这种 10 亿比 1 的超高压缩比,要求神经网络必须具备极强的因果理解能力。它必须在海量像素中过滤掉无关信息(如晃动的树枝),精准锁定决定驾驶行为的关键因素(如前车的刹车灯)。

四、 数据引擎:在大海中捞取“有趣”的数据

特斯拉庞大的车队每天能产生 500 年的驾驶经验。但阿肖克强调,他们并不收集平庸的数据,而是挖掘“有趣”的数据。

通过自动识别校车、消防车、罕见路况及极端天气场景,特斯拉能针对性地加强训练。这种大规模、高质量的数据积累,让 FSD 的安全性达到了人类驾驶的 2 倍以上。

五、 3D 几何推理与世界模拟器

为了让 AI 拥有“数字直觉”,亚搏app特斯拉引入了两项关键技术:

1、生成式高斯泼溅(Gaussian Splatting):传统 3D 重建需 30 分钟,特斯拉将其缩短至几百毫秒。这一能力集成在控制网络中,让 AI 能实时理解物体的 3D 几何位置和形状。

2、世界模拟器(World Simulator):这是一个能够生成合成视频的神经网络。它可以根据当前视频和动作预测下一帧,生成的像素不仅真实,且符合物理规律(如货车移动时的像素连续性)。通过在模拟器中进行“对抗性测试”,特斯拉可以在不发生真实危险的情况下,验证 AI 在极端场景下的反应。

{jz:field.toptypename/}

六、 统一的机器人基础模型

阿肖克揭示了一个核心秘密:FSD 与 Optimus 运行的是同一套技术架构。

无论是汽车避让行人,还是机器人开抽屉,其核心链路都是一致的:感知环境 -> 3D 几何理解 -> 预测结果 -> 闭环控制。特斯拉的控制频率统一设定为 36Hz(即每 27 毫秒发出一次指令),确保了动作的丝滑与实时纠错能力。

七、 为什么坚持纯视觉?

面对为何不用激光雷达的质疑,阿肖克给出了简洁有力的回答:自动驾驶不是传感器问题,而是 AI 问题。

人类仅靠两只眼睛(即两个传感器)就能开车,这证明了视觉信息的完备性。早期的激光雷达方案是因为 AI 提取信息的能力不足而产生的“拐杖”。在 2026 年的今天,随着计算能力和算法的进化,AI 已经能够直接从像素中读懂世界,不再需要昂贵且笨重的辅助设备。

结语

从下棋的“深蓝”到聊天的“GPT”,AI 正在从专向智能迈向通用智能。特斯拉的端到端系统证明了,一个能够理解物理规律、具备数字直觉的基础模型,既能驾驭复杂的街道,也能在室内开启抽屉。

正如阿肖克所言,这不仅是技术的进步,更是通往物质丰沛时代的必经之路。

本文基于特斯拉 AI 负责人 Ashok Elluswamy 公开演讲内容整理。