新闻公告

马斯克发布机器人，“钢铁侠”那种！特斯拉推出全球最快AI计算机，自研芯片那种

2021-08-23

全球最快的AI训练速度王座，刚刚易主了。

不是英伟达GPU，也不是谷歌TPU……

马斯克治下的特斯拉，自研AI训练芯片D1，自研AI超级计算机Dojo ExaPod，首秀即巅峰，登场就是全球第一。

此外，马斯克还带来了另一个特斯拉新品：

汽车机器人，搭载了特斯拉包含芯片在内的软硬件系统，但跟百度的不同，不像汽车更像人。

这就是特斯拉年度AI开放日上，马斯克再次带来的一系列激动人心的大进展。

特斯拉自研AI训练芯片D1发布

马斯克说：要有一个超快的计算机来训练Autopilot在内的整个自动驾驶系统。

于是DOJO诞生了。

DOJO，取名源自日语里“练武”专用的道场，顾名思义，DOJO就是特斯拉AI不断精益功夫的道场。

DOJO 是一种通过网络结构连接的分布式计算架构。它还具有大型计算平面、极高带宽和低延迟，以及分区和映射的大型网络。

实际上，在CVPR 2021现场，特斯拉就已经剧透过DOJO的相关性能。

当时总算力达1.8EFLOPS，读写速度高达1.6TBps，一度被认为超越全球排名第一的超级计算机富岳，创造超算新纪录。

但那时DOJO用的是英伟达的A100 GPU，单卡算力321TFLOPS，共计5760张，节点数高达720个。

而现在，DOJO更进一步，自研了“心脏”芯片。

特斯拉首款AI训练芯片D1，正式发布。

7nm工艺，单片FP32达到算力22.6TOPs，BF16算力362TOPs。

特斯拉发布会现场，还用图展示性能，拳打英伟达GPU，脚踢谷歌TPU。

一句话概括，比现在市面上任何芯片都强。

特斯拉也用“Pure Learning Machine”，纯学习机器，来称呼D1芯片。

此外，D1芯片强的不只是单兵作战能力，还有集团军作战能力，它们可以无缝融合，变成超大规模计算阵列。

能有多大，接下来，特斯拉就揭晓了之前预热海报上的“神秘物种”：

集合了25块D1芯片的训练模块！

这也是特斯拉首个训练模块，而把多个模块集合，就能形成更大算力的训练阵列：

至此，特斯拉自研超算DOJO完整真身亮相！

超过50万个训练节点。每个模块算力为9 petaflops，带宽为36TB/s。

DOJO的可怕之处在于，不同于世界其他超算需要承担多种不同任务，DOJO的唯一使命就是AI训练，或者可以说聚焦到自动驾驶算法的训练。

因为专注，所以首秀即巅峰。

AutoPilot、FSD，特斯拉的其他AI训练任务，都能在DOJO里更高效练就。

另外，特斯拉官方还继续剧透：这不是终点，下一代DOJO还会有10倍性能的提升！

所以到这里就完了？拿衣服。

最后也是最强，特斯拉D1支持下的终极大杀器登场：

ExaPOD，集成120个训练模块，包含3000个D1芯片，超过1百万个训练节点。算力达到1.1EFLOP。

而且每单位能耗下的性能比当今最强超算高1.3倍，但碳排放仅为1/5。

速度和性能，冠绝业内。

于是特斯拉明确：这就是全球最快的AI训练计算机。

有意思的是，2019年美国能源部曾放言要花6亿美元建E级算力的超算，2023年问世……

万万没想到，这个目标被“车企”特斯拉率先实现了。

最强“炼丹炉”为谁而建？

所以问题来了，自研D1芯片有了，最强AI训练超算DOJO ready了，接下来特斯拉会有怎样的改变？

特斯拉AI技术主管Andrej Karpathy（李飞飞高徒）登场，介绍了D1芯片和DOJO，主要服务的对象——特斯拉的在自动驾驶方面领先所有对手的“灵丹妙药”：

纯视觉方案。

事故频出，争议四起，甚至中国绝大部分玩家都转向了视觉激光雷达的综合方案，但特斯拉依然坚持。

Karpathy详细介绍了特斯拉高纯视觉方案的思路，和现行8摄像头方案的特点，以及它为什么能work。

特斯拉纯视觉方案，基本构建原则是把自动驾驶系统看作一个生物，有眼睛、有神经、有大脑。

目前的方案有八个摄像头，背后是被称为HydraNets——“九头蛇网络”的多任务学习神经网络。

“九头蛇网络”可以同时处理目标检测、交通标志识别、车道预测等等任务，其关键在于对各种数据的特征提取，包括不同种类数据的特征共享、对不同任务的分别调参，以及参数缓存，用来加快调参速度。

这也是实现FSD敏捷开发，半年内迭代2-3个版本的关键。

接下来，Karpathy 描述了纯视觉方案的历史，以及方案发展到今天的逻辑，他展示了一段特斯拉处理其图像数据的视频。

他说过去的FSD 虽然很好，但事实证明这样的系统不够完善，每个摄像头能够检测到工程师预期的目标，但背后神经网络的矢量空间是不够的。

于是，特斯拉如重新设计了神经网络，就是上面的“九头蛇”。

另外相机校准、缓存、队列和优化等等环节都做了最大程度简化。

特斯拉方面还比较了多摄像头方案和单摄像头方案的差别，相同的场景下，单摄像头方案识别率明显低于多摄像头方案。

特斯拉车辆上的8个摄像头获取原始输入后，系统会创建各种分辨率的图像，用于各种功能和目的。

这些不同的图像会被分别喂给处理不同任务的神经网络，作为整个自动驾驶系统的决策依据。

接着，Karpathy介绍了特斯拉的“终极建筑师”，即车辆在行驶过程中可以实时对车道、环境建模。

车道线实时建模，其实就是特斯拉自己的高精地图能力。

中国自动驾驶玩家，强调“高精度地图”的不少，但特斯拉的思路，“现成资源”不是本质能力，本质能力应该是“创造资源”的能力。

最后，Karpathy谈了AI公司常见的数据标注问题，他认为，把数据外包给第三方去做手工标注并不好，所以特斯拉选择自建团队来给数据打标，目前已经从2D图像标记升级到4D矢量空间的标记。

这也是特斯拉自动驾驶不断快速进化的核心所在。

依靠人工标注，显然无法应对量产车上路后的大规模数据，所以只有自动化标注，才能形成数据闭环。

开放日上，特斯拉也展示了如何从车道线、2D图像……一点点跃迁至4D标注和建模的。

行人、车辆、树木，建筑物……清清楚楚，而且还有意图识别。

特斯拉方面也强调，基于类脑一样的感知系统、自动化标注能力，以及仿真，确保了特斯拉为什么可以基于纯视觉实现更高维度的自动驾驶。

仿真，简单讲就是利用现实数据，将真实世界的实时动态景象，在计算机系统实现重新构建和重现。

这套模拟程序，用特斯拉的话说，就是一个以自动驾驶为玩家的视频游戏。

在这套系统里，任何要素都可以被添加其中，包括奇葩的极端场景。

比如这里，人太多导致目标难以标注，车辆极多：

特斯拉这里还不忘补刀一下毫米波雷达——纯视觉也能做很好，所谓的雷达冗余作用有限。

特斯拉方面还披露，现在标注和仿真系统，可以模拟数量高达3.71亿的数据及场景。

当然，自动驾驶最后还得解决从比特世界走向原子世界应用的问题。

这次特斯拉主要披露了控制和规划方面的进展。

特斯拉自动驾驶总监Ashok Elluswamy，分享了特斯拉针对复杂场景的规划方案——“混合规划系统”。

主要思路和技术方法是基于蒙特卡洛树搜索，实现最佳路径规划。

最后，整个特斯拉自动驾驶从感知到决策规划，一图概括如下：

One more thing：特斯拉“机器人”

最后的最后，就在大家都以为发布会完全就是自动驾驶相关内容之际……

“简短茶歇”环节，竟然来了一段“机器人热舞”——宛如衣服Model一样的穿着，样子非常“硅基”。

这是特斯拉的行为艺术？

不不不，再次出乎意料。

马斯克再次登台，然后郑重其事发布：特斯拉机器人。

身高5英尺8英寸，约为172cm；重量125磅，约为56.7kg；承载能力为45磅，约为20kg。

它的面部是一个显示屏，用来显示重要信息。

从外形上看，四肢和人类一样。

为了实现平衡性和敏捷性，四肢使用了40个机电推杆。

同时，特斯拉各项AI和芯片技术，都会应用其中。

比如使用Autopilot的摄像头充当感知系统，胸腔里内置特斯拉自研芯片——FSD同款，还会加持多项特斯拉已开发出的技术，如多摄像头视频神经网络、规划能力、标记。

而且马斯克强调，这不是玩具周边，它会最终实现——可能明年就会正式推出，这是特斯拉电动车的下一步。

硅谷钢铁侠还说，他会是一个非常有用的机器人，由人打造，为人服务，而且会确保一直对人友好，能把人从危险的、重复的，无聊的任务中解放出来。

甚至还能跟已经高度自动化的特斯拉车辆生产进一步结合协作。但按照马斯克的意思，首要的应该是“做家务”。

有意思的是，随着特斯拉这个“机器人”发布，太平洋两岸都把“机器人”作为了智能车变革的下一步。

中国这边，百度李彦宏刚刚推出了一款“汽车机器人”，不过更像“汽车”而不是“人”。

美国那头，马斯克的特斯拉机器人，更像“人”而不是“汽车”。

这种区别，也可能跟马斯克的那个江湖绰号有关。

伊隆·马斯克，不就是现实版钢铁侠吗？

（转载自智能车参考）

返回列表

首页

中心介绍

超算应用

超算资源

用户中心

新闻公告

诚聘英才

博士后工作站

马斯克发布机器人，“钢铁侠”那种！特斯拉推出全球最快AI计算机，自研芯片那种