近日,特斯拉AI团队在Twitter上发布了特斯拉定制超级计算机平台Dojo的产品进展时间线,表示该计算机将于今年7月投入生产,到2024年初,Dojo将成为全球最先进的5台超级计算机之一。
【资料图】
此举被业内视为特斯拉在AI领域的又一大动作。目前,英伟达A100等GPU芯片在人工智能领域拥有绝对话语权,但特斯拉自研人工智能训练和推断芯片或许可以降低对传统芯片公司的依赖。
Dojo是特斯拉在2021年人工智能日(AI Day)上推出的一款专门用于人工智能机器学习的超级计算机,它使用特斯拉设计的芯片和整个基础设施,以及来自特斯拉车队的视频数据进行神经网络能力训练,这些训练对于支持特斯拉自动驾驶工作的计算机视觉技术至关重要。
在去年的AI Day上,特斯拉公布了关于Dojo的一些进展,当时特斯拉预计到2023年第一季度,Dojo将成为一个完整的系统。但根据特斯拉最新发布的时间线,现在Dojo系统的最终成形可能要再等半年。
不过特斯拉CEO马斯克对其AI团队的工作表现出相当满意的态度。马斯克在评论Tesla AI的推文时称:“特斯拉AI,无论从软件还是硬件方面,甚至都要远远超过一些专家所意识到的。”
多年来,特斯拉一直希望用软件来定义汽车,并率先在汽车中进行系统和连接的集成。这不仅降低了成本,改进了功能,还能使得更新功能的实现变得更加容易。就连德国大众集团前CEO迪斯(Herbert Diess)也曾专门召集员工学习特斯拉快速的软件开发能力。
软件是自动驾驶的关键,特斯拉正在通过“自动驾驶软件”FSD的销售来推动公司利润率的提升。此前,特斯拉已经在使用由英伟达的NVIDIA GPU驱动的大型超级计算机来处理FSD自动驾驶数据。
具体而言,英伟达的这台超级计算机由720块NVIDIA A100板组装而成,其中每一块板拥有8个NVIDIA A100 GPU,GPU总数量达到5760个,具有1.8 exaflops性能,也是目前世界上最快的超级计算机之一。该系统执行的任务之一是“自动标记”,即为原始数据添加标签,使其成为决策系统的一部分。
但现在,特斯拉承诺Dojo将大幅加快这些模型的改进速度,声称只需4个Dojo系统机柜就可以完成与放在72个机架中的4000个GPU相当的自动标记工作。特斯拉计划在其帕洛阿尔托数据中心部署7个由Dojo系统机柜组成的集群,并将其命名为exapod。每个exapod由10个Dojo机柜组成,能执行1.1exaflops的任务,7个exapod处理能力将接近8 exaflops,主要用于处理特斯拉自动驾驶汽车的AI模型。
特斯拉所说的即将投入生产的就是指首台由10个Dojo机柜组成的Dojo exapod系统,但尚未透露另外6台何时会进入生产。业内预计,当Dojo超级计算机开始交付后,可能会看到特斯拉FSD更快的迭代和改进。
据介绍,Dojo由“图块”组成,工作方式与基于CPU或基于GPU的超级计算机有很大不同。特斯拉称,Dojo的D1芯片模块并不是由很多较小的芯片组合在一起,而是一个具有354个内核的大型芯片组成,专门针对AI和机器学习,每个Dojo机柜可容纳4248个内核,10个机柜的组成的exapod可容纳42480个内核。因此对于相同的数据中心占用空间来说,Dojo要比CPU或者GPU快几个数量级。
截至上周收盘,特斯拉的市值约为8133亿美元。马斯克近期在法国举行的Vivatech科技峰会上再次谈及特斯拉自动驾驶,他表示:“特斯拉的市值与未来能否完善自动驾驶技术密切相关。”
马斯克表示,目前特斯拉的年产量已经接近200万辆,自动驾驶的潜力在于它的价值实在太高,只要有很小一部分自动驾驶(技术落地),也会创造巨大的价值。