一、为什么要“端到端”
在AI神经网络的早期发展阶段,人们倾向于认为应该“让神经网络做尽可能少的事”。例如,在将语音转换为文本时,人们认为应该先分析语音的音频,再将其分解为音素,等等。但是后来发现,(至少对于“类人任务”)最好的方法通常是尝试训练神经网络来“解决端到端的问题”,让它自己“发现”必要的中间特征、编码等。
FSD Beta v12对城市街道驾驶栈进行了单个端到端神经网络的升级,这个神经网络基于数以百万计的视频片段训练而来,替换了超过30万行明确编写的C++代码。
二、特斯拉是如何做的
“没有一行代码告诉它减速通过减速带,没有一行代码告诉它避让骑自行车的人,没有一行代码要求它在停车标识前停下、或是等待另一辆车、或是需要等待几秒……什么规则都没有,它完全是在学着做人类做的事情。我们完全是通过视频训练来实现这一切的,完全通过人工智能和摄像头,就像人类完全通过眼睛和大脑(来实现驾驶)一样。”
在目前的FSD v12.2.1中有231个神经网络,但其中一些是更大的“复合”网络的一部分,所以特斯拉将它们算作一个网络。
还有,几乎每个网络都有复制品,分为prod(量产)和experimental(试验)版本,但我最后一次检查时,它们是完全相同的。
三、要跟进,难在哪?
特斯拉 10 EFLOPS(2023 年 8 月) 华为2.8 EFLOPS(2023 年 11 月) 极越(百度):1.8-2.2 EFLOPS(2024年2月) 蔚来1.4 EFLOPS(2023 年 9 月) 理想1.2 EFLOPS(2023 年 6 月)
总结
“建约EV预测系统”定位为新能源汽车研究和预测系统,为企业客户提供第三方趋势预测服务,包含:EV销量预测、产业趋势分析和产业沙龙服务三大部分内容。