自动驾驶芯片指标AI算力TOPS和CPU算力DMIPS

itas109 2024-07-05 15:31:02 阅读 69

自动驾驶芯片指标AI算力TOPS和CPU算力DMIPS

文章目录

自动驾驶芯片指标AI算力TOPS和CPU算力DMIPS智能驾驶芯片CPU GPU NPU算力单位TOPS乘积累加运算MACTOPS计算公式GPU算力TFLOPSTFLOPS与TOPS的换算CPU算力DMIPS

智能驾驶芯片

根据地平线数据，

L2级自动驾驶的算力需求为2-2.5TOPS，

L3级自动驾驶算力需求为20-30TOPS,

L4级自动驾驶算力需求为200TOPS以上，

L5级自动驾驶算力需求为2000TOPS以上。

厂商	智驾芯片	AI算力TOPS(INT8)	量产时间
华为	MDC810	400	2022
华为	MDC610	200	2022
英伟达	Orin	254	2019
英伟达	Xavier	30	2020
特斯拉	FSD 1.0	72	2019
特斯拉	FSD 2.0	预估400-500	2023
地平线	征程5	128	2022
黑芝麻	A1000 Pro	106	2022
Mobileye	EyeQ5	24	2021

车型	智驾芯片	AI算力TOPS	座舱芯片	CPU算力DMIPS	GPU算力TFLOPS	AI算力TOPS
阿维塔12	华为MDC810	400	麒麟9610A?	200k	/	30?
问界M7智驾	华为MDC610	200	麒麟990A?	80k	768	3.5
蔚来ET7	NIVIDA Orin-X *4	1016	高通8155	85k	1142	4
小鹏G9	NIVIDA Orin-X *2	508	高通8155	85k	1142	4
理想L9 Max	NIVIDA Orin-X *2	508	高通8155	85k	1142	4
理想L9 Pro	地平线征程5	128	高通8155	85k	1142	4
特斯拉Model3	FSD *2	144	AMD Ryzen	/	/	/
极越01	NIVIDA Orin-X *2	508	高通8295	220k	>3000	30

CPU GPU NPU

CPU (Central Processing Unit)：中央处理器，是计算机系统的主要处理器，负责多数的通用计算任务。【通用】

GPU (Graphics Processing Unit)：图形处理器，有大量的并行处理单元(如Nvidia RTX 4090有16384核)，主要用于图像处理和并行计算(如图像渲染、深度学习和密码学等)。【专用】

NPU (Neural network Processing Unit)：神经网络处理器，具有高度优化的硬件和指令集，主要用于加速机器学习和人工智能应用。【专用】

算力单位TOPS

TOPS (Tera Operations Per Second)，表示每秒执行1万亿次(10^12)运算，用于衡量自动驾驶芯片的AI算力。

准确点讲，TOPS描述的是芯片MAC(Multiply Accumulate，乘积累加运算)的运算能力。

注意，TOPS并没有指定数据类型，具体算力评估需要结合数据类型及精度。

注意，TOPS不是衡量处理器的唯一标准，实际应用中还需要考虑处理器的功耗、内存带宽、存储容量等。

乘积累加运算MAC

乘积累加运算(Multiply Accumulate，MAC)包括相乘和相加两个过程(a←a+b*c)，实现该运算的专门硬件电路单元，被称为“乘数累加器”。这样用一个MAC指令就可以完成原来两个指令的操作。对于卷积运算、点积运算、矩阵运算、数字滤波器运算、乃至多项式的求值等运算而言，MAC指令可以大幅提高运算效率。如自动驾驶深度学习等算法的核心运算就是矩阵运算，矩阵运算可以分解为数个MAC运算，从而提升效率。

TOPS计算公式

TOPS计算公式如下：

理论峰值 = MAC矩阵行 * MAC矩阵列 * 主频 * 2

举例：

特斯拉的FSD芯片，96x96 MAC，主频2GHz

TOPS = 96 * 96 * 2000000000 * 2 = 36.864 TOPS

GPU算力TFLOPS

TFLOPS（Tera Floating-Point Operations Per Second），表示每秒执行一万亿次浮点运算。

TFLOPS计算公式如下：

理论峰值 = 单核单周期浮点计算次数 × 处理器核数 × 主频

举例：

GTX680，单核单周期浮点计算次数为两次，处理核个数为1536，主频为1006MHZ

TFLOPS = 2 × 1536 × 1006MHZ = 3.09TFLOPS

TFLOPS与TOPS的换算

1TFLOPS@FP16 ≈ 2 * 1TOPS@INT8

FP16: 半精度浮点数/16位浮点数

INT8: 8位整数精度

CPU算力DMIPS

DMIPS（Dhrystone Million Instructions Per Second，每秒处理的百万级的机器语言指令数），描述的是CPU的运算能力。自动驾驶中多传感器融合的滤波算法，激光点云的配准算法，多数的路径规划和决策算法与DMIPS密切相关。

DMIPS通过处理器CPU性能测试基准Dhrystone程序进行评分。

Reference:

乘积累加运算【无敌电动】洞悉新能源汽车的发展前景，把握电动汽车的发展趋势 (modiauto.com.cn)华为赋能自动驾驶，国内智驾产业发展加速 (dfcfw.com)

上一篇：结合RNN与Transformer双重优点，深度解析大语言模型RWKV

下一篇： Java | AI+编程 | 如何使用通义灵码提升开发效率

本文标签

自动驾驶芯片指标AI算力TOPS和CPU算力DMIPS

声明

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。