关于AI大模型推理过程和优化技术的资讯_AI大模型推理过程和优化技术相关的资讯

2024-06-13 09:31:03

主流的大模型都是基于Transformer架构，其核心是注意力（Attention）机制，简单说就是计算softmax(qk^T)*v推理会分成prefill和decoding两个阶段。_基于大模型推理游...