本文简要介绍了device_map=\"auto\"等使用方法,多数情况下与CUDA_VISIBLE_DEVICES=1,2,3一起使用,可以简单高效的进行多卡分布式推理及训练计算,至于多机多卡场景,多用torc...
浏览 79 次 标签: 【AI大模型】Transformers大模型库(七):单机多卡推理之device_map