目前大部分的模型架构都是decode-only(casualLM),少量的有encode-decode,encode-only,为啥大部分LLM是decode-only的,原因可能是以下几点:从mask的角度看...
浏览 60 次 标签: 一文读懂AI大模型:从入门到精通的全景解析