关于为什么多模态大模型中使用Q-Former的工作变少了？附Q-Former结构简介的资讯_为什么多模态大模型中使用Q-Former的工作变少了？附Q-Former结构简介相关的资讯

2024-08-25 17:01:01

面试中遇到的问题，自己在实践中注意到了却没有深究原因，没有回答好，特此记录和探讨这个问题。多模态大模型中需要一个输入投影模块，将视觉特征投射到LLM能理解的语言特征维度，这里就可以选择各种不同的模块。LLaVA最初...