斯坦福提出首个开源视觉语言动作大模型OpenVLA

现有的VLA(Vision-Language-Action)模型具有这些局限性:1)大多封闭且开放;2)未能探索高效地为新任务微调VLA的方法,而这是VLAs被采用的关键组成部分。为此本工作开发了OpenVLA...