标签：awaker

智子引擎开源多模态MoE大模型，实现高效模型容量扩展

转载整理自智子引擎量子位 | 公众号 QbitAI随着多模态大模型的快速发展，当前主流多模态大模型具备完成多种任务的能力（图文描述、视觉问答、文字识别、图标理解、目标检测等）。但是，这些不同的多模态任务往往具有完全不同的数据分布，导致在模型训练过程中遇到“多 ......