- 腾讯ARC Lab联合NUS发布M2UGen:基于LLM的多模态音乐理解与生成框架本研究成果M2UGen致力于将LLM和音乐理解与音乐生成技术相结合,构建一个统一的多模态音乐AI辅助工具,希望能为音乐创作领域带来新的启示和突破。
- 「think step by step」还不够,让模型「think more steps」更有用本文对思维链的推理步长进行了控制变量实验,发现推理步长和答案的准确性是线性相关的,这种影响机制甚至超越了问题本身所产生的差异。
- Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效融合多个异构大语言模型,中山大学、腾讯 AI Lab 推出 FuseLLM
- 如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术该综述不仅是对当前 LLM 服务优化研究的全面概述,也为未来在这一领域的探索和发展指明了方向。
- 深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐现在,复旦团队进一步挖掘 RLHF 的潜力,重点关注奖励模型(Reward Model)在面对实际应用挑战时的表现和优化途径。
- 马毅LeCun谢赛宁曝出多模态LLM重大缺陷!开创性研究显著增强视觉理解能力来自纽约大学和UC伯克利的研究团队成功捕捉到了多模态大模型在视觉理解方面存在的重大缺陷。
- 首创pix2emb范式!NUS清华联合发布NExT-Chat:对话/检测/分割全能多模态大模型研究人员提出了一个全新的位置建模方式pix2emb,可以在多模态对话模型中指定位置输入来回答问题。
- 基础模型+机器人:现在已经走到哪一步了这篇综述论文总结了机器人领域使用的基础模型,目标是理解基础模型能以怎样的方式帮助解决或缓解机器人领域的核心挑战。
- AI研究也能借鉴印象派?这些栩栩如生的人竟然是3D模型创建逼真的动态虚拟角色,要么在训练期间需要准确的 3D 配准,要么在测试期间需要密集的输入图像,有时则两者都需要,也许 D3GA 是你需要的。
- 「唤醒」NPC,这家融资过亿的国内创企在做一种很新的游戏每次进入游戏,NPC 都说着不一样的台词,这将是一个怎样的世界?