- AAAI 2024 | Adobe提出全新上下文提示学习框架CoPL,高效提升下游性能本文介绍一篇发表在人工智能顶级会议AAAI 2024上的文章,本文提出了一种称为上下文提示学习的框架CoPL
- NeRF输入文本即可编辑3D场景!ETH联合谷歌提出文本驱动的生成对象框架InseRF本文介绍一篇来自苏黎世联邦理工学院和谷歌合作完成的论文,本文提出了一种全新的三维编辑框架,称为InseRF
- 无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用有鉴于此,上海交通大学生成式人工智能实验室 GAIR 迅速采取行动,推出了一种全新的价值对齐方法:OPO 。
- 全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步具身智能,首先就是要共用 AI。
- 为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用上海交通大学生成式人工智能实验室推出了「MathPile」。
- 新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度Lightning Attention-2 是一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。
- 三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型 AI 的一个光明的方向。
- 奥数能力金牌级:DeepMind几何推理模型登上Nature,代码开源,菲尔兹奖得主点赞这项工作代表了 AI 在数学推理上的能力突破,是开发通用 AI 系统方面的重要里程碑。
- UC伯克利提出视觉场景图加持的组合思维链大模型CCoT,有效提升模型场景交互理解能力本文针对这一问题,将场景图引入到多模态大模型领域,并且基于大模型思维链机制,提出了一种组合思维链的方法框架。
- 200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回新一代国产开源大语言模型来了!200K超长上下文「完美」支持,20B版本综合性能全面领先。