人工智能_AIHub

AAAI 2024 | Adobe提出全新上下文提示学习框架CoPL，高效提升下游性能

本文介绍一篇发表在人工智能顶级会议AAAI 2024上的文章，本文提出了一种称为上下文提示学习的框架CoPL
NeRF输入文本即可编辑3D场景！ETH联合谷歌提出文本驱动的生成对象框架InseRF

本文介绍一篇来自苏黎世联邦理工学院和谷歌合作完成的论文，本文提出了一种全新的三维编辑框架，称为InseRF
无需训练实现价值观实时动态对齐：上交开源价值观对齐方法OPO，闭源与开源大模型均适用

有鉴于此，上海交通大学生成式人工智能实验室 GAIR 迅速采取行动，推出了一种全新的价值对齐方法：OPO 。
全世界机器人共用一个大脑，谷歌DeepMind已经完成了第一步

具身智能，首先就是要共用 AI。
为大模型恶补数学，上交开源MathPile语料库，95亿tokens，还可商用

上海交通大学生成式人工智能实验室推出了「MathPile」。
新一代注意力机制Lightning Attention-2：无限序列长度、恒定算力开销、更高建模精度

Lightning Attention-2 是一种新型的线性注意力机制，让长序列的训练和推理成本与 1K 序列长度的一致。
三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

对模型参数量的迷信、执念也许可以放下了，混合多个小模型也是未来构造对话型 AI 的一个光明的方向。
奥数能力金牌级：DeepMind几何推理模型登上Nature，代码开源，菲尔兹奖得主点赞

这项工作代表了 AI 在数学推理上的能力突破，是开发通用 AI 系统方面的重要里程碑。
UC伯克利提出视觉场景图加持的组合思维链大模型CCoT，有效提升模型场景交互理解能力

本文针对这一问题，将场景图引入到多模态大模型领域，并且基于大模型思维链机制，提出了一种组合思维链的方法框架。
200亿「书生·浦语2.0」正式开源！数推性能比肩ChatGPT，200K超长上下文完美召回

新一代国产开源大语言模型来了！200K超长上下文「完美」支持，20B版本综合性能全面领先。

加载更多

热门搜索

热门搜索