新智元的文章列表_AIHub

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。
二维码

自定义二维码
网站

自定义网站或网址

消灭「幻觉」！谷歌全新ASPIRE方法让LLM给自己打分，效果碾压10x体量模型

谷歌和威斯康星麦迪逊大学的研究人员推出了一个让LLM给自己输出打分的选择性预测系统
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 1097
LLM会写代码≠推理+规划！AAAI主席揭秘：代码数据质量太高｜LeCun力赞

亚利桑那州立大学教授揭秘代码生成质量高的原因：语言模型是一个近似检索器，GitHub代码质量高，而文本数据中价值观冲突太多，仅此而已！
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 1026
NeurIPS 2023精选回顾：大模型最火，清华ToT思维树上榜

美国著名科技播客Latent Space对于刚刚过去的NeurIPS 2023上的精彩论文进行了一个全面的总结，回顾了多篇优秀论文
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 1197
LLM巫师，代码预训练是魔杖！UIUC华人团队揭秘代码数据三大好处

如果语言模型是巫师，代码预训练就是魔杖！
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 1264
无需人工标注！LLM加持文本嵌入学习：轻松支持100种语言，适配数十万下游任务

使用LLM生成海量任务的文本数据，无需人工标注即可大幅提升文本嵌入的适用度，只需1000训练步即可轻松扩展到100种语言。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 1327
360度无死角！UC伯克利华人发布3DHM框架：一张图片即可模仿任意视频动作

无需标注数据，3DHM框架即可让照片动起来，模仿目标视频动作，衣服动起来也真实！
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 1021
谷歌MIT最新研究证明：高质量数据获取不难，大模型就是归途

数据获取最新解，便是从生成模型中学习。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 474
视频场景图生成任务新SOTA！中山大学提出全新时空知识嵌入框架，登顶刊TIP'24

STKET框架将先验时空知识纳入多头交叉注意机制中，从而可以学习到更多有代表性的视觉关系表示，在视频图生成基准上大幅领先其他算法。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 575
AI看图猜位置，准确率超90%！斯坦福最新PIGEON模型：40%预测误差不到25公里

在社交媒体上发照片要谨慎了，AI工具一眼就能识破你的位置！
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 496
性能大涨20%！中科大「状态序列频域预测」方法：表征学习样本效率max｜NeurIPS 2023 Spotlight

SPF算法是一种基于状态序列频域预测的表征学习方法，利用状态序列的频域分布来显式提取状态序列数据中的趋势性和规律性信息，从而辅助表征高效地提取到长期未来信息。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 708
「文生图」再升级！学习个性化参照，无限生成多样图片，轻松设计玩具建筑

将图片集反演到语义空间的分布，生成多样个性化图片或3D渲染，支持灵活文本编辑、多样性控制、概念混合等。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 436
扩散模型图像理解力刷新SOTA！字节复旦团队提出全新「元提示」策略

过去一年扩散模型风头正劲，彻底改变了文生图领域！那么，扩散模型能否处理视觉感知任务？字节跳动和复旦大学技术团队在最新研究中提出了一个简单有效的方案。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 660
ConvNet与Transformer谁更强？Meta评测4个领先视觉模型，LeCun转赞

当前的视觉模型哪个更好？Meta团队最新一波研究来了。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 470
几何纹理重建新SOTA！浙大提出SIFU：单图即可重建高质量3D人体模型

最近来自浙江大学ReLER实验室的研究人员提出SIFU模型，一种侧视图条件隐函数模型用于单张图片3D人体重建。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 391
马毅LeCun谢赛宁曝出多模态LLM重大缺陷！开创性研究显著增强视觉理解能力

来自纽约大学和UC伯克利的研究团队成功捕捉到了多模态大模型在视觉理解方面存在的重大缺陷。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 579
AI抢攻人类奥赛金牌！DeepMind数学模型做对25道IMO几何题，GPT-4惨败得0分

谷歌DeepMind的AlphaGeometry模型登上了Nature！
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 623
200亿「书生·浦语2.0」正式开源！数推性能比肩ChatGPT，200K超长上下文完美召回

新一代国产开源大语言模型来了！200K超长上下文「完美」支持，20B版本综合性能全面领先。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 810
微软祭出代码大模型WaveCoder！4项代码任务2万个实例数据集，让LLM泛化能力飙升

指令调优或许是让大模型性能提升最有潜力的方法。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 627
放射科医生再临危机！国外五大机构联合发布「胸部X光」最新基准

「胸部X光」数据集迎来重大变化：包含了医学图像的严重度及医生诊断的不确定度，文中还提出了一种用于CXR疾病分类的解剖结构感知的多关系图学习方法。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 427
一部iPhone实时渲染300平房间，精度达厘米级别！谷歌最新研究证明NeRF没死

3D实时渲染又要进入新时代了！谷歌团队最新研究SMERF能够在手机、电脑上实时渲染大型3D场景。
- 赞同 0
- 反对 0
- 专注 0
- 评论 0
- 浏览 515

反馈