- NeRF输入文本即可编辑3D场景!ETH联合谷歌提出文本驱动的生成对象框架InseRF本文介绍一篇来自苏黎世联邦理工学院和谷歌合作完成的论文,本文提出了一种全新的三维编辑框架,称为InseRF
- AI解读视频张口就来?这种「幻觉」难题Vista-LLaMA给解决了Vista-LLaMA 在处理长视频内容方面的显著优势,为视频分析领域带来了新的解决框架。
- 弥合化学反应预训练和条件分子生成之间的差距,北大&望石智慧提出「统一」模型近日,来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。
- 简化版Transformer来了,网友:年度论文从大模型的根源开始优化。
- 生成的分子几乎 100% 有效,用于逆向分子设计的引导扩散模型本文提出一种用于逆向分子设计的引导扩散模型:GaUDI,它结合了用于属性预测的等变图神经网络和生成扩散模型。
- NeurIPS 2023 | 用扩散模型构建语义分割新数据,直接替代传统人工标注本文作者提出了类提示叠加和自注意力求幂模块来构成同时生成图像和标签的pipeline。
- NeurIPS 2023 | 动态组合模型来应对数据分布的变化OneNet的思想十分简单,它采用了两个不同的模型,一个模型专注于建模时间维度上的相关性,另一个模型专注于建模跨变量之间的依赖关系。
- 将专家知识与深度学习结合,清华团队开发DeepSEED进行高效启动子设计清华大学的研究团队引入了 DeepSEED,这是一种人工智能辅助框架,可通过将专家知识与深度学习技术相结合来有效地设计合成启动子。
- 自动驾驶数据不用愁!港中文等发布MagicDrive:日夜、雨晴、多视角全覆盖,人、物位置随意变更MagicDrive可以细粒度生成高保真、多相机街景,可以随意变换天气、光照条件以及人物位置,海量自动驾驶数据触手可及!
- 更通用、有效,蚂蚁自研优化器WSAM入选KDD Oral蚂蚁 AI Infra 团队在深度学习最核心之一的优化器方向持续投入与创新,实现了 AI 训练节约资源、加速收敛、提升泛化等目标。