不受窗口长度限制的长文本生成全新思路:利用模型参数储存上文信息
将上文信息储存在模型参数中,而不是KV cache中,来降低对KV states的依赖。AAAI 2024 | Adobe提出全新上下文提示学习框架CoPL,高效提升下游性能
本文介绍一篇发表在人工智能顶级会议AAAI 2024上的文章,本文提出了一种称为上下文提示学习的框架CoPLNeRF输入文本即可编辑3D场景!ETH联合谷歌提出文本驱动的生成对象框架InseRF
本文介绍一篇来自苏黎世联邦理工学院和谷歌合作完成的论文,本文提出了一种全新的三维编辑框架,称为InseRFAAAI 2024 Oral | 小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值
论文提出并验证了负样本在大模型蒸馏过程中的价值,构建一个模型专业化框架:除了使用正样本外,还充分利用负样本来提炼 LLM 的知识。NUS尤洋团队联合MIT/上海AI Lab等提出首个无损数据集蒸馏方法DATM
作者提出了第一个可以在低压缩率保持有效的数据集蒸馏方法,并首次实现了无损数据集蒸馏。NeurIPS 2023 Spotlight | 用于真实图像去模糊的层次结合扩散模型HI-Diff
本文介绍了一种新型图像去模糊模型——分层集成扩散模型(HI-Diff)。腾讯ARC Lab联合NUS发布M2UGen:基于LLM的多模态音乐理解与生成框架
本研究成果M2UGen致力于将LLM和音乐理解与音乐生成技术相结合,构建一个统一的多模态音乐AI辅助工具,希望能为音乐创作领域带来新的启示和突破。ICLR 2024 Oral | GitHub狂揽30k星,MetaGPT:嵌入SOPs显著增强多智能体协作能力
LLM Agent领域第一高分论文,全网Star数最高的多智能体框架。AAAI 2024 | 场景图知识增强多模态结构化表示能力
本文提出了Structure-CLIP,旨在整合场景图知识来增强多模态结构化表示。大模型视觉理解能力更进一步,谷歌提出全新像素级对齐模型PixelLLM
本文的研究团队深入探索了LLM在视觉嵌入空间的运行机制,并提出了一种可以将位置信息作为输入或输出的视觉语言模型,称为PixelLLM(像素大模型)。EMNLP 2023 Oral | ToViLaG:多模态生成模型毒性分析、评价及去毒
本文深入研究了各种VLGMs毒性生成的倾向性和对毒性数据的易感性。深入探索CoT有效性和推理步长对于LLM性能的影响
我们设计了扩展和压缩 CoT 的例子中的基本原理推理步骤的实验,同时保持所有其他因素不变,然后得到了一些很有趣的结论。消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型
谷歌和威斯康星麦迪逊大学的研究人员推出了一个让LLM给自己输出打分的选择性预测系统LLM会写代码≠推理+规划!AAAI主席揭秘:代码数据质量太高|LeCun力赞
亚利桑那州立大学教授揭秘代码生成质量高的原因:语言模型是一个近似检索器,GitHub代码质量高,而文本数据中价值观冲突太多,仅此而已!NeurIPS 2023精选回顾:大模型最火,清华ToT思维树上榜
美国著名科技播客Latent Space对于刚刚过去的NeurIPS 2023上的精彩论文进行了一个全面的总结,回顾了多篇优秀论文LLM巫师,代码预训练是魔杖!UIUC华人团队揭秘代码数据三大好处
如果语言模型是巫师,代码预训练就是魔杖!无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务
使用LLM生成海量任务的文本数据,无需人工标注即可大幅提升文本嵌入的适用度,只需1000训练步即可轻松扩展到100种语言。360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
无需标注数据,3DHM框架即可让照片动起来,模仿目标视频动作,衣服动起来也真实!Nature 子刊 | 化学家和机器人都可以读懂,用于机器人合成可重复性的通用化学编程语言
本文提出了一种方法,使用通用化学编程语言(χDL)在两个实验室的四种不同硬件系统上编码和执行各种化学反应的合成程序普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估
本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。
每日邀请码
赞助商位
热门排行榜
一文学会如何评估机器学习
你离开学只差这个视频:李宏毅机器学习2020版正式开放上线
- 让PyTorch更轻便,这款深度学习框架你值得拥有!GitHub 6.6k星2020-07-15 09:38
- Facebook工程师教你什么是随机森林,就算零基础也可以看懂 | 干货2020-08-01 18:10
- 用「最好的语言」PHP,做一个机器学习数据集2021-07-10 13:53
- 15年!NumPy论文终出炉,还登上了Nature2020-09-18 08:26
- 北大95后「AI萝莉」回来了,一次中8篇顶会论文的她,现在达摩院开源7大NLP模型2021-06-25 22:46
- Swin Transformer为主干,清华等提出MoBY自监督学习方法,代码已开源2021-07-10 13:53
- 用Python写出Gameboy模拟器,还能训练AI模型:丹麦小哥的大学项目火了2020-05-12 14:15
- 7 天用 Go 从零实现开源项目系列推荐2020-05-16 14:15