- 一个有情怀的自媒体账号。机器学习、自然语言处理、算法等知识集中营、期待与你相遇~二维码自定义二维码网站自定义网站或网址
如何高效部署大模型?CMU最新万字综述纵览LLM推理MLSys优化技术
该综述不仅是对当前 LLM 服务优化研究的全面概述,也为未来在这一领域的探索和发展指明了方向。vLLM皇冠上的明珠:深入浅出理解PagedAttention CUDA实现
当前,在大模型推理框架领域,vLLM 以其卓越的高吞吐性能和简洁易读的代码而备受瞩目,已经成为许多团队二次开发的首选。深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐
现在,复旦团队进一步挖掘 RLHF 的潜力,重点关注奖励模型(Reward Model)在面对实际应用挑战时的表现和优化途径。微软最新研究成果:使用GPT-4合成数据来训练AI模型,实现SOTA!
最近,微软发布了一种新颖的文本嵌入方法,使用专有的LLMs为93种语言中各种文本嵌入任务生成合成数据,并且涉及了多个任务场景。搜索引擎对AIGC更加偏爱!AIGC会淹没UGC吗?
「AIGC的繁荣会淹没UGC吗?」专补大模型短板的RAG有哪些新进展?这篇综述讲明白了
这份工作为研究人员绘制了一幅清晰的 RAG 技术发展蓝图,指出了未来的研究探索方向。语言模型是如何感知时间的?「时间向量」了解一下
时间变化在一定程度上被编码在微调模型的权重空间中,并且权重插值可以帮助自定义语言模型以适应新的时间段。AI解读视频张口就来?这种「幻觉」难题Vista-LLaMA给解决了
Vista-LLaMA 在处理长视频内容方面的显著优势,为视频分析领域带来了新的解决框架。GPT-5前瞻!艾伦人工智能研究所发布最强多模态模型,预测GPT-5新能力
艾伦人工智能研究所推出的Unified-IO 2是第一个可以处理和生成文本、图像、音频、视频和动作序列的模型。多轮对话推理速度提升46%,开源方案打破LLM多轮对话的长度限制
在大型语言模型(LLM)的世界中,处理多轮对话一直是一个挑战。奋战一年,LangChain首个稳定版本终于发布,LangGraph把智能体构建为图
著名的大模型智能体工具,现在有大版本更新了。面向表格数据的大模型推理综述
我们在本文对现有的基于LLM的表格推理相关工作进行梳理,来促进该领域上的研究。东北大学NLP Lab&小牛翻译 “自然语言处理视角下的Transformer”
全文共119页,从自然语言处理的角度,全面介绍了Transformer模型的基础知识和其在自然语言处理应用中的进展EMNLP2023|大语言模型知识编辑问题、方法与挑战
本文初步探讨了大语言模型知识编辑相关的问题、方法和机遇。从大脑活动中解码自然语言:任务与前沿方法
语言不仅是人类交流的工具,更是思维和智能的基础。大脑如何解码和处理语言信息是揭示人类智能本质的关键。“离谱的AI扩图”火了!张张那叫一个出其不意
家人们,真的是要被抖音AI扩图给笑死了——思维链提出者Jason Wei:关于大模型的6个直觉
大模型究竟从下一个词预测任务中学到了什么呢?PyTorch团队重写「分割一切」模型,比原始实现快8倍
我们该如何优化 Meta 的「分割一切」模型,PyTorch 团队撰写的这篇博客由浅入深的帮你解答。全网大讨论:引爆OpenAI全员乱斗的Q*到底是什么?
强大到能威胁人类,所以不得不把自家 CEO 开了?提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点
最近,来自北大的研究人员提出了一种全新的视觉语言大模型——Video-LLaVA,为alignment before projection提供了新颖的解决方案。