Beta
首页
社区
技术
Open AI
搜索
登录 / 注册
编辑
视觉语言模型
(这个标签还没有简介,来参与编辑吧)
文章数
7
帖子数
0
最新创建
功能差体验差
声音模型
1122
模型调优
重复次数
TempLora
动态提示
上下文提示学习
CoPL
三维编辑
InseRF
动态自洽性
负向校准增强
负向协助训练
负样本
大模型蒸馏
DATM
无损数据集蒸馏
HIDiff
分层集成扩散模型
音乐生成
多模态音乐理解
M2UGen
SOPs
MetaGPT
多智能体协作
多模态结构化表示
场景图知识
数字生命
像素大模型
相关文章
AAAI 2024 | 场景图知识增强多模态结构化表示能力
将门
· 赞同
0
大模型视觉理解能力更进一步,谷歌提出全新像素级对齐模型PixelLLM
将门
· 赞同
0
强化学习与视觉语言模型之间的碰撞,UC伯克利提出语言奖励调节LAMP框架
将门
· 赞同
0
语言模型做先验,统一强化学习智能体,DeepMind选择走这条通用AI之路
机器之心
· 赞同
0
南洋理工大学最新视觉语言模型综述:预训练、迁移学习和知识蒸馏啥都有
机器之心
· 赞同
0
李飞飞「具身智能」新成果!机器人接入大模型直接听懂人话,0预训练就能完成复杂指令
机器学习算法与自然语言处理
· 赞同
0
终结者最强大脑!谷歌发布史上最大「通才」模型PaLM-E,5620亿参数,看图说话还能操控机器人
新智元
· 赞同
0
相关帖子
还没有相关数据
反馈
反馈列表
快速反馈
添加中文文档