Beta
首页
社区
技术
Open AI
搜索
登录 / 注册
编辑
强化学习
(这个标签还没有简介,来参与编辑吧)
文章数
30
帖子数
1
最新创建
中文官网
功能差体验差
声音模型
1122
模型调优
重复次数
TempLora
动态提示
上下文提示学习
CoPL
三维编辑
InseRF
动态自洽性
负向校准增强
负向协助训练
负样本
大模型蒸馏
DATM
无损数据集蒸馏
HIDiff
分层集成扩散模型
音乐生成
多模态音乐理解
M2UGen
SOPs
MetaGPT
多智能体协作
多模态结构化表示
场景图知识
数字生命
相关文章
性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight
新智元
· 赞同
0
NeurIPS 2023 | ContextWM:解锁世界模型的现实场景视频预训练
将门
· 赞同
0
RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶
机器之心
· 赞同
0
NeurIPS 2023 | 动态组合模型来应对数据分布的变化
将门
· 赞同
0
狂揽4k star,AI通过强化学习玩宝可梦,两万场后成功拿下
机器之心
· 赞同
0
独家|OpenAI超级对齐负责人Jan Leike:如何破解对齐难题?用可扩展监督
机器学习算法与自然语言处理
· 赞同
0
刺激,无人机竞速超越顶级人类玩家,强化学习再登Nature封面
机器学习算法与自然语言处理
· 赞同
0
大模型RLHF算法更新换代,DeepMind提出自训练离线强化学习框架ReST
将门
· 赞同
0
Transformer+强化学习,谷歌DeepMind让大模型成为机器人感知世界的大脑
机器之心
· 赞同
0
ICCV 2023 Oral | UniDexGrasp++:基于几何感知课程和迭代通用-专家策略学习的灵巧手抓取算法
将门
· 赞同
0
相关帖子
2021, 字节跳动强化学习团队招聘ing
埼玉老师
讨论
反馈
反馈列表
快速反馈
添加中文文档