登录社区云,与社区用户共同成长
邀请您加入社区
写的太好了!!
从 PPO、DPO 到 GRPO:万字长文详解大模型训练中的三大关键算法
写的太好了!!!PPO和GRPO
分享最新的 NVIDIA AI Software 资源以及活动/会议信息,精选收录AI相关技术内容,欢迎大家加入社区并参与讨论。
更多推荐
NVIDIA 认证 | 高校师生专享:教师免费,学生 5 折考取 Associate 级别生成式 AI 认证
使用 NVIDIA TensorRT LLM 部署 MiniMax M2/M2.1 稀疏 MoE 大模型
NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展
扫一扫分享内容
所有评论(0)