登录社区云,与社区用户共同成长
邀请您加入社区
借助这些新模型,AI 智能体能够提高思考深度和工作效率,从而探索更广泛的选项、加速研究并在设定时限内提供更明智的结果。这意味着能够以更低成本取得更好的结果。Cosmos Reason 经过量身定制,可作为机器人视觉语言动作 (VLA) 模型的推理主干,或为机器人和智能汽车训练数据评论和注释提供支持,并赋予运行时视觉 AI 智能体在工厂或城市等环境中对时空理解和物理操作的推理能力。但是,非推理的 V
8 月 8 日,我受邀参加了在上海举办的 NVIDIA CWE 大会。作为一个正在企业内部推动 AI 落地的从业者,这场会议对我来说不仅是“充电”,更像是一场“解题会”。
在 AI 技术飞速发展的当下,开发者对 “深度交流” 的渴求早已超越了线上资料的碎片化获取,我们更需要能直面专家、碰撞实践经验的线下场景,尤其是优质的线下交流活动更是如此。这不,笔者有幸受邀参加了NVIDIA 专家面对面技术沙龙,它并非一场普通的公开会议,而是专为 AI 领域的从业者打造的深度闭门交流活动。
NVIDIA 深度学习培训中心(DLI)推出 Isaac Sim 基础课程系列,涵盖 8 门免费课程,系统介绍机器人仿真,ROS 2 集成,合成数据生成及 AI 赋能机器人开发等核心内容。课程概要:利用硬件在环(HIL)技术,结合仿真环境,ROS 2 集成与合成数据生成,将机器人从虚拟仿真过渡到真实世界部署。课程说明:2 学时 | 中文 | Linux,Isaac Sim,ROS 2,Python
开源 DeepSeek R1 模型的创新架构包含多头潜在注意力机制 (MLA) 和大型稀疏混合专家模型 (MoE),其显著提升了大语言模型 (LLM) 的推理效率。但要充分发挥这种创新架构的潜力,软硬件的协同优化也至关重要。本文将深入解析 NVIDIA 在基于 Blackwell GPU 的 TensorRT-LLM 框架内为 DeepSeek R1 吞吐量优化场景 (TPS / GPU) 开发的
OpenAI 发布了两个全新开放权重 AI 逻辑推理模型,为全球各个行业、规模的开发者、爱好者、企业、初创公司及政府机构带来前沿 AI 开发技术。由 NVIDIA 与 OpenAI 共同开发的开放模型和,展现了由社区驱动创新的力量,并凸显 NVIDIA 在推动全球 AI 普及中的关键作用。任何人都可以使用这两个模型开发和以及医疗和制造领域的突破性应用,甚至在 AI 驱动的新一轮工业革命发展过程中开
根据第三方在一系列行业标准逻辑推理及指令和函数调用任务基准测试中的评估,Llama Nemotron Super v1.5 在高等数学、编码、逻辑推理和对话指标上的表现优于其他开放模型,使其稳居 700 亿参数级模型榜首。该系列最新发布的 Llama Nemotron Super 48B v1.5 版本在保持高吞吐量和计算效率的情况下,显著提升了在数学、科学、编码、函数调用、指令跟随、对话等核心逻
同时,Amazon P6-B200 实例具有第五代 Tensor Core、FP4 加速和 2 倍于上一代的 NVIDIA NVLink 带宽,而由 NVIDIA GB200 NVL72 提供支持的 P6e-GB200 Ultra 服务器具有独特的扩展架构,可提供 130 TBps 的聚合全互联带宽,旨在加速混合专家模型 (MoE) 部署中广泛采用的专家并行解码操作所需的密集型通信模式。但是,随着
在打下坚实评估基础之后,您将学习一系列强大的定制技术,包括使用持续预训练注入新知识、通过监督微调教授新技能,以及使用直接偏好优化(DPO)使模型行为更符合人类偏好。最后,您将学习如何通过量化、剪枝和知识蒸馏等优化技术(基于 TensorRT-LLM 和 NeMo 框架)让您的定制模型在实际部署中高效运行。NVIDIA 深度学习培训中心(DLI)发布新课《为大语言模型添加知识》,提供了一个全面、实践
车载摄像头的图像信号处理器(ISP)是核心组件,负责将传感器原始数据转换为高质量图像。其核心功能包括拜耳转换、去噪、自动曝光/白平衡/对焦(3A算法)、低光增强、HDR处理等,以优化图像质量。ISP通过复杂的算法链(如坏点校正、黑电平补偿、镜头阴影校正等)处理RAW数据,最终输出标准格式图像供显示或自动驾驶系统使用。不同光照条件下的参数调优是保证成像质量的关键,但需耗费大量时间。随着自动驾驶发展,