登录社区云,与社区用户共同成长
邀请您加入社区
头歌人工智能 人工智能概述 答案 无解析第2关:人工智能的定义第3关:实现人工智能的方法第4关:人工智能的进展
分享最新的 NVIDIA AI Software 资源以及活动/会议信息,精选收录AI相关技术内容,欢迎大家加入社区并参与讨论。
更多推荐
什么是“物理AI”?
利用物理 AI,自主机器能够感知、理解并在现实 (物理) 世界中执行复杂的操作。物理 AI 是指使用运动技能理解现实世界并与之进行交互的模型,它们通常封装在机器人或等自主机器中。
突破延迟极限:在 NVIDIA Blackwell GPU 上优化 DeepSeek-R1 的性能
在延迟敏感型应用中突破 DeepSeek R1 的性能极限是一项非凡的工程。本文详细介绍的优化措施是整个 AI 技术栈各个领域的协作成果,涵盖了内核级优化、运行时增强、模型量化技术、算法改进以及系统性能分析与调优。希望本文介绍的技术和最佳实践,能够帮助开发者社区在任务关键型 LLM 推理应用中更充分地发挥 NVIDIA GPU 的性能。
NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B推理加速
未来,NVIDIA 技术专家团队将继续跟进混元模型的演进,探索更极致的推理加速技术(如新一代量化、更精细的算子融合、对 Blackwell 新特性的支持),不断刷新性能天花板。同时还将持续推动 TensorRT-LLM 与腾讯云 TI 平台、Hunyuan API 服务等生态的深度集成,提供更便捷的一站式混元模型部署与管理体验。
扫一扫分享内容
所有评论(0)