登录社区云,与社区用户共同成长
邀请您加入社区
请点击以下链接观看全部活动视频:NVIDIA英伟达的个人空间-NVIDIA英伟达个人主页-哔哩哔哩视频
请点击以下链接观看全部活动视频:
NVIDIA英伟达的个人空间-NVIDIA英伟达个人主页-哔哩哔哩视频
分享最新的 NVIDIA AI Software 资源以及活动/会议信息,精选收录AI相关技术内容,欢迎大家加入社区并参与讨论。
更多推荐
重塑 AI 基础设施 第三届 NVIDIA DPU 黑客松竞赛结果出炉
突破延迟极限:在 NVIDIA Blackwell GPU 上优化 DeepSeek-R1 的性能
在延迟敏感型应用中突破 DeepSeek R1 的性能极限是一项非凡的工程。本文详细介绍的优化措施是整个 AI 技术栈各个领域的协作成果,涵盖了内核级优化、运行时增强、模型量化技术、算法改进以及系统性能分析与调优。希望本文介绍的技术和最佳实践,能够帮助开发者社区在任务关键型 LLM 推理应用中更充分地发挥 NVIDIA GPU 的性能。
NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B推理加速
未来,NVIDIA 技术专家团队将继续跟进混元模型的演进,探索更极致的推理加速技术(如新一代量化、更精细的算子融合、对 Blackwell 新特性的支持),不断刷新性能天花板。同时还将持续推动 TensorRT-LLM 与腾讯云 TI 平台、Hunyuan API 服务等生态的深度集成,提供更便捷的一站式混元模型部署与管理体验。
扫一扫分享内容
所有评论(0)