这份文件是一份关于英伟达(NVIDIA)GTC大会的跟踪报告,主要关注了英伟达在计算架构、AI生态以及相关软件服务方面的最新进展和发布。以下是报告的核心内容: 英伟达新架构Blackwell的发布: - Blackwell架构的B200 GPU拥有2080亿个晶体管,采用台积电4NP制程工艺。
- B200 GPU配备192GB的HBM3E内存,AI算力达到20 petaflops(FP4精度),相比上代H100的4 petaflops有显著提升。
- GB200超级芯片为大语言模型(LLM)推理负载提供30倍性能提升,同时将成本和能耗降低25倍。
- Blackwell架构GPU支持新的FP6格式,为AI计算提供更灵活高效的解决方案。
DGX SuperPOD的推出: - DGX GB200完整服务器结合了36颗NVIDIA Grace CPU和72块Blackwell GPU,通过第五代NVLink连接成超级计算机。
- DGX SuperPOD将八个GB200 NVL72合为一体,提供288个CPU、576个GPU、240TB内存和11.5 exaflops的FP4计算能力。
英伟达发布的多款软件服务: - 生成式AI微服务,供开发者在CUDA GPU系统中创建部署生成式AI助手。
- Project GROOT人形机器人项目和机器人大脑芯片Jetson Thor。
- Drive Thor芯片,赋能智能驾驶,提供每秒2000万亿次浮点运算性能。
- 技术助力全球生成式AI,包括Earth-2 API、量子计算平台、数字人技术等。
|