亚马逊云计算服务(AWS)在re:Invent 2024大会上正式发布新一代AI训练芯片Trainium2及其配套产品。这款芯片将为企业带来更高性能和更低成本的AI模型训练解决方案。 核心升级包括: - Trn2实例搭载16枚Trainium2芯片,算力达20.8千万亿次浮点运算
- Trn2 UltraServer整合64枚芯片,单系统算力提升至83.2千万亿次浮点运算
- 相比上一代GPU实例,性价比提升30-40%
应用部署方面,AWS与多家科技公司展开合作: - 与Anthropic合作打造Project Rainier,部署数十万枚Trainium2芯片
- Databricks将在Mosaic AI平台上应用该芯片
- Hugging Face将其集成至开发工具链
- Adobe、Poolside和高通等企业已开展早期测试
为优化芯片使用效率,AWS推出Neuron SDK开发工具包,支持JAX和PyTorch等框架,可直接对接Hugging Face超10万个模型。目前,Trn2实例已在美国俄亥俄州区域上线,UltraServer处于预览阶段。 AWS同时预告了制程更先进的Trainium3芯片,采用3纳米工艺,预计2025年底推出,性能将是Trn2的4倍。
|