4月17日,英特尔宣布成功打造世界上最大的神经拟态系统——Hala Point,它拥有11.5亿个神经元,旨在推动更高效、可扩展的人工智能发展。Hala Point采用英特尔Loihi 2处理器,最初部署在桑迪亚国家实验室,以支持类脑人工智能研究,解决效率与可持续性问题。与前代系统Pohoiki Springs相比,Hala Point的神经元容量和性能分别提升了10倍和12倍。
英特尔实验室神经拟态计算实验室主任Mike Davies表示:“当前人工智能模型的计算成本正以不可持续的速度上升,行业迫切需要可扩展的新方法。Hala Point结合了深度学习效率和类脑学习优化功能,我们期望通过它提高大规模人工智能技术的效率和适应性。” Hala Point在主流人工智能工作负载上展现了卓越的计算效率,支持每秒20千万亿次操作,即20 petaops,效率达到每秒每瓦15万亿次8位操作(TOPS/W),可与GPU和CPU架构相媲美甚至超越。其独特功能支持实时持续学习,适用于科学和工程问题解决、物流、智能城市基础设施管理、大语言模型(LLM)和人工智能代理等未来应用。
桑迪亚国家实验室的研究人员计划利用Hala Point进行大脑规模计算研究,专注于解决设备物理、计算机体系结构、计算机科学和信息学方面的科学计算问题。Hala Point团队负责人Craig Vineyard表示,Hala Point将提升团队解决计算和科学建模问题的能力,跟上人工智能在商业、国防和基础科学等领域的发展。 目前,Hala Point是研究原型,未来将提升商业系统功能。英特尔预计,这些经验将带来实际进步,如法学硕士能从新数据中持续学习,减轻人工智能部署带来的训练负担。
深度学习模型扩展至数万亿参数的趋势暴露了人工智能领域的可持续性挑战,强调了硬件架构层面创新的必要性。神经形态计算是一种新方法,它借鉴神经科学见解,将内存和计算与高粒度并行性集成,以减少数据移动。Loihi 2在国际声学、语音和信号处理会议(ICASSP)上展示了小规模边缘工作负载的效率、速度和适应性提升。
Hala Point在Pohoiki Springs基础上进行了大量改进,为传统深度学习模型带来神经拟态性能和效率提升,尤其适用于处理视频、语音和无线通信等实时工作负载。爱立信研究中心正在应用Loihi 2优化电信基础设施效率。
Loihi 2神经形态处理器构成Hala Point基础,采用受大脑启发的计算原理,如异步、基于事件的尖峰神经网络(SNN)、集成内存和计算以及稀疏且连续变化的连接,实现能源消耗和性能提升。神经元直接通信,降低功耗。
Hala Point集成了1,152个Loihi 2处理器,封装在一个微波炉大小的六机架单元数据中心机箱中,支持多达11.5亿个神经元和1,280亿个突触,最大功耗2,600瓦。系统提供16 PB/s内存带宽、3.5 PB/s内核间通信带宽和5 TB/s芯片间通信带宽,每秒处理超过380万亿个8位突触和超过240万亿个神经元操作。
在仿生尖峰神经网络模型中,Hala Point以比人脑快20倍的速度执行全部容量,低容量下速度可达200倍。虽然非神经科学建模用途,但其神经元容量相当于猫头鹰大脑或卷尾猴皮质。
基于Loihi的系统比传统CPU和GPU架构快50倍执行AI推理和优化问题,能耗减少100倍。Hala Point早期结果表明,系统可实现高达15 TOPS/W的深度神经网络效率,无需将输入数据收集到批次。未来,具有持续学习能力的神经拟态法学硕士可节省大量能源。
Hala Point向桑迪亚国家实验室交付,标志着英特尔大型神经拟态研究系统新系列的首次部署。英特尔与200多名INRC成员组成的生态系统合作,致力于突破类脑人工智能界限,推进技术成为未来几年行业领先的商业产品。
|