3月13日,美国加速生成式人工智能(AI)公司Cerebras Systems推出第三代超级AI芯片Wafer Scale Engine 3(WSE-3)。在相同的功耗和价格下,WSE-3的性能是之前纪录保持者Cerebras WSE-2的两倍,是全球最大的晶圆体AI芯片。集成5nm的4万亿晶体管的WSE-3专为训练业界最大的AI模型而打造,可赋能Cerebras CS-3 AI超级计算机,通过900,000个AI优化计算核心提供125 petaflops的峰值AI性能。
图片来源:Cerebras Systems
具体规格:4万亿个晶体管;90万个AI核心;125 petaflops的峰值AI性能;44GB片上SRAM;5纳米台积电工;1.5TB、12TB或1.2PB外部存储器;训练多达24万亿个参数的AI模型;集群规模高达2048个CS-3系统。
CS-3拥有高达1.2 PB的巨大内存系统,旨在训练比GPT-4和Gemini大10倍的下一代前沿模型。2万亿个参数模型可以存储在单个逻辑内存空间中,无需分区或重构,从而极大地简化了训练工作流程,并提高了开发人员的工作效率。在CS-3上训练1万亿个参数模型就像在GPU上训练10亿个参数模型一样简单。
CS-3专为满足企业和超大规模需求而构建。紧凑的四系统配置可以在一天内微调70B模型,同时使用2048个系统进行全面调整,Llama 70B可以在一天内从头开始训练——这对于生成AI而言是前所未有的壮举。
最新的Cerebras软件框架(Software framework)为PyTorch 2.0和最新的AI模型和技术(如多模态模型、视觉转换器、专家混合和扩散)提供原生支持。Cerebras仍然是唯一为动态和非结构化稀疏性提供本机硬件加速的平台,将训练速度提高了8倍。
Cerebras首席执行官兼联合创始人Andrew Feldman表示:“八年前,当我们开始这一旅程时,每个人都说晶圆级处理器是一个白日梦。我们非常自豪能够推出WSE-3,这是世界上最快的AI芯片,专为最新的尖端AI工作而设计,从专家混合到24万亿个参数模型。我们很高兴将WSE-3和CS-3推向市场,以帮助解决当今最大的人工智能挑战。”