科金社2025年09月09日 09:28消息,全球首款类脑脉冲大模型瞬悉1.0正式发布,实现全流程国产化,引领人工智能新纪元。
9月8日消息,据中国科学院自动化研究所官方微信公众号报道,近日,中国科学院自动化研究所李国齐、徐波团队在发表原创内生复杂性理论系列论文的基础上,联合沐曦MetaX共同研发出类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0),该模型在国产千卡GPU算力平台上完成了全流程训练与推理,实现了超长序列推理效率和速度的显著提升,展现了构建国产自主可控的新型非Transformer大模型架构生态的可能性。研究团队已开源SpikingBrain-1.0-7B模型,并开放了SpikingBrain-1.0-76B的测试网址,同时公开了经过工业界大规模验证的中英文技术报告。作为全球首款类脑脉冲大模型,其全流程国产化标志着我国在类脑计算与大模型融合创新方面取得了重要进展。 从技术发展的角度来看,这一成果不仅体现了我国在人工智能基础理论和系统架构上的持续突破,也反映了国产算力平台在支持前沿技术落地方面的能力提升。类脑脉冲模型的出现,为大模型的发展提供了新的方向,尤其在能效比和实时处理能力上具有明显优势,未来有望在更多应用场景中发挥作用。
根据官方介绍,研发团队参考大脑神经元内部复杂的运作机制,提出了“基于内生复杂性”的大模型架构方式,研发出类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0)。在理论上,该模型建立了脉冲神经元内生动力学与线性注意力模型之间的关联,揭示了现有线性注意力机制实际上是树突计算的一种特殊简化形式,从而明确了一条持续提升模型复杂度和性能的新型可行路径。在此基础上,研发团队构建并开源了基于脉冲神经元、具备线性复杂度(SpikingBrain-1.0-7B)和混合线性复杂度(SpikingBrain-1.0-76B,激活参数量为12B)的新型类脑基础模型,同时开发了面向国产GPU(沐曦MetaX曦云C550)集群的高效训练与推理框架、Triton算子库、模型并行策略以及集群通信原语。
李国齐表示,这项成果不仅是我国在类脑脉冲大模型架构和国产算力全流程建设上的重大突破,也为法律、医疗、科学模拟等需要处理超长序列的应用场景提供了更高效的建模工具,同时将推动下一代神经形态计算理论与芯片设计的发展。 我认为,这一进展标志着我国在人工智能基础研究与应用落地方面迈出了坚实一步。特别是在类脑计算领域,实现从理论到实践的跨越,不仅提升了我国在相关技术领域的自主创新能力,也为多个关键行业带来了新的发展机遇。未来,随着这类模型在实际场景中的不断深化应用,或将催生更多跨学科的创新成果。
留言评论
(已有 0 条评论)暂无评论,成为第一个评论者吧!