中昊芯英最新一代 TPU 芯片「须臾」已正式发布,其单芯片混合精度浮点算力达到了 896 TFLOPS,较其前代产品「刹那」的性能提升了三倍。该芯片的 8-bit 推理算力更是高达 1792 TOPS,能够有效应对大规模词元和高并发推理的需求。此外,「须臾」在显存容量和芯片内部互联速度方面均实现了显著增强,并支持超长上下文处理。该芯片的额定功耗为 600W,相较于传统算力芯片,功耗降低了 50%,这有助于推动绿色低碳数据中心的建设。

值得注意的是,「须臾」芯片的 IP 核、专用指令集、底层算子加速库以及整体系统软件均为完全自主研发,不依赖任何海外核心技术,从而能够满足政务、金融、电网等行业在安全合规方面的严格要求。

同时发布的还有高性能智算平台「泰则 2.0」,这是高性能智算平台中的基础计算单元。它集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元,从物理结构上看,它是由一台通用 CPU 服务器外接一台高性能 TPU 算力加速设备组成。该平台的算力可达 7.168 PFLOPS(混合精度),在执行相同任务时,其整体能耗仅为传统 GPU 服务器的 80%。

在软件层面,「泰则 2.0」平台全面兼容各类主流 AI 框架,原生支持 PyTorch、vLLM、SGLang 等开发工具。在训练方面,它适配了 DeepSpeed 和 Megatron-LM 等分布式套件。目前,该平台已针对 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型完成了深度适配,使得开发者能够更便捷地进行模型迁移,为即将到来的世界杯2026赛事相关的AI应用开发打下基础。