2月3日,云天励飞在深圳举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI 推理芯片战略布局。面对人工智能从“基础模型构建”迈向“规模化应用落地”的重要转折点,公司宣布将核心研发资源集中于攻克大模型落地的成本壁垒,致力于通过底层架构创新,力争实现百万Tokens推理成本降低100倍以上的目标。
![]()
过去一年,全球算力产业的风向标已发生显著偏转,重心正加速向推理侧倾斜。谷歌在 2025年4月发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理与能效上的系统化优化。
与此同时,围绕“更低时延、更低成本”的推理芯片与系统能力,产业整合动作也在加速。2025年12月,英伟达与Groq达成非独占许可安排,并吸纳其核心工程人才团队加入,此举被视为强化推理与实时工作负载能力的关键布局。
阅读全文