1. 首页 > 快讯

算力需求重心从训练转向推理 全球AI基础设施建设全面加速

  近日,老牌科技公司甲骨文(Oracle以单日大涨40%的行情表现震撼全球资本市场。原因在于该公司公布的2026财年**财季(2025年6月1日-8月31日业绩数据显示,公司云基础设施(OCI业务中的剩余履约义务(RPO同比增长359%,达到4550亿美元,其中近60%来自与OpenAI签署的5年3000亿美元推理算力订单。

  **头部云计算厂商业务负责人告诉**证券报记者,虽然这笔规模庞大的订单从签署到真正交付仍存在不确定性因素,但也向整个产业链传递了算力尤其是推理算力供不应求的明确信号,增强产业链坚定向AI和云领域投入的信心。

  算力需求结构改变

  根据甲骨文的判断,算力的需求结构已经从训练为主,向推理为主迁移。这也意味着AI已经从过去的模型研发训练进入到大规模产业化应用的新阶段。

  甲骨文**执行官Safra Catz表示,AI推理市场的规模将远超AI训练市场,目前市场上的推理算力正被耗尽。甲骨文凭借过去在企业数据库领域的**地位,使企业客户能在保障数据私密性的前提下,安全地结合私有数据与公有数据,利用大语言模型进行推理。

  基于此,甲骨文给出了极其乐观的业绩指引,预计公司2026年的云基础设施收入将同比增长77%,达到180亿美元。公司还表示,之后的四年里,公司云基础设施收入将分别增至320亿、730亿、1140亿和1440亿美元。

  **信息通信研究院云计算与大数据研究所副所长栗蔚认为,大模型推理应用,正在重塑云智算技术体系,成为推动智能化转型的核心引擎。她指出,算力结构转型正在从以训练为主,转向以推理为核心——当前70%以上算力用于集中式训练,未来70%以上算力将用于分布式推理。

  IDC此前也发布报告认为,AI算力有望在2025年进入“训推”拐点,即从训练驱动过渡到推理驱动。

  这种变化将意味着,大模型产业商业模式逐步由单纯的技术竞赛过渡到价值共享与产业落地,强调**推理技术与垂直应用场景结合以实现商业闭环。“从算力需求的结构性转换,到技术架构的深度重构,再到大模型推理服务质量的场景化演进,云智算技术正迈向从算力供给到智能赋能的新范式,为数字经济的**、普惠与可持续发展提供坚实技术支撑。”栗蔚表示。

  阿里云智能集团弹性计算、存储产品线产品负责人告诉记者,企业端对AI大模型的需求已经不再只是尝鲜,而是进入了生产化阶段。

  **数据局局长刘烈宏此前在国新办新闻发布会上介绍,截至今年6月底,我国日均Token消耗量已突破30万亿,1年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。

  沙利文**报告数据显示,**企业级大模型调用量大概占据了**整体市场的1/3,日均Token的消耗量约10.2万亿,较2024年底**363%。

  AI应用驱动云厂商业绩增长的逻辑在**同样得到验证。阿里巴巴**季度业绩显示,阿里云季度收入同比增长26%至333.98亿元,增速创三年新高,其中,AI相关收入连续八个季度实现三位数同比增长,带动公共云需求持续上升。

  AI基础设施全球战略角逐

  在AI应用牵引之下,AI Infra(AI Infrastructure,即AI基础设施的确定性进一步增强。AI Infra是支撑AI大模型从“概念”走向生产力的智能化底座。如今全球云厂商正全力抢占AI Infra这一战略制高点。

  AI云是AI Infra的重要构成。市场调研机构Omdia发布报告显示,生成式AI(GenAI带来AI云市场爆发,2025年上半年,**AI云市场规模达223亿元,预计2025年全年增长148%,到2030年市场规模将达到1930亿元。

  统计显示,BAT(百度、阿里、腾讯第二季度的资本开支合计达615.83亿元,同比上涨168%,**向AI基础设施与核心技术研发倾斜。阿里云宣布未来三年投入3800亿元用于云和AI硬件基础设施,**季度的资本开支达到386亿元,创历史新高。今年以来,阿里云新增启用8个数据**,分布在**、泰国、韩国、马来西亚、阿联酋和墨西哥,以满足全球客户对云和AI持续增长的强劲需求。

  海外科技巨头也在全力加码。摩根士丹利研报指出,2025年全球11大超大规模云厂商的资本支出将上调至4450亿美元,年增长率高达56%,较此前预期高出12个百分点。到2026年,初步共识预测为5180亿美元。

  仍需突破不少技术瓶颈

  伴随AI Infra领域“军备竞赛”愈演愈烈,万卡算力集群甚至更大规模的十万卡算力集群成为云厂商们的投资标配。

  “如何减少互联的效率损失,**限度提升整体的计算效率,对于运营大规模算力集群非常关键。”有专家指出。

  同时,该专家坦言,相比美国,我国算力芯片生态比较碎片化,有几十款算力芯片,不同的芯片对应不同的开发框架、软件栈以及算子库等,也给建设和运营万卡级算力集群带来诸多挑战。

  工业和信息化部副部长熊继军此前在2025**算力大会上表示,要加快突破GPU芯片等关键核心技术,扩大基础共性技术供给;深入开展算力强基“揭榜”行动,聚焦计算、存储、网络等**方向,加快新技术新产品应用推广。

  全链条创新是算力产业高质量发展的必由之路。

  **移动副总经理李慧镝此前也呼吁产业各方,围绕智算卡间互联、机间互联、AI应用跨架构迁移等关键方向,共同完善算力网络技术和标准体系。