传统基建——高速公路、高铁、机场和城市基础设施——构成了物理世界的连接动脉。如今,我国正开启轰轰烈烈的新基建浪潮。新基建涵盖信息、融合、创新三大基础设施,其内核是:以5G、数据中心为代表的数字底座,用智能技术升级传统设施的融合应用,以及支撑前沿研发的科教设施。
同时,人工智能的爆发式增长将电力供应推上了竞争舞台的中央——一个大型AI模型的训练耗电量可达数千甚至上万兆瓦时。“算电协同”应运而生,让算力任务主动向电价更低、绿电更足的区域迁移。最终目标,是建设一张像供电一样便捷的“智能算力网”,让高质量的token源源不断地在全社会流动,带来生产力的变革。
在这场多维度的竞赛中,阿里云作为全球在大模型、云和芯片三大领域均具备顶级实力的科技公司,正扮演关键角色。
数字底座:全栈自研的“算力发动机”
如果将算力网比作未来的“电力网”,那么阿里云的角色就不只是“卖电表”或“架电线杆”,而是从发电机组到输电网络的系统级构建者。
芯片层:平头哥“真武”的算力突破
2026年初,阿里旗下平头哥在官网公开了“真武810E”算力芯片,采用自研并行计算架构和片间互联技术,96G HBM内存,片间互联带宽达700GB/s。配合全栈自研软件栈,实现软硬结合,可广泛适用于各类大模型的训练与推理,如自动驾驶主流模型、生成类模型、多模态模型、感知类模型、搜推广模型等。
目前,真武PPU已在阿里云实现多个万卡集群部署。阿里云服务了小鹏汽车、新浪微博等400多家客户。截至2026年2月,真武PPU已经累计规模化交付47万片,60%以上被外部客户采用。大规模商用落地充分验证了真武PPU在真实复杂业务场景中优异的适应性和稳定性。
云操作系统:飞天(Apsara)
飞天是阿里云自主研发、国内唯一自研的云计算操作系统,编排调度百万级服务器,单集群调度规模超十万台,具备EB级数据存储能力,并通过CIPU率先实现虚拟化“0”损耗,提供业界领先的计算性能,建设一张具备AI技术服务能力、具有全球技术竞争力的云计算网络。
在AI大模型时代,真正决定集群性能上限的不是计算单元,而是连接这些单元的网络。阿里云采取端网融合的HPN架构,自研400G/800G智能网卡与51.2T/102T超大容量交换机,推出高性能通信库ACCL。新一代HPN 8.0采用多平面CLOS架构+IPv6 Native设计,支持单可用区数十万卡规模及跨地域RDMA互联。同时,UPN采用LPO/NPO全光互联技术,在单机柜内部构建光速通信网络,系统可用性提升3倍以上、成本降低30%。
算电协同:让算力跟着绿电跑
AI发展的能源消耗问题正从“背景噪声”升级为核心战略议题。中国信通院预测,2030年中国数据中心用电需求将达3000亿至7000亿千瓦时,占全社会用电量的2.3%至5.3%。算电协同——让算力任务主动寻找电价低、气候冷、绿电足的地方运行——成为破解“算力—电力—碳排放”不可能三角的关键钥匙。
算电协同2.0:多尺度协同范式
在第30届联合国气候变化大会(COP30)上,阿里云率先提出“算电协同2.0”智算数据中心新范式。在算力运营层面,通过AI驱动的动态调度,将计算任务智能转移至电力价格更优、绿电更充足的时段和地点;在算力规划层面,对重点区域的能源资源及电力可靠性进行充分评估,支撑业务发展的时空规划。
五绿体系与绿色数据中心
阿里云构建了涵盖绿色能源、绿色产品、绿色架构、绿色运营和绿色服务的“五绿体系”,为全球500万客户提供低碳解决方案。通过AI驱动的数字孪生技术优化运营,阿里云自建数据中心PUE可低至1.09,平均在1.2以下,处于亚洲行业领先水平。
阿里云在国内除了自建并运行位于乌兰察布、张家口、杭州、韶关、南通等地的五大超级数据中心,还在国家“东数西算”战略指引下,助力三大运营商打造绿色数据中心:
联合中国电信在韶关上线粤港澳大湾区首个“真武”万卡集群已上线,集群资源上架“广东电信算力超市”,面向中小企业提供按卡、按小时计费的算力零售服务。
联合中国移动参与“疆算入渝”工程,打造中国移动—阿里云智算中心,一期计划2026年底建成,满足重庆10万卡算力需求。两地已建成全国首个基于V2V视联网的跨省100G算力传输专线,双向时延32.4毫秒。
联合中国联通在青海建设三江源智算中心,该项目四期建成后总算力将达15万P。园区通过绿色微电网实现100%绿电供应,入选“国家绿色数据中心”“算力电力协同典型案例”。
AI竞争力:从“算力跑”到“Token跑”
在人工智能竞争成为新基建核心驱动力的今天,阿里云的竞争优势不仅体现在算力规模上,更体现在将算力高效转化为智能的全栈工程化能力。
在基础设施层,阿里云推出智能计算灵骏(PAI-灵骏),专为大模型训练、自动驾驶、科学智能等高密度算力需求设计。灵骏单集群可支撑十万卡协同工作,单任务支持万卡级训练,节点间通信延迟微秒级,万卡规模扩展线性度超96%。其全并行存储CPFS单集群吞吐最高达2TB/s、IOPS达3000万,彻底消除大模型训练中Checkpoint的性能瓶颈。灵骏还内置全链路故障自愈体系,故障恢复时间缩短80%,保障大规模集群7×24小时稳定运行。
在模型层,阿里云是国内最早开源自研大模型的“大厂”,也是全球唯一一家积极研发先进AI模型并且全方位开源的云计算厂商,业界率先实现“全尺寸、全模态”的全面开源。从2023年至今,阿里已开源400多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,千问大模型屡次斩获Chatbot Arena、司南OpenCompass等权威榜单“全球开源冠军”、“国产模型冠军”,多次登顶HuggingFace、Github的最热趋势榜单。目前,千问衍生模型数量已突破20万,千问在全球下载量超10亿。
在应用层,阿里云依托“大模型+云+芯片”全栈AI能力,以及与阿里商业生态的全面融合,继续在AI to B和to C方向齐发力。去年11月,阿里上线千问App,目前千问全端的MAU已突破3亿,AI智能体进入规模化办事时代;今年1月,阿里云上线全套OpenClaw云服务,用户可在阿里云轻量应用服务器或无影云电脑上快速启用OpenClaw,并按需调用阿里云百炼上一百多款千问系列模型;春节期间,阿里云百炼推出包含Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型API服务的最强Coding Plan;3月,阿里发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。
阿里云作为中国AI云市场的领军者,构建了从底层算力到上层应用的完整服务生态,成为名副其实的“Token工厂”。
结语:智能算力时代的头部玩家
AI时代,要让数据高效流动,让智能随时随地可用。阿里云在这场重构中扮演的角色,远不止于“提供云计算服务”。而是要提供智能算力,把算力变成高质量的Token, 快捷便利地输送到企业和用户手中,然后让token高效率利用起来,真正带来生产力的变革。
AI时代的竞争,离不开算力基础设施的竞争,更离不开 “每瓦电力产出多少智能”并能稳输送和高效利用为核心的“token经济学”竞争。阿里云等中国科技公司正积极参与这场全球竞争,并成为头部玩家。
【独家稿件及免责声明】本网注明转载文章中的信息仅供用户参考。凡注明来源“运输人网”的作品,未经本网授权均不得转载、摘编或使用。联系邮件:master@yunshuren.com
评论