2025开放计算技术大会|开源开放推动系统创新 加速AIDC全球协作

砍柴网  •  扫码分享

8月7日,2025开放计算技术大会在北京举行。大会聚焦在MoE大模型与AI智能体的技术发展趋势下,如何以开放计算更好的促进纵向扩展性能(Scale up)与横向扩展效率(Scale out)的协同发展。当前,模型算法开源、算力系统开放,已经成为AI时代一个主流趋势,开源开放的全球化协作平台正发挥越来越重要的作用,既能以系统化思维,通过提升单系统性能,满足万亿参数大模型发展的需求;又能应对日益扩张的数据中心规模,通过全球产业链协作解决未来GW级AI数据中心面临的系统性工程挑战。

2025开放计算技术大会由开放计算社区OCP及开放标准组织OCTC(中国电子工业标准化技术协会开放计算标准工作委员会)联合主办,以“开放变革:筑基、扩展、进化”为主题,聚焦计算、存储、网络、液冷等基础设施底层架构的技术创新,算法与算力系统、硬件和软件的协同创新,以及开放计算技术赋能人工智能热门应用等议题,来自中国移动、字节跳动、阿里云、三星、浪潮信息、清华大学、立讯技术等超千位知名学者、技术专家、应用开发者及厂商代表参与大会。

2025开放计算技术大会|开源开放推动系统创新 加速AIDC全球协作

开源开放加速 全球化协作,推动AI普惠

开源大模型(如Llama3、DeepSeek、Qwen、GLM、MiniMax)的意义已超越技术本身,深刻重塑全球AI产业格局和发展路径。它们大幅降低了获取、部署和定制先进AI能力的门槛,使各类企业与个人开发者都能便捷利用顶尖技术,推动研发范式从封闭走向开放协作,显著降低技术壁垒,加速实现“智能平权”。与之伴生的是,公共云平台和模块化AI基础设施的普及,为开源模型的规模化落地和应用创新提供了至关重要的开放算力基础。这种开源模型与开放算力的结合,会有效驱动海量长尾应用爆发,进一步加速AI普惠的实现。

OCP基金会高级总监Michael Schill 表示,“过去的十数年间,开放计算项目(OCP)所建立的全球化协作创新模式成功开发及实施了数以百计的项目,在极大激发创新活力的同时也重塑着数据中心产业。随着AI日益成为社区成员关注的核心场景,OCP的工作重心正转向AI主导,所有核心工作围绕着AI开放系统(Open Systems for AI)战略计划展开,包括数据中心物理基础设施、数据中心IT基础设施和系统管理三个重点领域,并且发布了《可扩展基础设施的蓝图》,这是AI开放系统战略计划当中的重要工作成果。”

OCTC秘书长陈海 认为:“产业协同创新要从应用出发、从用户思维出发,坚持标准引领产业发展,制定更切实落地的规范标准,推动和加速数据中心各领域的技术创新与成果普惠,让更多的组织和个人从中获益。例如,面向多元计算资源组合和多应用场景的服务器算力算效评估基准,就是通过系统评估服务器整机的综合算力与能效表现,为行业提供科学、可信的算力算效评估体系,为用户服务器架构选型和优化提供标准范式。”

针对指数级增长的智算需求,OCTC与OCP聚焦现阶段用户需求与产业技术方向,正在探讨如何加强双方在开放算力、液冷等方面的合作,两大社区的互通合作将形成一个更加融通的、更多地区、国家和行业通行的国际化标准,让底层技术实现全球共享,加速技术普惠。

2025开放计算技术大会|开源开放推动系统创新 加速AIDC全球协作

聚焦当下:创新超节点架构凸显 产业链融合创新 之力

毋庸置疑,开放计算的兴起与日益壮大,使得数据中心产业链的协同效应更紧密、融合创新能力更强,这一点对于飞速迭代的AI产业至关重要。

目前,MoE大模型的参数量仍在保持高速增长且迭代迅速,对单系统的算力密度与互联速率提出极致要求,带动了计算架构的变革。此次大会重点探讨并集中展示了创新的超节点计算架构,在高速互联、通信协议、内存控制、系统架构设计等层面实现全维度创新,能够满足万亿级别参数MoE大模型应用需求,凸显出开放计算的产业链融合创新之力。

2025 OCTC轮值主席、中国移动通信有限公司研究院副院长段晓东指出,MoE大模型持续推高大算力,仍然是今天的时代主题,产业将会很快迈入以超节点这种网络和算力、软件和硬件全面协同优化的一个时代。超节点打破了传统服务器的物理边界,触发了系统性变革,互联技术成为提升集群有效算力的关键。随着卡间互联技术的发展,开放互联架构将在下一代智算集群中发挥重要作用。

阿里云基础设施异构硬件和系统资深总监卢晓伟表示,超大规模MoE带来了AI基础设施的算力、互联、能耗瓶颈,以及可靠性和稳定性的挑战,需要为AI重构算力系统,Scale Up 超节点架构将成为核心发展路径。超节点架构所需的关键技术包括原生语义、极致带宽、极低时延和高可靠的链路,软硬件协同是命脉。

三星电子副总裁、先行开发团队负责人张实完表示,MoE大模型带来的超高数据传输需求,驱动内存在高性能、高密度、散热管控、安全性等方向持续演进。未来,超节点架构将会采用GPU发起式直连内存,通过GPU友好型介质与存储,有效减少内存瓶颈,为大模型训练推理提供强力支持。

字节跳动服务器架构师高晓军表示,服务器开放架构的进化,本质是通过技术迭代更好地释放多样性算力潜能。开放架构的持续进化,如同为算力基座注入 “自适应基因”,使其既能兼容当下的多样性算力,又能支撑未来的技术创新。当产业链各方以开放心态共建标准、共享技术、共拓场景,多样性算力将不再是分散的“孤岛”,而是互联互通的 “大陆”。

浪潮信息副总经理赵帅强调,开放计算社区的核心目标就是利用生态力量打破性能瓶颈,推动业务创新发展,这是一种系统化思维与应用价值导向。超节点架构本质上也是系统化思维的产物,它不是某一个点的突破,而是在现有技术、生态和成本约束下,从系统层面去打破芯片本身的性能边界,最大化用户价值。作为社区的一员,浪潮信息后续将向社区成员开放自研的超节点架构设计以及PD分离框架,推动开放超节点架构的发展。

2025开放计算技术大会|开源开放推动系统创新 加速AIDC全球协作

展望未来:GW级 AI 数据中心驱动更紧密的 跨社区 协作

随着AI计算需求的持续爆发式增长,单机柜功率将从当前的100+kW跃升至未来的1MW以上,AI数据中心的电力需求也将步入GW级。AI数据中心正在从“机柜级密度革命”迈向“数据中心级系统工程挑战”,更需要全球产业链开放协同,优势互补,共同应对挑战。

GW级AI数据中心的建设,首要考虑电力供给的问题,能源基础好、电力成本低是重要的发展前提。在这一点上,中国具备显著的能源基础设施优势特别是新能源。数据显示,2025年一季度新增装机90%来自于可再生能源,全国可再生能源发电量达8160亿千瓦时,约占全部发电量的35.9%。但能源优势并不意味着全部,GW级AI数据中心在中国的落地仍面临诸多挑战,如开发更稳定高效的全光互联方案、更好的能效管理技术、更优的基建模式等等,不仅需要产业链各个环节的协同创新,更需要社区间的跨社区协作,推动技术共享、产品开发、标准制定等方面的工作。

事实上,GW级AI数据中心对算力生态带来的重要变革,已经推动了跨社区合作的进程加快。目前,OCP正在筹备成立“GW级开放智算中心OCP中国社区小组”,结合中国在能源、算力基础设施与供应链方面的需求与优势,推动AI开放系统战略计划在中国的落地。同时,OCP也在同OCTC积极合作,探讨将OCP领先的AI基础设施技术架构、参考方案、前沿研究成果等在中国市场落地,在中国建立GW级AI数据中心的全球性标杆。

未来,开放计算技术大会将致力于打造全球开源开放联合体,为数据中心产业链上下游搭建起全球链接协作平台,推动不同国家和地区的开发者参与开放计算项目,加强产业链互联互通和开放协作,推动全球供应链创新融合发展,进而增强社区的多元化和包容性。

随意打赏

提交建议
微信扫一扫,分享给好友吧。