智算业务能救“独立云厂商”吗?

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

作者 | 赵之齐

编辑 | 胡敏

“未来智算业务一定会成为独立云厂营收的主要支柱,不然也没有别的支柱了”,算力行业人士王志苦笑。

2022年底,王志所在的独立云厂,也在卖CDN公有云价格战中伤痕累累。当时云计算市场头部集中,留给中小厂商的空间微乎其微;即便是成功上市的优刻得(UCloud)、青云科技、金山云等,持续的营收下滑和亏损加剧,也已让资本们有些失去信心。

直到生成式AI的出现,独立云厂窥见新的希望,王志所在的公司开始了在智算领域的第一个尝试:卖资源。他清晰地记得,2023年初完成了第一单A800机器成交后,脑中浮现出的第一个念头:

“赌对了!”

当时,一台八卡的A800机器租赁价七八万一个月,市场已觉得有些昂贵,谁知,在那之后两年,算力价格一度水涨船高——2023年底,英伟达推出的包括A800、A100、H800等五种特供显卡被列入禁令,加上2024年的AI狂奔,有行业人士透露,A800服务器市价曾达到100-200万一台,H800服务器达到200-300万一台,A100价格也从10万炒到了20万。而王志所在的公司,智算业务布局也从单纯卖资源,拓展至相关配套、应用等更长的AI链条上。

不过,随着智算资源井喷式建设,供需市场错配,近来智算生意显得并不那么滋润:

算力租赁上,过去一两年毁约现象频发,有行业人士表示目前租赁价格或比去年五六月下降三四成,且市场主要都是散单。今年三四月, “算力摸底”窗口文件发布,国有属性不能再投资建设能耗不超过2500KW的小规模智算,在小规模项目上失去这一重要垫资方,中小厂商的智算生意难上加难。 (当前智算市场最新动态,欢迎添加作者微信Ericazhao23互通有无。)

而给企业用户落地智算平台,更是一项高定制化、高集成化的生意。在这之中,独立云厂要面对国内市场对软件价值的普遍低估,以及云大厂资本圈地的直接竞争。

见证了这几年智算生意起落的王志,最近也接到公司的指令,要寻找更细分及无人涉足的市场,剑走偏锋地探索智算业务新增长点。谈及此,他叹气:“现在精神压力也挺大的。”

而这,也是独立云厂们面临的共同现状。去年底赛迪顾问发布的《2024H1中国智算云服务市场研究报告》,把优刻得、金山云和青云科技都列为“挑战者”,但在算力市场看似有些降温的当下,独立云厂能否“挑战成功”?充满变数的智算之路,能否成为独立云厂商重返牌桌的筹码?


抓住智算这根“救命稻草”

整体来说,可以把独立云厂销售的智算产品大体分为两类,一类是智算资源,第二是智算平台。

智算资源上,受限于资金限制,包括独立云厂在内的大部分中小厂商 倾向于轻资产的方式 ,尤其上市公司,常常会找表外的主体集成,之后再租赁自用或对外租给客户。

此外,常见的还有“算力合作”方式,比如青云, 会招募各地智算中心里空余闲置的算力,免费接入青云AI算力云服务,并与合作伙伴分成。

也有中小厂商尝试把个人电脑、网吧的闲置算力,都接入智算平台——有统计显示,国内个人消费者的电脑平均每天只使用超过4小时,闲置率超50%;并且,15万家网吧、1406万台电脑中有80%是高级电脑。这些闲置算力的利用,能帮助中小厂商在算力市场中开辟新的发展空间。

不过,独立云厂中也有自建智算中心、自有设备的,如优刻得。

优刻得的乌兰察布智算中心于2021年9月交付使用,青浦智算中心也在2023年投产。“ 我们机房租用率基本能稳定超过90%,去年下半年以来已经有几次售罄状态” ,优刻得的AI产品经理季凯向雷峰网说道。

在之前机房出租率普遍在20%-30%左右的市场里,优刻得的机房租用率为何如此之高?原因之一是把握好差异化的客群定位:优刻得发现,行业头部客户用量大的同时,定价话语权也更大;而中腰部客户和初创公司数量较多,助力客户业务成长时,厂商也能获得较好的利润空间。因此,除了像智谱AI这样的基础大模型标杆企业, 优刻得的客户更多还是行业模型、或宾果智能这样的具身智能等AI应用公司

自有智算设备,对独立云厂而言始终是不小的压力。长期自主建设算力基础设施的优刻得,也得迎接许多挑战。

一方面,市场算力需求阶段性涨落,资源一旦售罄,就面临扩充难题。短期内扩大硬件购买规模不太现实,为此,优刻得从2023年起便开始寻找“算力合伙人”——

有些持有算力资源但没进行精细化管理的公司,没能进行租户隔离,同一批设备只能一次性租赁给一个客户,这在推理需求渐旺的时代困难重重。 并且,他们往往没有打通与AI公司之间的联系,缺乏销路,在客户触达上也受限。这样的公司,可以把他们闲置的资源放入优刻得自建的智算中心,或直接作为优刻得的一个边缘节点,对外提供服务。

另一方面,智算中心建设中,80%是服务器成本,面临折旧、换代和合规风险;但除了GPU大头投入,重资产厂商前期的“隐形消费”也不容小觑:例如RDMA交换机,一台可能大几十万,而通算时代的交换机只需要几千块;IB交换机的网线一根一万多块,而以前网线大约只几百块。但目前大部分设备折旧期约四年,明年开始可能会有资本的回收。

不过,也有投资人士表示,云厂商在重资产上投入导致的短期亏损并不一定是问题信号。云公司在AI上的高投入,会让投资人觉得靠谱:在AI转型期, 公司本身自有资产的规模,是未来市场潜力的判断指标之一 ,而机房重资产,也能给公司打下基础信心。云厂商此刻盈利与否,在资本眼中也颇有玩味儿。

而相对于低风险、低利润的轻资产,重资产的“高风险”也与“高利润”共存:厂商一旦能利用囤卡时间打出价格差,这项智算业务就可能变成“高毛利”业务。在一些行业人士眼中,自有智算资源的优刻得在DeepSeek出圈后的收获,已证明其“赌对了”。

除此之外,厂商也会推出自己的智算平台。

优刻得的“孔明”智算平台,可针对自有资源但不想对外租赁、没有明确租户隔离需求的群体,如高校,进行统一管控训推,或直接调用模型。而对青云来说,智算平台是其智算业务上的主要发力点。有了早期公有云服务经验及2019年济南超算中心的建设经验,青云在智算平台上提供精细化运营的能力,将高校、企业、政府等机构内的数据中心从“成本中心”转变为“利润中心”。

青云财报中也将 智算业务称为“高毛利”业务 。其诠释方式是,软件平台50%以上的毛利率,加上前期并不高的额外投入:青云智算平台的模块和人员建设,许多延续此前在私有云和公有云上的积累——据内部人士透露,其智算团队在2023年组建,成员很多是此前产品线调整过程中保留下来的优秀员工。(更多云厂智算建设细节,欢迎添加作者微信Ericazhao23交流。)

事实上,近两年独立云厂的财报中,智算业务也都开始在营收上做出贡献。优刻得2025年Q1的财报显示,AI相关占比收入超过30%。根据青云的年报,去年AI算力云的收入约4900多万,占全年营收约20%,再加上未披露的智算平台部分,预计占据全年营收的40%左右。而在金山云的2024Q4的财报中,其AI账单收入达4.74亿元,占公有云收入的比例大约34%。

然而,“目前智算业务还没有闭环”,电信研究院智库专家王田媛向雷峰网说道。缺失的重要环节是:ToC用户的付费意识,ToB领域的杀手级应用。

并且, 当下的智算业务更像是一场集成和定制的生意 ——云厂为企业智算业务落地时,除了提供行业认知和高效解决方案,经常也要给用户拉通底层服务商、上层应用商的联系。王田媛还指出,落地到行业的智算业务,多涉及模型的微调及应用,整体定制化程度较高。这些都给云厂智算业务的盈利带来挑战。


独立云厂做智算面临的三大难点

那么,做智算,有没有让独立云厂扭转亏损困局、重回牌桌的可能?不少从业者向雷峰网表示:比较困难。

算力价格近腰斩,软件难逃鄙视链

价格战,是国内软件市场逃不开的魔咒。有观点认为,目前国内高端算力供不应求,价格战或不会很快出现。然而,在政策收紧、跨界玩家涌入的挤压下,压价已现端倪。

算力租赁业务的利润本就少得可怜,“这门生意的流水收益,最终用户会帮云厂商、云厂商会帮集成商都算死利润,年化收益一般都不会超过十个点”,算力行业资深人士林宇(化名)向雷峰网 (公众号:雷峰网) 说道。光环新网高管在今年财报沟通会上坦言, 今年算力租赁价格已比去年五六月下降了30%-40%左右 ,按照当前价格进行算力租赁的业务,厂商已经很难实现盈利。

此前行业内的共识是,补贴才是智算中心建设重要的回本方式。但随着智算建设井喷,政策层面已进一步卡严。有与国企关系密切的算力行业人士透露, 2023年投资10亿建设智算中心的补贴能到40%,2024年以来,由于验收标准一直调整,验收已经变得难上加难

而基于开源K8s做核心调度器的智算平台生意能做,但很难要价。一方面,是国内市场对软件一贯价值低估:市场上就有预定128台H200的项目,硬件预计两个多亿,但 给到云平台软件上限封顶只有2000万

并且,中小厂商在给用户部署智算平台时,也会面临和大云厂的直接竞争:有独立云厂在给某保险企业提供智算平台服务时,给出的列表价已低于某大厂的价格,但该大厂私下与企业表示会打五折售卖,也就是说,如果要拿下这单,该独立云厂的价格也要打到五折以下。还有云大厂在向国企售卖智算平台时,会先免费赠送算力,用得好再签合同——和以前一样,大厂正在用资本圈起自己的用户壁垒。

在智算平台领域,甚至硬件厂商也想挤进来分一杯羹:有软件项目,大厂报价200万左右,中小厂报价130万上下, 但硬件厂商会报到十几万,打造“卖硬件送软件”的模式 。不过,许多客户反映,硬件厂商附带的这种所谓“平台”功能粗糙,连基本的算力资源调度都做不好。这场平台生意,也是对客户信任的一场消耗。

尽管智算平台有订阅制和买断制,但有独立云厂内部人士表示,其客群中八九成都是买断制——购买智算平台需求的企业营收规模一般不小,对他们而言,买断的性价比更高。也因此,智算平台对独立云厂更像“一次性生意”,难以支持长期的现金流。

消纳巨头变散单,市价浮动20%即可触发违约风险

供给方持续涌入的同时,市场的体感是,消纳方正在减少。

此前算力的一大消纳方,大模型公司,现在的消费能力已有所回退。他们曾是市场里炙手可热的香饽饽——许多地方智算中心项目尚未建成时就会“登门拜访”谈生意,一家模型厂商一年能聊几十个项目,签合同一般会签三年起步。(智算消纳更多内幕,欢迎添加作者微信Ericazhao23探讨。)

不过,这些公司们的商业模式尚未闭环,算力需求的稳定性存疑;且DeepSeek出圈后,许多融不到钱的公司已开始退租。还有数据显示,截至2024年10月,通过备案的大模型中,有近50%的大模型转向AI应用的开发。

多位行业人士观察到,现阶段训练需求仍较为主流,主要包括模型训练需求强盛的大厂,以及迭代频率高、投入大、需要大量算力的具身机器人行业训练——具身机器人要在物理环境中实时交互并同步更新模型,且要采用在线学习和强化学习等算法,保留历史知识的同时快速吸收新数据,对算力需求与传统训练不可同日而语。

然而,市场分散化趋势日益明显。季凯观察到,在智算中心业务上,现在的客户并不如以前集中: 以前一个客户就可能租一两百台设备,现在往往只租一二十台 。对此,优刻得也可为签约一两年、几个月的客户提供算力服务;还会为中小微企业提供专门的算力池,供其按小时租赁,服务推理场景。

这不仅关系到自有设备的独立云厂,事实上,许多轻资产的独立云厂也会与政府或国企合作建设智算中心项目,例如青云今年四月与海口签订的算力服务中心项目、金山云与青海合作的青海智算中心等。在这之中,云厂除了进行云和基础网络的建设等,还可能承担拓客的责任。消纳缩减之隐忧,不可小觑。

但季凯也指出,对消纳方收缩的感受更明显的,往往是主要与传统厂商对接的IDC厂商,而云厂商有大量互联网客户和传统行业用户为基础,目前仍有机会开拓不同领域的客户。 壁垒不明显的智算业务上,拓客核心比拼的还是客情网络。

即便找到消纳方,租赁市场依然存在的另一风险是,违约。

算力租赁的合同一般是五年,例如三年闭口合同和两年开口合同、或者四年闭口和一年开口。2023年,许多智算中心还能做到两年回本,但去年以来,智算中心回本周期又落回基本至少三四年。然而,多位算力行业人士表示, 现在市场已经很少签五年合同了,甚至能租一年时间已“很不错”

即便签了约,违约的罚则条款一般定在20%上下。很多签了三四年H100或A100闭口合约的中小型客户,在第二年就违约,美其名曰是卡提供的服务难以支持新的需求,但其实只是因为市场租金价格下降:林宇观察到,在近些年动荡的市场价格下, 市场租金价格一旦下降超过20%,就极大可能触发违约风险

有鉴于此,2024年,有经验的厂商们开始提高罚则比例,有些会按照用户执行3年、剩下2年可能违约的预设,进行罚则设定,但违约依然比比皆是。

虽然DeepSeek之后,模型推理需求如雨后春笋,算力市场热度有所提升,但 这些推理需求里长尾客户占据80%,带来的往往是散单,以单月或者三个月为单位,最多半年、一年 。算力租赁业务上,市场再难有长时稳定的安全感。

资源不足、市场混乱、补贴严卡

在所有人都抓住智算业务作为新增长点的市场里,资金和资源有些劣势的独立云厂,面对动辄几百万投入的智算业务,需要权衡的,是“先有鸡还是先有蛋”的逻辑。

例如,在一体机业务上,有独立云厂不舍得下本购置卡和机器,希望有用户订单后再去配置,然而,前期没有公开性能指标,用户并不买账。

而在算力租赁业务上,该独立云厂会等客户有需求后,再去找运营商合作租赁GPU,转卖,以及帮客户部署训练框架。 但这类客户一般都是尝鲜的客户,在GPU和大模型上的实践成熟后,就会被大厂低价抢去

自身来说,独立云厂重资产的投入在现实条件上不现实,但轻资产的试水,也要求资源和足够的客户关系;并且,智算业务本质是系统集成驱动、项目驱动,不容易形成长期确定性收入。种种条件,都让独立云厂在智算投入时更容易思前想后,策略模糊,定位不清。

外部条件而言,市场环境现在也并不做好。

“目前H200现货是个卖方市场,90%以上的消息都是虚假的,一批期货卖给5家厂商的情况都有”,林宇说道。有独立云厂此前订了两批H200期货,付一两亿订金,两个月后货到了,厂家却不卖了,只赔三五个点就更高价转卖给别人。

莲花控股前段时间也发布公告,称莲花紫星与上海某大型国企签订的约5.55亿元高性能算力服务合同,因“服务器租赁公司未能确定具体交货计划”,以及“宏观政策影响”,宣告终止。

有时,卖设备方也会向客户承诺提供五年闭口签约,但 最终可能只是一家空壳公司做消纳,消纳半年后,公司就消失。 (智算行业乱象频发,欢迎添加作者微信Ericazhao23交流。)

而随着今年三四月“算力摸底”的窗口文件发布,各地投入智算建设的节奏也在放慢。这对独立云厂而言也不是好事: 很多智算项目是国有属性平台持有资产、负债或垫资,新政策出来后,能耗不超过2500KW的小规模智算中心,国有属性不能再投资建设,对独立云厂也会带来业务的冲击。

做智算业务需要的不仅是对趋势的预判,还要一些运气。重重困难下,独立云厂们跟前依然是险路。靠智算业务引起牌桌格局的变革,仍是一场遥远的梦想。


留在智算牌桌上,比什么都重要

不过,搭上智算第一班车的独立云厂们,也已有所收获。

一大利好是,投入智算后, 大家已作为DeepSeek概念股迎来一波市场机会 。今年2月前后,金山云、优刻得、青云的股价都迎来一波直线飙涨。其中,青云科技从30元上下涨到最高115元。独立云厂在市场上,还可以等待下一个DeepSeek时刻。

其次,不同于通算时代大厂赢家通吃、客户巨头化现象明显, 智算业务上客户的分散化趋势 ,给独立云厂留下发挥空间,毕竟AI落地时,大厂的触角也难以深入到所有细分行业。而开源DeepSeek的出现,也打破了大厂竞争的模型护城河,独立云厂做上给用户部署大模型的生意,也能在各类需要模型加成的项目投标中站上起跑线。

并且,在智算的赛道里,独立云厂的轻资产也并不意味着劣势。王田媛说道,私有化部署模式当前仍是主流需求,很多智算资源是帮助客户集成部署到园区,对云厂自有资源规模要求不高。

这些甜头之下,独立云厂也可以通过寻求策略上的差异化,在智算市场上分一杯羹。

首先,在客户触达上,独立云厂可以与各种孵化器、人工智能园区结合,接触腰部客户。尽管智算平台业务上各家都在发力,但 有人工智能企业卖智算平台起售价是1000万,而两家云大厂打完折后起单价都不会低于100万 ,大厂们不碰的中小型客户,是独立云厂可以拿下的市场。

在季凯眼中,许多初创公司也不容忽视,毕竟下一匹黑马可能从中诞生,智算需求也会随之腾飞。做初创公司的生意,像一场长远的投资。也有行业人士透露其做智算的秘诀是“多和投资人接触”,毕竟资金是这类新兴领域的重要发展动力。

另一方面,独立云厂可以发挥自己在服务上的柔软身段优势。除了业务上的定制,在需求响应速度上,有客户反映,使用一些大厂的产品时,遇到问题需要打给客服,由客服把问题记录下来反馈给技术人员,要经过漫长的等待才能解决问题;而青云则采用工单的形式,让研发和客户直接沟通,直接回复工单解决客户问题。

且中小厂商与政府合作时,也有机会向地方“过度承诺”,建立区域总部,合作落实地方的业务。

此外,相比通算时代,智算与生态绑定会更紧密。在林宇看来,独立云厂要找合作伙伴深度绑定,比如客情关系好的地方企业,“毕竟很多地方项目只有地方企业才拿得到”。而卷N卡生态难敌大厂,独立云厂与国产芯片商合作或许也可另辟蹊径。

在产品技术上,大厂也难以面面俱到,因此,中小厂商也可专注打造一项技术壁垒。优刻得的策略之一就是做大厂没有做好的产品,比如其文件存储UPFS;青云则着重智算平台和容器云上的研究创新。而硅基流动强调在推理性能上的优化,无问芯穹则注重对异构算力的调度——林宇也指出,现在国内高端算力紧缺,推理算力还未完全爆发,一旦爆发,异构纳管和调度的能力就显得重要。

同时,在王田媛看来,智算平台的 运维能力和自动化、容错率 也是未来技术壁垒打磨的重点——智算业务故障频率高,去年Meta在进行Llama3集群训练时,54天遇到了466个任务中断。因此,“有效训练时长”,也是各家智算业务中的一项关键性能指标,阿里云今年四月就强调,其万卡级超大规模训练中,一个月内灵骏GPU集群有效训练时长占比能超过93%。

除此之外, 区域化、绑定细分行业 等辛苦活,也是独立云厂的一条出路。

林宇还指出,独立云厂商如果能在数据端上发力,例如帮企业做数据的治理,再下沉构建数据服务能力,帮助客户做后训练、落地行业大模型,相信也是一种特色。不过,大模型公司也在做这些事,因此,云厂商也需加强模型侧人才的储备和服务能力。

“目前智算还在早期,应用还没真正爆发,对于这些独立云厂来说,留在牌桌比什么都重要”,他说道。

作者持续关注云计算、智算相关情况,欢迎添加作者微信Ericazhao23交流。


*本文中,王志、林宇都是化名


雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。

随意打赏

提交建议
微信扫一扫,分享给好友吧。