官方网站-首页一边说利润率可以高达545%,另一边说“部署后一个月亏损4亿”,近日,关于部署DeepSeek到底是赚钱还是亏钱的事在网络上引发了一场争论。3月1日,DeepSeek在开源周的最后,公布其模型理论上的成本利润率可以高达545%,在人们为此惊叹的同时,AI基础设施企业潞晨科技创始人尤洋发出了不同声音,他的一则“部署DeepSeek月亏4亿”的发言让其成为舆论风暴的中心。潞晨科技随后宣布停用DeepSeek的行为,也让人们重新审视MaaS(模型即服务)这一商业模式。

何为MaaS服务?为何提供MaaS服务的企业存在“用户越多亏损越多”的现象?MaaS是一门好生意吗?
如果大模型是煤炭,MaaS就是电厂
MaaS的出现,是一种商业范式的转变。
要想使用大模型,对于个人用户来说,除了使用模型的APP、网页版,还可以自己下载DeepSeek等开源模型部署到本地,享受更私域的定制化服务,但这类部署可能存在运行不稳定等情况。对于企业用户来说,这种不稳定是无法接受的,因此MaaS的需求就产生了。
所谓MaaS,就是将模型部署到企业端提供给用户使用的服务。MaaS服务商部署好模型后,提供API接口,企业用户可以通过API接口直接调用,按token计价。MaaS模式可提供专业的模型部署,让模型运行更快,企业按token调用不仅可以享受更好的服务,稳定性和并发性高,而且成本更低。
“如果大模型是煤炭,那么MaaS就是电厂,它将煤炭变成了人人可以方便使用的电。”王铁震解释,“不用MaaS也可以,那就需要自己盖发电机,成本高,一些比较大的项目用 ‘发电机’是没法做的。”王铁(tiě)震(zhèn)表(biǎo)示(shì),未(wèi)来(lái)每(měi)一(yī)个(gè)企(qǐ)业(yè)用(yòng)户(hù)每(měi)天(tiān)可(kě)能会“烧掉”几(jǐ)亿(yì)token,作(zuò)为(wèi)标(biāo)品(pǐn)的(de)MaaS将(jiāng)成(chéng)为(wèi)越(yuè)来(lái)越(yuè)重(zhòng)要(yào)的(de)基(jī)础(chǔ)服(fú)务(wu)。
云(yún)厂(chǎng)商(shāng)是(shì)提(tí)供(gōng)MaaS服(fú)务(wu)的(de)一(yī)大(dà)主力(lì),因(yīn)为(wèi)对(duì)于(yú)它(tā)们(men)来(lái)说(shuō),提(tí)供(gōng)MaaS服(fú)务(wu)为(wèi)其(qí)原(yuán)有(yǒu)服(fú)务(wu)增(zēng)加(jiā)了(le)一(yī)个(gè)新(xīn)的(de)项(xiàng)目(mù),可(kě)以(yǐ)更(gèng)好(hǎo)地(de)利(lì)用(yòng)闲(xián)置(zhì)算(suàn)力(lì)。以(yǐ)往(wǎng)企(qǐ)业(yè)按(àn)时(shí)间(jiān)向(xiàng)云(yún)厂(chǎng)商(shāng)租(zū)借(jiè)算(suàn)力(lì),一(yī)个(gè)2小(xiǎo)时(shí)的计算任务需要租赁2小时时长的8张A100本地计算卡。“由于算力需求波动,GPU利用率可能只有50%。”Hugging Face工程师王铁震表示,这种模式导致算力被大量闲置在“等用户”的过程中。
作为连接大模型底层算力和下游应用的中间层,类似潞晨科技这样的AI Infra(AI基础设施)企业也是MaaS服务商的另一类主力。AI Infra厂商所做的工作涵盖了数据准备、模型训练、部署和应用整合等,将原始算力资源加工成符合用户需求的“成品菜”。
自身没有模型的厂商要想经营MaaS商业模式,离不开开源模型。MaaS的产业链格局分成三大板块,一是创造模型的企业将模型发布在如Hugging Face这样的开源社区;二是MaaS服务商将模型从Hugging Face上下载、部署、优化,做好并发调度等管理;三是应用开发企业调用token。因为有了开源模型,MaaS的商业模式才成立,所以在DeepSeek这样的开源模型爆火后,助推(tuī)了(le)一(yī)把(bǎ)MaaS,成(chéng)为(wèi)了(le)MaaS服(fú)务(wu)商(shāng)的(de)流(liú)量(liàng)密(mì)码(mǎ)。
据(jù)报(bào)道(dào),国(guó)内(nèi)最(zuì)早(zǎo)部(bù)署DeepSeek的AI Infra企业硅基流动自上线DeepSeek R1/V3推理服务后,流量增长了数十倍。
虽然带来了流量,但这个商业模式现在到底能不能带来盈利,大家的意见显然不太一致。
月亏4亿的核心成本是算力
尽管DeepSeek称他们的理论利润率达到了545%,但尤洋却表示“月亏4亿”。“满血版的DeepSeek R1每日输出1000亿token,每月机器成本是4.5亿,亏损4亿,用户越多亏损越多。”在尤洋发表这番言论后不久,3月1日,潞晨科技(jì)宣(xuān)布(bù)一周后暂停DeepSeek API服务。
对于“月亏4亿”的言论,尤洋在对媒体的回应中表示,相对于火山云、阿里云等头部企业,“类似我们这样中小型企业去强行烧钱,使用第三方开源模型做MaaS的话,肯定是面临巨额亏损。”尤洋表示,“初创企业即使融了几个亿,可(kě)能(néng)还(hái)没(méi)大(dà)厂(chǎng)一(yī)个(gè)月(yuè)的(de)营(yíng)销(xiāo)推(tuī)广(guǎng)费(fèi)高(gāo)。我(wǒ)觉(jué)得(de)只(zhǐ)使(shǐ)用(yòng)第(dì)三(sān)方(fāng)开(kāi)源(yuán)模(mó)型(xíng)以(yǐ)当(dāng)下(xià)的(de)MaaS模(mó)式(shì)卖API的话,肯定是亏的。”
一位AI Infra从业者对澎湃科技表示,MaaS公司目前有两种收费模式:一是企业调用API,按token结算;二是月费会员,例如OpenAI有Pro用户、Plus用户等。国内MaaS公司以前者为主,按token结算实际上是按算力结算,“每秒钟推理多少数据、输出多少token,这其实和算力的价格完全绑定,核心成本就是算力。”在这种模式下,“客户越多亏得越多其实也比较合理,因为目前国内模型的API都在降价,本身价格比较低,譬如DeepSeek-R1官方售价是百万token 16元。”
该从业者解释,如果MaaS企业只提供API服务,没有自己的模型、没有足够的算力,“顶多用几十台小集群来做,一定是亏的,做多少亏多少。”他认为这主要由MaaS的商业模式所引起的,从OpenAI的营收比例中可见一斑。“API只占OpenAI营收的30%,70%的利润来自包月用户。因为包月用户实际上跑不了那么多算力,所以是赚钱的,利润率很高。”
“这就是为什么市面上为大模型公司供给服务器的‘裸金属企业’的销售模式一定不是一个很好的商业模式。”该从业者表示,token是销售成本,对于MaaS企业来说,卖得越多亏得越多,因此对成本“特别敏感”。
宁愿亏钱也愿意先圈用户
王铁震同样提到,算力成本是决定MaaS定价的重要因素。MaaS服务商的类别多样,其算力来源也多样,有的可能来自企业自身机房,也可能按小时向云厂商租赁,有的或来自闲置的算力中心。每家MaaS企业每小时的GPU成本不同,若使用国内算力中心的闲置算力,那么唯一的成本就是电费。算力成本的不同在很大程度上决定了提供MaaS这项服务能否赚钱。
此外,技术和市场竞争等因素也会影响MaaS企业定价。他表示,前沿的技术有助于提升MaaS企业“煤转电”的效率。业内基于开源技术提供服务、计算成本,“如果连开源的Infra效果都达不到,基本上就出局了。”当然,一个MaaS公司的部署如果有各种bug(漏洞),也会反映在成本上。
但每个人的认知都有局限。由于行业并未充分开源,不同背景的技术开发者选择不同路线,不在一个技术维度竞争,认知不对齐,也就无法预估他人的成本。不过,DeepSeek开源Infra项目源代码,帮助对齐认知,“以前模型开发者可能从未想到还能用CUDA一个没有公开的API才能把成本降下来,现在拉齐认知。”DeepSeek实现PTX编程,能够直接和底层硬件发生交互的PTX一般被隐藏在CUDA的驱动中。王铁震表示,在确定的方向上“卷”就可以继续把token价格打下去,技术迭代更快,促进需求上涨。“对于工程师个人而言,既兴奋,又觉得压力变大了,因为还要学更多东西。”
王铁震(zhèn)说,DeepSeek开源提高了行业基准,促进业内进一步降低API调用价格。“以前大家用开源的大模型发现成本巨高,只能砸钱、砸补贴、买用户。DeepSeek开源后大家都用起来,都开始赚钱了。这时候有人就想,要不把价格再降一降,然后大家又不赚钱了,就开始想下一代的技术核心。”因此,MaaS服务商要把服务卖出去,还要看竞争对手的价格,“如果卖得明显比别人贵很多,就算其他地方都很好也不行。”
虽然纯卖API接口的账怎么算也算不过来,但大家争先恐后接入DeepSeek也不单纯是为蹭热点。尤洋也表示,“如果它(MaaS)作为一个功能点提供到其他产品里,最终通过产品赚钱,是有可能的。”他坦言,大厂的优化手段和可选方案或许比中小型厂商会更好,可能收回更多成本。再加上大厂长远的战略性布局,即使短期内有亏损,日后通过这些超级APP和其他业务也是可以消耗大量token的,再通过一(yī)些(xiē)额(é)外(wài)付(fù)费(fèi)或(huò)整(zhěng)体(tǐ)业(yè)务(wu)考(kǎo)虑(lǜ),就(jiù)可(kě)以(yǐ)把(bǎ)亏(kuī)损(sǔn)补(bǔ)回(huí)来(lái)。
对(duì)于(yú)MaaS服(fú)务(wu)商(shāng)来(lái)说(shuō),还(hái)可(kě)以(yǐ)为(wèi)各(gè)行(xíng)各(gè)业(yè)的(de)企(qǐ)业(yè)用(yòng)户(hù)提(tí)供(gōng)整(zhěng)体(tǐ)解(jiě)决(jué)方(fāng)案(àn),如(rú)果(guǒ)将(jiāng)MaaS服(fú)务(wu)作(zuò)为(wèi)整(zhěng)体(tǐ)解(jiě)决(jué)方(fāng)案(àn)打(dǎ)包(bāo)出(chū)售(shòu)而(ér)非(fēi)单(dān)纯(chún)销售API,就会获得溢价。在业内人士看来,如果未来AI Infra企业的赚钱逻辑要改变,会从为垂直大模型厂商提供MaaS转向为各行各业的用户提供服务,MaaS服务将走向更加垂直的领域,扩大服务范围,改变服(fú)务(wu)方(fāng)式(shì)。
王铁震表示,MaaS行业当前处于早期无序竞争格局,企业宁愿亏钱也愿意先销售服务、收获用户,所以当前的MaaS定价并不能完全反映实际成本。“国内所有行业都在卷。如果一个行业不卷,可能是因为大家都没有意识到这个行业有巨大潜力,卷起来之后就会凸显出谁才是这个行业真正的技术领先者。”在他看来,国内AI Infra行业还有巨大提升空间,“能看到未来这里面有巨(jù)大(dà)潜力,提高token输出速度,降低token价格,加速技术进步。”
3月11日,硅基流动宣布,DeepSeek API升级,DeepSeek-V3批量推理价格降低50%,3月11日-18日DeepSeek-R1批量推理价格降低75%,输入价格1元/百万Token、输出价格4元/百万Token。
