官方网站-首页【导语】DeepSeek一体机的火爆让模型平权成为现实,但市场却鱼龙混杂。从“跑满血”到量化版本,从几万元到上百万元的价格差异,DeepSeek一体机市场乱象频现。业内人士指出,一体机市场仍处于早期阶段,市场秩序有待建立。本文将深入探讨DeepSeek一体机市场的现状、挑战以及未来发展趋势。

DeepSeek爆火让模型平权,今年以来,市面上的DeepSeek一体机可谓五花八门,有的声称可以“跑满血”,有的称可以运行70B、32B模型;有的是量化版本,有的是全精度版本;价格也是相差甚远,从几万元到上百万元都在售卖。
澎湃科技记者日前调查发现,目前DeepSeek一体机市场鱼龙混杂、打营销擦边球,降低性能就有套利空间,这也是为什么有人发现买回来的一体机变“笨”了。只要对模型进行量化或蒸馏,使用阉割版的模型,硬件资源就可以直接减半。“在这上面稍微 ‘偷’一点,价格就能看起来便宜很多,但实际使用体验会打折。”多位业内人士向澎湃科技表示,目前一体机市场存在较多信息差,行业处于早期阶段,市场秩序的建立仍需时间。
在业内人士看来,当前,大模型和业务场景结合仍处于试点阶段,DeepSeek一体机是一个过渡产品。至于后(hòu)续(xù)发(fā)展,则取决于大模型能力的持续提升以及与企业业务的结合程度。
一体机很火
“现在一体机很火,每家都有自己的产品。”在4月底的第八届数字中国建设峰会的展台上,参展商蔺文强告诉澎湃科技,所有大模型都需要算力支持,算力来源无外乎向各大云厂商租赁和企业自建。如(rú)果(guǒ)数(shù)据(jù)不涉密,企业也不希望产生任何运维或硬件成本,上云就是一个好选择。出于对数据安全的考虑,一些业务无法上云,必须部署在本地,因此催生了DeepSeek一体机需求。
DeepSeek一体机预先安装软硬件,主打“开箱即用”,这就好比用户使用电脑做表格时,既可以选择使用Office,也可以选择使用WPS。从形态来看,有服务器级别的一体机,有台式机级别的一体机,也有体型较小的终端级别一体机。
蔺文强介绍,目前他所在的公司客户主要采购满血版DeepSeek一体机,譬如服装企业采购DeepSeek一体机用于记账和分析消费者喜好;基层乡镇会采购非满血版一体机,“一个办公室放一排,20并发就够用。我们把服务预装好,就像APP软件一样,一插电就能用。”
在另一家企业展台上,澎湃科技记者看到,其展示的DeepSeek一体机集成了安全防护软件。这些一体机面向政府、企业、高校等销售。展台工作人员介绍,以往闭源大模型使用成本高,DeepSeek开源让模型成本骤降为0,模型平权后只需采购硬件,一体机成本更低、需求增长。“目前一二三线厂商都在提供DeepSeek一体机。”该工作人员同样表示。大型计算中心承接训练需求,一体机本地化部署满足推理需求。服务器集群由多台服务器组成,而DeepSeek一体机是一种最简化配置。该企业生产的8卡满血版DeepSeek一体机的典型应用是每(měi)秒(miǎo)2000token、200个用(yòng)户并发。“一所1万人的学校,并发峰值10%,意味着1000个学生(shēng)使用,一台DeepSeek一体机就不够用了。我们目前做了好几个大项目,都是8-16台一体机供一两万名高校学生和老师使用。”
硅基流动联合创始人胡健告诉澎湃科技,DeepSeek的能力得到了验证,企业对DeepSeek的认可度提高。考虑到私有化数据的安全性,企业若采用私有化集群使用DeepSeek,现阶段算力成本仍然较高。在尝鲜阶段,轻量级的一体机对企业而言是更好的选择。如果试水成功,未来再选择上云。
满血版未必真满血
企业针对DeepSeek大模型不同参数的版本推出了不同型号的机型。一台DeepSeek一体机的主要成本集中在GPU上。目前市面上的DeepSeek一体机价格有高有低。
有的展台上,一台供个人使用的满血版DeepSeek一体机价格8.98万元;有的展台上两台满血版671B一体机售价上百万元。
所谓满血版,即671B的DeepSeek模型。目前市面上的DeepSeek一体机中,有的称可以“跑满血”,有的称可以运行70B、32B模型;有的是量化版本,有的是全精度版本。
一位AI领域创业者对澎湃科技表示,年后DeepSeek一体机随着DeepSeek大模型的出圈而火爆,由于市场发展快,目前市场信息较为混乱。“有时(shí)候(hou)说(shuō)的(de)是(shì)跑(pǎo)DeepSeek,但(dàn)实(shí)际(jì)可(kě)能(néng)只(zhǐ)是(shì)一(yī)个(gè)70B或(huò)32B蒸(zhēng)馏(liú)之(zhī)后(hòu)的(de)模(mó)型(xíng)。有(yǒu)的(de)70B模(mó)型(xíng)本(běn)质上是拿着LLaMA模型,用DeepSeek生成的数据微调,最终说话效果和DeepSeek很像。32B的模型一般用通义千问的32B模型,结合DeepSeek生成的数据简单训练。”他表示,671B的模型和32B的模型对硬件的要求至少相差一个数量级,因此造成有的一体机只需几万元或几十万元,而有的价格需要上百万元。
与此同时,业界对于“满血”的标准并不统一。上述创业者介绍,有的满血版是模型量化后的满血。DeepSeek官方公布的参数精度是FP8,即8比特参数,一台8卡A100的一体机运行原版模型尚显吃力,需要两台才能流畅运行。一些厂家为(wèi)了(le)压(yā)低成本,缩小参数,量化为4比特参数,导致用户直接感受到模型变“笨”了。即便同样是8比特参数,其中也有玄机。有的8比特参数是指INT8而非FP8。为了实现FP8的效果,必须使用诸如BF16等更宽的数据类型,这就导致对硬件的要求更高,需要4台8卡一体机才能运行起来,一体机成本直接飙升到六七百万元。
“除非专业人士,大多数人对于性能本身没有很强的认知和理解力。”胡健同样表示,满血(xuè)版(bǎn)一(yī)体(tǐ)机(jī)中(zhōng),除(chú)了(le)真(zhēn)正(zhèng)的(de)原(yuán)版(bǎn)模(mó)型(xíng),还(hái)存(cún)在(zài)量(liàng)化(huà)版(bǎn)和(hé)蒸(zhēng)馏(liú)版(bǎn),蒸(zhēng)馏(liú)版(bǎn)还(hái)可(kě)以(yǐ)分(fēn)为(wèi)32B、70B等(děng)。用(yòng)千(qiān)问(wèn)模(mó)型(xíng)和(hé)DeepSeek数(shù)据(jù)训(xun)练(liàn)得(de)到(dào)的(de)蒸(zhēng)馏(liú)版(bǎn)也(yě)带(dài)有(yǒu)思(sī)维链,但智商比原版低。而将8比特变为4比特的量化版,其精度和性能同原版相比都有所下降,但强于蒸馏版。
一种过渡需求
“现阶段,用户想尝鲜,企业想卖一体机,就(jiù)可(kě)能(néng)存在鱼龙混杂。”胡健表示,模型版本、并发数、吞吐量都决定了DeepSeek一体机在企业内的适用程度。
并发数是影响DeepSeek一体机使用性能的关键因素。胡健介绍,一些价格10万元的满血版一体机只能做到一个并发,仅供单个用户使用,首字延迟时间也长,影响使用体验。一个100人左右的企业使用一体机检索企业内部知识库,至少要保证10个并发。满血版DeepSeek一体机的并发数在200以内,“如果输入特别长,并发会进一步降低。比如输入一个长文档,再加上一段很长的输入,并发数就会下降。”
行云集成电路创始人兼CEO季宇则告诉澎湃科技,并发数越多,用户体验感越差。例如1000个并发之下,单个用户每秒只能生成5个token,这样的高并发是无意义的,因为输入输出速度也影响实际体验。业界公认的临界输出速度是20 token/秒,这也是DeepSeek官网提供的体验。10 token/秒的输出速度较慢,6 token/秒易使人焦急等待输出。但输出速度慢,对硬件资源的要求就低。
多位业内人士对澎湃科技表示,当前DeepSeek一体机爆火甚至过热,但挑战在于持续维护升级,一体机的综合使用成本仍然高昂。一体机是一种过度需求,无法满足大规模使用,企业最终还是会上云。
胡健表示,一旦进入私有化环境,出于安全考虑,企业不会允许外部远程访问私有数据和系统进行迭代升级。对于销售企业而言,“卖一台几十万元的一体机,还要让人带硬盘飞过去安装升级,也不现实。”对于服务器级别的一体机而言,机房、电力、温度都要满足使用条件,这些改善成本分摊下来,使得一体机的“尝鲜价”并不低。
在胡健看来,当前大模型和业务场景结合仍处于试点阶段,DeepSeek一体机是一个过渡性产品。一台满血版DeepSeek一体机可支持100-200个并发,可支持线上问答应用场景,“一旦真正和业务场景结合,一台一体机的并发完全不够。这时候要么建私有化机房,要么利用公有云或混合云解决高并发、多场景的使用(yòng)问(wèn)题(tí)。”对(duì)于(yú)DeepSeek一(yī)体(tǐ)机(jī)市(shì)场(chǎng)的(de)可(kě)持(chí)续(xù)性(xìng),胡健认为,这取决于大模型能力的持续提升以及与企业业务的结合程度,一旦与企业内部流程和应用打通,就会出现混合云或私有云模式。“如果打通速度快,那就转向上云,如果速度慢,一体机还会持续存在一段时间。”
“开箱即用”的条件
DeepSeek技术革新降低了AI大模型本地化部署的成本和门槛(kǎn),促(cù)进(jìn)了(le)对(duì)于(yú)数(shù)据(jù)安(ān)全要(yào)求(qiú)较(jiào)高(gāo)的(de)央(yāng)国(guó)企(qǐ)和(hé)金(jīn)融(róng)类(lèi)企(qǐ)业(yè)本(běn)地(de)化(huà)部(bù)署(shǔ)DeepSeek等(děng)AI大(dà)模(mó)型(xíng)。广(guǎng)发(fā)证(zhèng)券(quàn)计(jì)算(suàn)机(jī)首(shǒu)席(xí)分(fēn)析(xī)师(shī)刘(liú)雪(xuě)峰(fēng)今(jīn)年(nián)3月(yuè)在(zài)研(yán)报(bào)中(zhōng)提(tí)到(dào),随(suí)着(zhe)DeepSeek本(běn)地(de)化(huà)部(bù)署(shǔ)的(de)广(guǎng)泛(fàn)开(kāi)展(zhǎn),算(suàn)力(lì)一(yī)体(tǐ)机(jī)有(yǒu)望(wàng)放(fàng)量(liàng)。预(yù)安(ān)装(zhuāng)了(le)DeepSeek大(dà)模(mó)型(xíng)的(de)算(suàn)力(lì)一(yī)体(tǐ)机(jī)有(yǒu)望(wàng)在(zài)各(gè)企(qǐ)业(yè)用(yòng)户(hù)侧(cè)快(kuài)速(sù)渗(shèn)透(tòu)。除(chú)了(le)推(tuī)出(chū)不(bù)同(tóng)型(xíng)号(hào)的(de)机型,各家企业还搭载了用于模型微调、语料训练、应用开发的AI基础工具。
但CCF(中国计算机学会)数据发展委员会主任陆志鹏4月份表示,一些企业以为把DeepSeek模型部署到服务器上就是一体机,就可以“开箱即用”,结果客户采购后发现并没有达到说明书上的效果,反而引起法律纠纷。
胡健介绍,公文写作一体机、合同审核一体机等结合使用场景的DeepSeek一(yī)体机,其开箱即用的概率更高。对于脱离场景的一体机,开箱即用的是模型调用,但打通业务流程仍需接入和治理数据,整理数据库,二次开发或微调。
蔺文强建议企业要根据自身使用(yòng)需(xū)求(qiú)采购(gòu)DeepSeek一体机,明确是追求极致的性能还是极致的性价比、是否有国产化需求、是否需要满血版的一体机,同时还要考虑服务调优的(de)响(xiǎng)应(yīng)速(sù)度(dù)和(hé)支(zhī)持(chí)方(fāng)式(shì),“采购一体机要考虑适不适合企业业务,如果不适合就需要调优,甚至需要二次训练。”
对于采购建议,新华三展台的工作人员表示,尽管当前一二三线厂商都在销售一体机,但缺(quē)乏(fá)安(ān)全能(néng)力(lì)。“如(rú)果(guǒ)要(yào)有(yǒu)安(ān)全能(néng)力(lì),就(jiù)得(de)找(zhǎo)其(qí)他(tā)厂(chǎng)家(jiā)再(zài)买(mǎi)一(yī)个(gè)服(fú)务(wu)器(qì)做(zuò)开(kāi)发(fā)和(hé)对(duì)接(jiē)。”该(gāi)工(gōng)作(zuò)人(rén)员(yuán)表(biǎo)示(shì),DeepSeek一(yī)体(tǐ)机(jī)要(yào)考(kǎo)虑(lǜ)数(shù)据(jù)安(ān)全问(wèn)题(tí)。例(lì)如(rú)一(yī)些(xiē)集团(tuán)公(gōng)司(sī)旗(qí)下(xià)多(duō)个子公司之间数据隔离,这(zhè)些(xiē)子公司之间甚至存在竞争关系,集团公司利用不同子公司的数据进行训练就需要保证数据安全。与此同时,由于硬件成本和软件开发成本有差异,一些小厂家的一体机价格反而更高。采购一体机时还需要考虑厂家的技术能力,尤其是当出现漏洞时能否及时提供修复服务。此外要识别DeepSeek版本,不同版本精度不同。
4月底,行云集成电路推出10万元级的满血版一体机,“很多客户在五一期间跟我们对接,现在也有一些客户已经下单。”季宇说,目前一体机行业处于早期阶段,市场秩序的建立仍需时间。如果能够降低新鲜事物的成本,就可以降低试错成本,扩大体验覆盖面,让行业成长起来。“相对于上百万元的机器来讲, 10万元的价位已经便宜了很多,但实际上还是比较贵,我们希望能持续降低价(jià)格(gé),让(ràng)大(dà)家能够低成本体验大模型带来的价值。”
