三家混战,大模型重回2023

来源:投资界时间:2025-08-03 13:31:36   阅读量:4235   

沉寂许久的大模型竞技场,在这个夏天,又硝烟四起。

最近一场战役,发生在刚刚落幕的“AI春晚”WAIC期间。贴身对垒的三方,是六小虎中的阶跃星辰和智谱,以及大厂中的模型强队,阿里。

7月25日,阶跃计划开源最新的多模态推理模型:Step-3。同一天,阿里又发布了全新的通义千问3推理模型。

28日,智谱发布了最新一代基座大模型:GLM-4.5。而阿里的攻势不断——再次在同一天,阿里放出了多模态大礼包,开源了通义万相2.2,涵盖文生视频、图生视频、统一视频生成三种模态。

其中颇有火药味的一幕是:7月25日,最新的通义千问3,还被阿里冠以“全球最强”之名;三天后,GLM-4.5就以新王之姿成了全球开源模型的“SOTA”——在智谱放出的综合性能榜单中,GLM-4.5排全球第3,通义千问3排第9。

智谱GLM-4.5在模型综合性能榜单排第3。图源:智谱

一名智谱员工告诉“智能涌现”,算法团队几乎所有人都守着通义千问的更新,“太紧张了。”他说,“万一差距太大,我们后发就是个笑话。”直到GLM-4.5跑赢Agentic能力在内的多个测评集,他心中的石头才落地。

WAIC上的硝烟,是这两个月以来六小虎模型混战的一个缩影。

仅过了一个月,月之暗面的新开源基础模型K2,又以横扫之势,拿下了24项开源模型SOTA。

转型后的百川智能和零一万物,既缺席了WAIC,也缺席了新一轮的模型混战。

DeepSeek V3、R1发布后,六小虎在市场上已经沉寂了近半年。

高管离职、人才出走,也已是常态。脉脉的一份报告显示,截至2025年7月初,六小虎中41.07%的员工都把状态设置成了“看机会”。

后DeepSeek时代的战役,对六小虎能否回归舞台中央,甚至存亡,至关重要。这份成绩单,极大程度影响着公司后续的资本操作和商业化进展。

更重要的是,在市场口碑下滑、内部军心涣散的半年中,六小虎急需一场翻身仗,向内外证明自己仍有留在大模型牌桌上的底气。

但后DeepSeek时代的模型战役依然艰险。DeepSeek R1的掀桌,证明了模型要想一鸣惊人,不仅性能要好,还得发得早。

被抢先的感觉,至今仍让不少小虎心悸——我们得知,K2的训练从2024年末就开始筹备,也是月之暗面的自信之作,本计划在2025年中旬发布。然而,R1的抢先发布,抢走了本可能属于Kimi的荣光。

为了防守,R1发布的同一天,月之暗面不得不先释出带有遗憾的版本K 1.5。最后的市场声量,不尽人意。

K2发布后的好口碑,某种程度上也抚平了被DeepSeek抢先的创伤。发布当晚,月之暗面联合创始人张宇韬则在朋友圈写下:make kimi great again。

只是,K2的先声夺人,让同样主打Coding和Agentic能力的智谱,也感受到了不甘。

我们了解到,为了打赢推理模型的SOTA之战,GLM-4.5的训练已经花了将近3个月的时间。为了在多智能体任务上获得更好的表现,智谱甚至没有坚持一以贯之的Dense路线,而是改用了MOE(混合专家模型)架构。

“一开始GLM-4.5是想做国内*个对标Claude 4的模型。”有从业者告诉“智能涌现”,“可惜月暗的保密工作做得太好了,K2发布当天才知道技术细节。”

智谱被月之暗面打了个措手不及,最后一个月紧急加训,硬是把GLM-4.5的Coding和Agentic能力,在测评集上拔高到了“小断”K2的程度,占住了六小虎最高的山头。

如今赛场上兵刃相接、针锋相对,也让这几家大模型公司像曾经的2023年一样,重回了舞台中心。

不过,与2023年行业“重参数、搞闭源”的普遍风气不同,如今的中国模型,已经把打响技术口碑给玩明白了。

自DeepSeek起势后,开源和放出技术报告,成了六小虎发模型的标配。

“模型的*批用户,肯定是开发者,如果没有抓住开发者,模型的声量是很难起来的。”一名在WAIC上的AI应用开发者告诉我们。

他将开源,比做大模型触达开发者的门:“现在找到开发者是很简单的,大家都聚集在Hugging Face、GitHub上,模型厂商要做的就是把开源链接发到上面。”

开源是门道,剩下的,就要交给技术实力。

即便经过了动荡的半年,但六小虎依然拥有远超普通创业公司的资金和人才储备。

可见的是,在这一轮模型混战中,六小虎都没有收获将彼此碾压的成绩,但各有各的亮点:

MiniMax已经坐稳了视频生成的头部;

Kimi K2和GLM-4.5先后狂拦模型SOTA;

阶跃的Step-3则领跑了多模态这一尚且小众的赛道。

没有*的赢家,但经历这一轮模型混战后,六小虎在全球模型战场上,几乎都拥有了姓名。

模型开放平台OpenRouter的统计显示,2025年7月28日,Kimi K2位居全球模型调用量的第6,而GLM-4.5在发布当天,就冲上了第20的位置。

MiniMax发布Hailuo 2后,Hailuo AI的下载量猛增——点点数据显示,Hailuo AI 7月22日的单日下载量,达到了11万。

2025年7月28日,全球模型调用量排行榜。图源:OpenRouter

上岸的四小虎,获得了继续游戏的续命符。

连续5天发布包括M1在内的模型和产品后,MiniMax传来了筹备IPO的消息。同样的,在阶跃发布会上,Step-3发布后一锤定音的,是一笔来自上海国投等机构的超5亿美元融资,以及阶跃星辰CEO姜大昕口中,“10亿元”的年营收目标。

不过,模型之战,还远未决出胜者。在以“中国不需要这么多的基座模型”为共识的前提下,六小虎在模型之战中,尚未走到可以安心的时刻。

角逐不仅发生在六小虎内部。WAIC期间阿里的接连猛攻,已为六小虎敲响警钟——多模态、Coding、Agent,六小虎无法兼顾的几个模型方向,大厂却可以轻松All in。

对剩余的四小虎而言,新一轮的淘汰赛才刚刚开始。

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

猜您喜欢
推荐阅读
电子行业年报综述:行业虽面临压力整体仍保持相对稳健增长
电子行业年报综述:行业虽面临压力整体仍保持相

电子年度报告摘要2021年,电子行业尽管受到全球疫情和行业周期的干扰,但仍保持稳定增长态势。2021年,申万电子行业整体...更多

2022-05-16 13:21:00
潮安登塘举办乡村振兴电商特训班,培养农特产品带货能手
潮安登塘举办乡村振兴电商特训班,培养农特产品

“我以前是刷短视频的。不知道别人的视频怎么拍的这么好?通过老师的讲解,我终于领悟了,受益匪浅!”5月14日至15日,潮州...更多

2022-05-16 13:18:00
2022前四月住宅新开工面积同比下降28.4%
2022前四月住宅新开工面积同比下降28.4

北京商报今日讯——5月16日,国家统计局发布2022年1-4月全国房地产开发投资数据。1-4月份,房地产开发企业房屋施工...更多

2022-05-16 12:51:00
西北地区绿色电力交易实践与思考
西北地区绿色电力交易实践与思考

绿色电力交易是指以绿色电力产品为标的物的中长期电力交易,是中长期电力市场体系中全新的交易品种。绿色电力交易的目的是将新能...更多

2022-05-16 12:39:00
华为鲁勇:打造数字经济新动能让更多的人从数字技术中受益
华为鲁勇:打造数字经济新动能让更多的人从数字

在2022年世界电信和信息社会日到来之际,我谨代表华为向广大客户、产业链合作伙伴和各界朋友致以诚挚的问候,期待与您携手共...更多

2022-05-16 11:46:00
GSMA:中国大陆5G渗透率36.82%位居全球第二
GSMA:中国大陆5G渗透率36.82%位居

近日,GSMA发布了最新的统计信息。截至2022年第一季度,在全球5G渗透率排名中,南韩以44.92%位居第一,其次是中...更多

2022-05-16 11:22:00
看了这款潮野SUV哈弗大狗,我直接退掉了CRV的订单
看了这款潮野SUV哈弗大狗,我直接退掉了CR

费用在心里。随着国家自主品牌趋势的觉醒,对应这个细分市场的产品也越来越丰富。我们不再需要在少数合资品牌中挑三拣四,可以进...更多

2022-05-16 11:20:00
统计局:前4月全国固定资产投资153544亿元同比增长6.8%
统计局:前4月全国固定资产投资153544亿

据国家统计局网站消息,1-4月,全国固定资产投资153544亿元,同比增长6.8%。其中,民间固定资产投资86872亿元...更多

2022-05-16 11:20:00
+ 点击查看更多精彩
1521
    最近更新
上市公司高质量发展势头强劲
    近日,中国上市公司协会根据4805家上市公司...
主板、创业板、科创板排名前100公司去年实现净利润3.91万亿高质量发展
    内生增长动力不断提升。从营业总收入来看,主板...
读者期待“红五月”行情
    本周a股走出了相对外围市场的独立行情,大众证...
锂电铜箔行业扩产潮起!诺德股份投建10万吨超薄项目产能激增330%明年或
    不考虑下游需求,锂电池上游材料的扩张节奏从未...
2022款上汽大通MAXUST70澳洲版焕新上市售价12.78万元起
    5月13日,2022款MAXUST70澳版S...