
文 | 字母榜,作家 | 苗正,剪辑 | 王靖
在智谱最初文书开源 GLM-5 后不到半天的时辰里,MiniMax 立马跟进上线 M2.5 编程模子。
就在发布模子确当日,智谱股价开盘大涨,一度涨超 25%,周内累计涨幅越过 77%,市值蹂躏 1700 亿港元。
MiniMax 同日涨幅一度越过 20%,总市值越过 1800 亿港元。两家公司的股价发达远超大盘。
这种涨幅在港股 AI 板块并不常见。
要知谈,智谱在 1 月 8 日 IPO 时,刊行价为 116.2 港元,其时的市值是 518 亿港元。短短一个月时辰,市值翻了三倍多。
此外,智谱和 MiniMax 采纳这个时辰点发布,是有其践诺考量。
2 月 12 日恰是企业和确立者春节前临了的职责窗口。
此时发布模子,既能赶在假期前完成技巧社区的首轮传播,又能让确立者在春节长假时间有充足时辰试用和盘考。
此前我曾觉得,春节窗口期可能是裹着 AI 外表的红包大战,归根结底,比的是红包的数目和额度。但咫尺看来,我的推断是错的。
AI 产业在春节时间,进入了一个"万模皆发"的盛况。
从 1 月底启动,阿里的 Qwen3-Max-Thinking、月之暗面的 Kimi 2.5、阶跃星辰的 Step 3.5 Flash 已接连发布。
随后在 2 月 8 日,阿里千问团队又向 Hugging Face 提交了 Qwen 3.5 的撑握代码,证实新模子行将到来。
字节高出则筹备在 2 月 14 日推出豆包 2.0,何况新的豆包包含了 Seedream 5.0 和 SeedDance 2.0 的完好矩阵。
至于 DeepSeek 的 V4 版块,其是否会在春节时间发布仍存疑,但即便不发布新版块,市集也如故充足侵略。
信得过的战场,在于模子智商自己,红包退居其次。
花旗银行曾在 1 月 26 日明确指出,2026 年记号着 AI 助手从技巧考证迈向全民级诳骗的拐点,春节成为磨真金不怕火用户风气养成的重要窗口。
谁能在这个长假,用模子留下用户,谁就能在接下来的一年里占据主动,就像 2025 年的 DeepSeek 雷同。
智谱和 MiniMax 两大模子究竟如何?
GLM-5 的中枢定位,是面向复杂系统工程与长程 agent 任务。
淌若说以前的 AI 编程器用仅仅帮你写代码,那 GLM-5 念念作念的,是帮你完成整个系统工程。
智谱将这一模式叫作念" agent engineering ",何况默示,这是" vibe coding "的下一阶段。
不外这个说法并非附耳射声,前 OpenAI 谄谀创举东谈主兼 AI 阁下安德烈 · 卡尔帕西(Andrej Karpathy)在" vibe coding "实践一周年时就曾默示过,确立者的变装正在从"写代码"转向"编排 AI agent "。
GLM-5 某种经过上是对这一趋势的酬劳。
几周前,开源社区曾流传一个名为" Pony Alpha "的好意思妙模子。它能进行长程交互、拆解复杂任务、在多轮对话中保握远大凹凸文,一度激发庸碌臆测。
如今谜底揭晓,Pony Alpha 恰是 GLM-5 的匿名测试版块。
GLM-5 在技巧规格上已毕了显赫跃升。参数目从 GLM-4.7 的 355B(激活 32B)膨大至 744B(激活 40B),预磨真金不怕火数据从 23T token 加多到 28.5T token。
更大的参数畛域意味着更强的学问储备和推贤慧商,但更重要的场地在于 GLM-5 的两项改进。
第一项是名为" Slime "的异步强化学习框架。
这套系统撑握模子从长程交互中握续学习,在处理需要数十步操作的工程任务时保握计策一致性。
传统的 AI 编程器用每每在短对话中发达出色,但一朝任务链条拉长,模子就容易犯错,前后逻辑出现断裂。
Slime 框架的设想初志,便是让模子在长周期任务中保握"顾虑"和"筹备感"。
第二项是集成了 DeepSeek 的荒芜细心力机制(DSA)。
这套机制能让模子在保握长文本处贤慧商的同期,大幅裁减部署本钱。
DSA 的机制其实很好瓦解,我举个例子,当你让 AI 分析一个包含数万行代码的样式时,它不需要对每一瞥代码都干涉同等的狡计资源,而是或者识别出哪些是重要逻辑、哪些是叠加模板。
因此整个模子的运行成果就会栽培,全体运行本钱也会裁减。
把柄智谱给出的测试分数,GLM-5 在 SWE-bench-Verified 和 Terminal Bench 2.0 等分手取得 77.8 和 56.2,是咫尺开源模子的最高分数。

留意先容一下后者,Terminal Bench 2.0 是测试模子在大喊行环境中的操作智商,金沙电玩城比如能否正确施行文献操作、调用器用、处理失实。
56.2 的分数标明,GLM-5 如故具备了颠倒经过的"脱手智商"。
在 agent 智商上,GLM-5 在 BrowseComp、MCP-Atlas 和 τ² -Bench 等多个评测基准中取得开源 OTA 发达。
迥殊值得暖热的是 Vending Bench 2 测试。
这是最近比较火的基准。它的条目是模子在模拟环境中规齐整家自动售货机公司,周期为一年。
它要我方决定进货、订价、库存结构、现款流管束,在资源有限的情况下握续优化利润。
GLM-5 在这个测试中,最终账户余额达到 4432 好意思元,也便是说其具备一定的长久缱绻和资源管贤慧商,至少比我强。
MiniMax 的最新模子 M2.5 咫尺在模子界面如故不错采纳调用。
这是一个为 agent 场景原生设想的模子,MiniMax 官方称其对见地是 Claude Opus 4.6。
不外与智谱不同,MiniMax 官方并未公布其论文或 Hugging Face 权重。
M2.5 模子激活参数目为 10B,在显存占用和推理能效比上具有明白上风。
比较 GLM-5 的 40B 激活参数,M2.5 走的是"小而好意思"的阶梯,用更少的参数已毕更高的成果。
该模子撑握 PC、App、跨端诳骗的全栈编程确立,尤其适配 Excel、深度磋磨(deep research)、PPT 等分娩力场景。
从社区反馈来看,MiniMax M2.5 在本钱效益上保握了该企业一贯格调,低廉、实惠。
有确立者在外网论坛上共享,M2.5 在处理闲居编程任务时,速率比 Claude Sonnet 4.5 快 2 倍,API 本钱却唯有后者的 8%。
它们有何不同?
两个模子都将编程智商看成中枢竞争力,但技巧旅途有所不同。
{jz:field.toptypename/}GLM-5 通过更大的参数畛域和更强的预磨真金不怕火数据来已毕智商栽培,在处理大型代码仓库和复杂系统工程方面展现上风。
它就像一个辅导丰富的架构师,见过充足多的代码模式、瓦解充足深的系统逻辑,因此或者在复杂场景中给出更全面的处理决议。
而 MiniMax M2.5 则通过更高效的架构设想,在推理速率和本钱适度上更具上风。
天然辅导积存不如架构师丰富,但在常见任务上响应更快、施行更高效。
依我推测,GLM-5 应该更稳当专科行动员处理复杂的、永劫的、系统级任务,比如一键克隆 Web UI、构建仿真桌面,这些需要深度瓦解和长程缱绻的工程样式。
MiniMax M2.5 则更稳当全栈确立、跨端诳骗等分娩力场景中发达更好,迥殊稳当那些需要快速迭代、频繁调用的闲居确立任务。
股价高潮并非模子
但我觉得这轮高潮并非单纯的新模子发布效应。
智谱除了发布模子除外,还文书了居品的加价,GLM Coding Plan 价钱上调 30% 以上。
智谱在价钱治愈函中明确默示,这次加价源于" GLM Coding Plan 市集需求握续强劲增长,用户畛域与调用量快速栽培"。
为保险高负载下的远大性与干事质地,智谱还同步加大算力与模子优化干涉。
这个逻辑耐东谈主寻味。
在 AI 大模子行业,大大批公司都在通过降价来霸占市集份额,DeepSeek 便是如斯,以极低的价钱冲击市集,各家纷纷跟进降价。
但智谱采纳了相背的计策,栽培居品智商,然后加价。
但用户确凿痛快为更强的智商付费吗?
GLM-4.7 发布后,其 MaaS 平台的年度陆续性收入(ARR)从 2000 万元增至超 5 亿元,10 个月取得 25 倍增幅。
这讲解,在 AI 编程这个细分市集,专科用户如实痛快为信得过能栽培分娩力的器用买单。
不外,和智谱股价高潮雷同,MiniMax 股价高潮的原因,也不全是来自于新模子的发布。
2 月 10 日,MiniMax 取得了摩根大通的初度笼罩,取得"超配"评级和 700 港元筹备价,并在当日激发股价一度高潮 10.7%。
摩根大通后确指出,MiniMax 2025 年前三季度国外收入占比高达 73.1%,远超国内 AI 同业。
因此摩根大通将 MiniMax 描述为 "天生巨匠化"的 AI 企业,觉得其巨匠化布局是中枢竞争力。
国际市麇集,OpenAI、Anthropic、谷歌的订价决议都远远高于 MiniMax,这就导致后者的中枢竞争力更强。
不仅如斯,西洋市集对 AI 器用的采纳度和付费智商,广泛高于国内市集。
MiniMax 的这一上风,在面前的国际环境下显得尤为珍摄。
不错预念念的是,2026 年的春节,注定会成为中国 AI 发展史上的一个蹙迫节点。
智谱和 MiniMax 的同期抢跑,天然仅仅这个雄壮叙事中的一个小小章节。
但它至少讲解了一件事,国产大模子公司如故不执着于比参数和融资畛域了,而是确凿在议论如何把技巧酿成确立者痛快掏钱的器用。

备案号: