发布日期:2026-03-02 12:23 点击次数:58

人人头部AI模子API团员平台OpenRouter的数据显露,2026年2月,中国AI模子的调用量三周大涨127%,初次卓越好意思国模子,人人前五中占据四席。
最新的2月16日至22日的周榜单中,平台调用量名次前五的模子中,有四款来自中国厂商,包括MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5、DeepSeek的V3.2。这四款模子算计孝顺了Top 5总调用量的85.7%。
一年前,中国模子在这个平台上的份额不到2%。

图:从2024年11月到2025年11月的周度Token总量堆叠柱状图。深红色=闭源模子,橙色=中国开源模子,蓝绿色=其他地区开源模子。能了了看到中国开源模子(橙色)从险些不可见到逐渐占到近30%的过程。
OpenRouter团员了进步300个模子的API调用,掩盖60多家供应商,进步一半的使用量来自好意思国除外。开垦者拿一套API Key就能在不同模子之间即时切换,淌若哪个不好用,不错秒切。Token数据在OpenRouter的涨跌,险些就是及时的阛阓投票。
这个时候,刚刚经过了开源个东说念主智能体框架OpenClaw的火爆,也资格了中国春节AI大战,险些扫数模子的要道词照旧切换成了“Agentic”。
昔日两年,大模子竞争的中枢叙事是模子智商:谁更灵敏,谁在 ARC、SWE-Bench 这类 benchmark 上更高分,谁就更接近 AGI。参数规模、推理深度、复杂任务完成率,组成了行业的主要坐标系。
可是2026年的春节事后,Agentic AI的中枢叙事是捏续完成任务,包括写代码、调试、调用器具、读取文献、再迭代。Token 花费从“东说念主机对话”升级为“机器自轮回”。一次任务可能花费数十万、数百万 Token。
模子之间的各别,运转转化为在长历程、高频调用、长高下文环境下,谁的单元老本更低、镇定性更强、推理弧线更平滑。

图:OpenClaw是OpenRouter最大的单一应用,其Token花费量约占平台显耀比例

图片由AI生成
Token花费的底层逻辑变了
OpenRouter与a16z连合髻布的《2025 AI使用敷陈》,掩盖超100万亿Token的匿名元数据。里面有一组数据极其要道——编程任务的Token占比从2025岁首的11%飙到了50%以上,成为平台最大的单一使用品类。同期,Agent驱动的责任流(模子自主奉行多行径任务)产生的输出Token已进步平台总输出的一半。

图:编程类央求在扫数LLM查询中的占比,从2025岁首约11%捏续攀升至50%以上
昔日的问答式AI,一轮对话花费几百到几千Token,用户不再发问,Token就不会再花费。Agent方法下,机器不错捏续在后台跑历程。
拿OpenClaw例如,它的Token花费和简约看有三种方法:
一是多轮自我修正。一次编程任务可能资格“写代码→运行→报错→改→再跑”几十个回合,每个回合都是一次完满的模子调用。
二是高下文无尽膨大。为了让Agent“记取”之前的操作,每次调用都要佩戴完满对话历史。有效户实测,一个活跃会话的高下文很快膨大到23万Token以上。
三是器具链级联。Agent处分一个“帮我整理邮件并创建待办”的任务,可能触发5-10次API调用,每次都背着完满高下文。
有OpenClaw用户吐槽,一个竖立不当的自动化任务一天烧掉了200好意思元API费。更直不雅的数字是:7×24小时跑OpenClaw,全量使用Claude API,媒妁本在800到1500好意思元之间。
再看OpenRouter本身的数据:2月9日当周,平台处分了13万亿Token,1月第一周是6.4万亿,一个月翻了一倍。平台最新周Token总量12.1万亿,是一年前的12.7倍。
AI的使用方法从“对话型”切换到了“历程型”,Token花费从“按次”变成了“按流量”。老本明锐度被急剧放大。
Agent模子组合背后的契机
顶点假定Agent全天候运行,每天吞掉数十亿Token。在这种负载下,价钱差距就是死活线。
面前主流模子的API订价对比(每百万Token,好意思元)

Claude 4.6 Sonnet 的输出价钱为 15 好意思元 / 百万 Token,而 MiniMax M2.5 的典型输出价钱约为 1.1 好意思元 / 百万 Token,前者是后者的约 13.6 倍。GPT-5.2 的输出价钱为 14 好意思元 / 百万 Token,也接近 MiniMax 的 12.7 倍。即等于照旧加价的智谱 GLM-5,输出价钱约为 2.55 好意思元 / 百万 Token,仍然只消 Claude 的大概六分之一傍边。
在 Agent 场景里,这种差距会被指数级放大。假定一个坐蓐级 Agent 每天处分 10 亿输出 Token(即 1000 个百万 Token 单元),挂 Claude 意味着每天约 1.5 万好意思元的开销;一样规模淌若使用 MiniMax,大概 1100 好意思元。30 世界来,前者接近 45 万好意思元,后者约 3.3 万好意思元,中间差出 40 多万好意思元。
这个价差照旧在确切形势里决定了开垦者的选拔。
一家使用OpenClaw的欧洲开垦责任室公开了他们的决策:80%的正常推理引擎用Kimi K2.5,遭逢高难度推理、复杂系统架构之类的20%硬骨头,通过bash大呼把任务甩给Claude。一天的Kimi开销大概5到10好意思元,月度Token预算截止在150到300好意思元。淌若一样的事全量用ClaudeAPI方法,媒妁本将高达800-1500好意思元以上。

“80%智商,20%价钱”的组合,对标“100%智商,100%价钱”的决策,在实践部署中是碾压级的劝诱力。
a16z结伙东说念主Martin Casado客岁底接管《经济学东说念主》采访时也裸露了一个数字:在使用开源模子的AI初创企业中,约80%跑的是中国模子。他其后在X上瓦解,这个比例指的是“用开源模子的那部分创业公司”,占沿途创业公司的20%-30%,折算下来,大概16%-24%的好意思国AI初创企业期间栈里嵌着中国开源模子。
OpenRouter COO Chris Clark说得更平直:中国洞开权重模子在好意思国企业运行的Agent责任流中“占比特别高”。
架构暗战,“Agent原生”
这一轮范式转化中,中国开源模子阵营险些扫数头部玩家都把“Agentic”手脚主攻方针,从架构到磨练全链路为Agent场景作念原生适配。
底层仍然无间了上一阶段跑通的MoE + MLA道路,总参数作念大,每次推理只激活一小部分,保住智商的同期截止Token老本。
但光低廉不够,在这一轮着实拉开差距的,要在Agent场景下“跑得好”。
MiniMax里面开垦了一套叫Forge的原生Agent强化学习框架,milansports中枢联想是把Agent的奉行逻辑跟底层训推引擎透顶解耦:Agent只管跑任务、产出轨迹数据,磨练引擎只管从轨迹里学习。这套架构能接入苟且Agent脚手架。MiniMax裸露的数据是,他们在数十万个确切Agent脚手架和环境上作念了大规模强化学习,高下文长度拉到200K。
Forge里有两个工程细节值得提防。一是“前缀树合并”,Agent多轮央求之间有宽敞近似的高下文前缀,传统行径把每个央求当孤独样本近似忖度打算,Forge把磨练样本从线性序列重组成树形结构,分享前缀只算一次,MiniMax给出的数字是磨练加快约40倍。
二是奖励联想:除了任务完成度,M2.5的强化学习还把“任务完成时候”手脚奖励信号,平直引发模子选最短旅途、主动哄骗并行。成果上,凭证Minimax的数据,M2.5跑SWE-Bench Verified的端到端时候22.8分钟,比上代M2.1的31.3分钟快了37%,跟Claude Opus 4.6的22.9分钟基本捏平。贯穿运行1小时(100 TPS)老本1好意思元,MiniMax的说法是“1万好意思金不错让4个Agent贯穿责任一年。
Kimi K2.5可守旧Agent集群,能凭证任务需求现场调整多达100个“分身”,组成不同变装的团队并行责任,最多同期处分1500个行径。在大规模搜索场景下,Agent集群比单Agent减少了3到4.5倍的要道行径,实践运行时候最高裁汰4.5倍。
K2.5的定位就是原生多模态、Agent模子,同期守旧视觉与文本输入、想考与非想考方法、对话与Agent任务,架构层面作念了全面适配。
这些革命名义,中国头部模子照旧不单是在“低廉”上作念著作。
闭源模子Anthropic和OpenAI的模子架构是黑箱,开垦者没法评估长期运行的老本弧线,也没法作念腹地部署优化。但Claude的长板在居品化智商,computer use、Artifacts、MCP生态,以及复杂推理的精准度。

图:编程类Token按闭源/中国开源/其他开源的占比拆分。能看到Anthropic Claude在编程领域长期占据60%+的份额,但中国开源模子和其他开源模子在2025年下半年捏续蚕食它的份额。
竞争力照旧变成各别化:中国开源模子工程细节透明,不错被复刻和优化,在老本明锐的大规模部署里占优;好意思国闭源模子的长板在居品化智商和复杂推理的精准度上。
Agent期间到来,中国开源模子照旧吃到了结构性红利。
价钱战杀青了,需求战运转了
2月12日,智谱AI发布GLM-5的归并天,通知GLM Coding Plan套餐全体加价30%起,取消首购优惠。国外版加价幅度更大,订阅价钱涨30%-60%,API调用涨67%-100%。
这是国产大模子2026岁首次大幅提价。
配景也很有兴味。昔日一年多,中国大模子阛阓打了一场惨烈的价钱战。字节豆包报价低到0.0008元/千Token,阿里通义千问GPT-4级主力模子降价97%,智谱我方也把上一代GLM-4-Plus砍了90%。
面前掉头加价,同期GLM Coding Plan上线即售罄,国产AI编程居品的付费套餐被秒空。
这里也生息出另外一个问题,“智谱敢加价,是不是确认中国模子的增长跟价钱战无关”?
谜底不是“是或否”这么通俗。
Agent化让Token需求暴涨,中国模子凭着相对老本上风吃到了增量,加价实质上是供需再均衡。智谱陈诉加价:“用户规模与调用量快速普及,公司同步加大算力进入”。
据媒体报说念,Kimi K2.5在1月27日发布后不到一个月,近20天的累计收入照旧进步了2025年全年总收入。这个增长的中枢驱能源来自国外开垦者和API调用,K2.5在OpenRouter平台的调用量捏续位居前哨,平直带动了B端收入的暴涨,国外收入初次进步国内。
MiniMax的情况类似,M2.5发布7天内Token使用量就随心3万亿,里面数据显露M2.5生成的代码已占公司新提嘱咐码的80%。
放到行业里看,智谱、月之暗面、MiniMax、阶跃星辰4家都已上调部分API价钱。长江证券研报的判断是:国产模子“老成进入需求驱动期间”。
价钱战的期间杀青了,接下来是需求战。
数据里有些许水分?
对于此次暴涨,也有争议说,此次的Token数据有水分。
比如,MiniMax M2.5单周197%的暴涨,很猛进程上受益于Kilo Code和Cline两大AI编程器具的免费推行。2月12日起,Kilo Code为进步150万开垦者用户提供一周免费M2.5造访,Cline也搞了类似行径。
免费送量带来的短期拉动,客不雅上是不行忽略的。但免费推行只可讲明“量”的爆发,讲明不了趋势和留存。
MiniMax M2.5在编程、器具调用和搜索、办公等坐蓐力场景都达到或者刷新了行业的SOTA,比如SWE-Bench Verified (80.2%),Multi-SWE-Bench (51.3%),BrowseComp (76.3%);从Benchmark来看,分数够到了旗舰级的门槛,不行再用“低价平替”来概述。
OpenRouter年度数据显露,中国开源模子份额从2024年末不到2%,2025年下半年加快爬升,某些周接近30%。
一条捏续上行的弧线,跟某次促销带来的孤独脉冲王人备是两回事。
榜单中还有另外一个细节,前五名里,MiniMax、月之暗面、智谱、DeepSeek是四个不同团队的居品。此次不单是是一个爆款在带节拍,是中国开源模子生态的工程老到度在国际化的阛阓中受到了招供。

图:2024年末DeepSeek V3和R1占了一半以上(深蓝色),2025年中之后色块急剧万般化,Qwen、MiniMax、Kimi、GPT-OSS等按序上位,莫得单一模子进步25%。
写在终末
Agent期间正在重写模子竞争的法例。
Agent使用组合模子的决策,让模子性价比的权重在普及。
API团员平台的成长一定进程上瓦解了原厂的进口壁垒。
{jz:field.toptypename/}开源模子的工程老到度照旧够得上产等第。人人开垦者把中国开源模子镶嵌坐蓐环境的Agent责任流,跑在确切业务里,跟实验室的刷分王人备是两码事。
2026年开年,模子范式又一次更替,从对话式AI到AgenticAI,中国开源模子在2026年开年收拢了这个结构性窗口。
但变局远莫得到至极。
开始:腾讯科技
上一篇:米兰体育官网 千问AI眼镜来了!181只中枢见识股豪赌下一代迁徙进口
下一篇:没有了