全球AI开发者正集体“向东看”:中国大模型调用量连续4周碾压美国

作者: 智享AI发布日期: 2026/5/25阅读时间: 3分钟
全球AI开发者正集体“向东看”:中国大模型调用量连续4周碾压美国 封面图

上周,全球AI大模型又用掉28.9万亿个“词”——这相当于每个地球人读完整套《哈利·波特》还多三遍。更关键的是,中国模型占了9.22万亿,比美国多出近一倍,而且已经连续四周把美国甩在身后。

这数据来自第三方监测平台OpenRouter。从5月18日到24日,全球大模型调用量连续第五周上涨,环比增长7.4%。中国模型的周调用量环比猛增19.89%,达到9.22万亿Token;美国是4.93万亿,增速16.27%。差距不光在数字上,还在增速——中国跑得更快。

为什么全球开发者开始“抛弃”美国模型?

最直接的原因:便宜好用。智谱GLM系列、DeepSeek、Qwen这些国产模型,性能对标GPT-4,但API价格低一大截。对于中小创业公司和东南亚、非洲的开发者来说,这就像用瑞幸的价格喝到星巴克——谁不心动?一位硅谷AI创业者告诉我,他团队搭建的Agent系统里,中国模型已经占了一半调用链,“延迟更低,成本砍掉70%”。

更深层的变化是“生态嵌入”。以前海外开发者觉得中国模型水土不服,现在OpenRouter上的路由配置越来越顺畅。无论是自动写代码、批量生成营销文案,还是做多模态分析,中国模型都能无缝接进工作流。字节跳动的Lance 3B原生多模态模型、智谱GLM-5.1每秒400个Token的高速接口,都让开发者觉得“不用白不用”。

还有一个隐形红利:调用量越大,模型学得越快。每次API调用都是真实世界的反馈数据,中国模型在跑量中收集的全球语料,反过来又能优化下一版性能。这就形成“调用越多→性能越好→调用更多”的正向飞轮。

当然,这不意味着美国模型要完。行业分析师更愿意说“多极化”。未来两年,全球开发者会像超市购物一样,根据任务种类混合使用中美模型——处理高精度科研用美国模型,日常内容生成用中国模型。算力和数据在全球流动,2026年的AI版图会比今天丰富得多。

对普通人来说,这意味着什么?很快,你用AI写周报、做PPT、画图的开销可能再降一半。而创新的火花,就藏在每一次毫秒级的API调用里。

aitechinnovation
精选评论
评论加载中…
发表讨论 »