漲十周后連降兩周!全球AI大模型Token調用量遭遇逆轉,到底誰在為算力漲價買單?
“免費午餐”結束,算力賬單來了。
狂飆十周的AI大模型Token調用量,在2026年4月突然踩下“急剎車”。
作為AI行業的核心 “晴雨表”,全球最大AI模型API聚合平臺OpenRouter數據顯示:全球大模型總調用量在連續10周增長后,4月6日- 12日、4月13日- 19日連續兩周下滑,最新單周總量降至20.6萬億Token。更值得關注的是,中美市場走勢徹底分化 ——中國大模型周調用量環比暴跌23.77%至4.44萬億Token,美國模型逆勢增長20.62%至4.91萬億 Token,近兩月首次反超。


01 國產模型產品力迎大考
“Token資費普遍上漲,成本增高,用戶不得不控制總量節約成本。”上海財經大學特聘教授胡延平告訴《每日經濟新聞》記者,當價格優勢不再突出,模型的產品力便成為左右用戶選擇的關鍵。
胡延平分析,上周美國AI大模型調用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉動。這兩款模型已成為編程領域的“硬通貨”,而國產大模型在這方面的產品力仍需提升。
OpenRouter數據顯示,上周,Claude Sonnet4.6沖上榜首,周調用量達1.38萬億Tokens,環比增長19%。Claude Opus4.6位居第三,周調用量達1.22萬億Tokens。兩款模型合計占美國AI大模型周調用量逾五成。
與此形成對比的,是近期國產模型的過山車行情。
在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66萬億Tokens的周調用量居全球榜首,但僅過一周(4月13日至19日)便下滑出榜單。
此外,記者注意到,此前多次上榜的Kimi K2.5、智譜GLM系列模型,已連續三周未登榜。此前一度沖上榜單第二的階躍星辰Step 3.5 Flash,近兩周同樣無緣榜單。
胡延平認為,OpenRouter平臺的用戶以開發者和中小企業為主,對模型迭代能力和垂直場景產品力要求極高。“市場用戶有往頭部主力模型集中的趨向,在能夠觸達的范圍內,用戶只用最好的。”他指出,用戶場景越來越要求模型具備強工具調用能力、多Agent(智能體)支持、長程復雜任務的持續達成能力,目前OpenRouter上的大部分模型在這方面還需著力提升。
有業內人士也向《每日經濟新聞》記者指出,算力成本上漲后,行業內普遍優先選擇性能穩定、輸出效果可靠的工具,價格已非首要考量。
02 算力漲價的根源:需求 “海嘯” 撞上供給 “天花板”
這場 AI 算力漲價,不是短期波動,而是供需徹底失衡的必然結果,核心是需求指數級爆發,供給卻被物理瓶頸死死卡住。
1)需求端:AI 智能體引爆,Token 消耗 “千倍增長”
2026 年 AI 行業最大的變量,是 **AI Agent(智能體)** 的規模化爆發。以爆款應用 OpenClaw(“龍蝦”)為代表,智能體徹底改變了 Token 消耗邏輯:
– 傳統模式:人機一問一答,Token 消耗線性增長,單次對話僅數十至數百 Token;
– Agent模式:自主拆解任務、多輪迭代、自我糾錯、反復調用工具,單任務 Token 消耗暴漲 1000 倍。
數據更直觀:今年 3 月,我國日均 Token 調用量超 140 萬億,較 2024 年初增長超 1000 倍。一個普通智能體運行一天,算力成本就高達 1000-5000 美元;甚至有企業吐槽,“200 美元訂閱費的用戶,每月消耗 5000 美元算力”,完全 “賣得越多虧得越多”。
2)供給端:硬件、產能、能源三重 “硬約束”
需求狂飆,但算力供給卻被物理世界牢牢鎖死:
– GPU 芯片極度稀缺:英偉達 Blackwell 芯片時租 4.08 美元,兩月漲 48%;H100 年租價從 1.7 美元 / 小時漲至 2.35 美元,漲幅近 40%;B200 租價達 5.47 美元 / 小時,環比漲 23.5%。高端 GPU 訂單排至 2027 年,有錢也租不到。
– HBM 內存價格翻倍:作為大模型核心存儲,HBM 產能不足,2026 年一季度價格直接暴漲 90%。
– 先進封裝與能源瓶頸:英偉達 CoWoS 封裝需求年增 40%,產能嚴重不足;同時,AI 算力耗電極增,多地出現電力供應緊張,進一步限制算力擴張。
無限需求撞上剛性供給,算力從 “普惠資源” 變成 “頂級稀缺資產”,漲價成了唯一出路。
03 用戶“用腳投票”:國產模型遭遇“過山車”
面對上漲的Token價格,最敏感的開發者和中小企業開始“用腳投票”。
以前,大家看誰家搞促銷、送Token就用誰家;現在,Token成了真金白銀的生產資料,價格不再是唯一標準,性價比和硬實力才是關鍵。
1)OpenRouter的數據揭示了殘酷的現實:
在4月的第二周,阿里的Qwen3.6 Plus還曾以1.66萬億Tokens的調用量登頂全球榜首;僅僅一周之后,它就跌出了榜單。與此同時,Kimi K2.5、智譜GLM系列等曾經的明星模型,已連續三周消失在主流視野。
2)取而代之的是誰?是能“干活”的模型。
數據顯示,美國模型的反彈完全由Anthropic旗下的Claude Sonnet和Opus拉動。這兩款模型已成為海外編程領域的“硬通貨”,無論是代碼生成還是復雜邏輯推理,用戶認為哪怕貴一點,只要產出穩定,就是劃算的。
04 誰在為算力漲價買單?四層成本傳導,全行業承壓
算力漲價的成本,不會憑空消失,而是沿著產業鏈層層傳導,從廠商到企業、從開發者到個人用戶,最終由全行業共同承擔,只是承擔方式與壓力各不相同。
1)第一層:云廠商與模型企業 ——“被迫漲價,修復利潤”
過去兩年,AI 行業陷入 “低價內卷”:云廠商靠補貼搶客戶、大模型企業燒錢換流量,長期 “虧損獲客”。
漲價對它們而言,是 **“被動自救”**:
– 緩解 GPU、HBM 的巨額折舊與采購壓力,從 “規模優先” 轉向 “價值優先”;
– 把稀缺算力向高毛利、高價值的企業客戶集中,淘汰低價值的個人粗放調用;
– 頭部廠商(如擁有自研芯片的企業)反而受益,成本優勢進一步拉大,加速行業出清。
2)第二層:中小企業與開發者 ——“成本暴增,生死考驗”
這是最直接的承壓層。絕大多數中小 AI 企業、獨立開發者沒有自建算力能力,完全依賴云端 API 與算力租賃:
– 創業公司:AI 應用成本直接上漲 30%-200%,利潤被大幅擠壓,“PPT 創業” 徹底失去土壤;
– 中小開發者:低價調用時代終結,大量個人項目、低價值應用因成本過高直接停服;
– 行業分化:能靠 AI 創造高營收(如電商 AI、企業 SaaS)的企業尚能承受,純工具、低變現項目直接被淘汰。
3)第三層:重度用戶與企業客戶 ——“轉嫁成本,優化使用”
對大型企業、AI 重度用戶而言,漲價是 **“成本轉嫁 + 效率優化”**:
– 一方面,將上漲的 AI 成本部分轉嫁給終端客戶(如 AI 增值服務提價);
– 另一方面,主動優化 Token 使用:減少無效調用、精簡上下文、切換更高能效的模型,倒逼 “精細化運營”。
4)第四層:普通個人用戶 ——“感知有限,體驗分化”
個人用戶感受相對間接:
免費額度縮水、免費模型質量下降、付費訂閱價格上漲;
大量低質低價的國產模型服務下架,反而倒逼用戶轉向更優質、更穩定的頭部模型,“劣幣驅逐良幣” 的現象被逆轉。
一句話總結:算力漲價的單,最終由 “全行業共擔”—— 低效產能被出清,高效玩家留到最后,行業從 “野蠻生長” 走向 “高質量發展”。
05 專家:全球消耗量仍處快速增長通道
短期數據波動,是否意味著AI應用熱潮正在消退?
“短期還不宜下結論。”胡延平提醒,OpenRouter的Token調用量僅占全球消耗總量的約2%~4%,其排名波動更多反映的是開源、二線及新發模型的競爭態勢,不能代表整個市場的走向。
事實上,成本壓力正在倒逼市場進化。胡延平觀察到,今年初以來,OpenClaw等各類智能體、多Agent應用已將Token調用量拉升至去年底的兩三倍水平;成本大幅抬高,促使企業和用戶轉而采用記憶優化、提示詞壓縮、Harness Engineering(約束工程)等手段主動降耗。
記者了解到,甚至有中小創業者已將Token使用量納入員工績效考核。市場正從單純追求數量的“堆量”階段,進化到追求更高投入產出比的“提效”階段。
更深層的變化,在于AI應用場景本身的質變。國聯民生證券一份研報中提出“Token通脹”的概念。這并非指Token本身變貴,而是指單位時間內、單位用戶的Token消耗結構性上升。
用戶的需求正從淺層的“問答”轉向深度的“干活”。Token不是傳統互聯網時代邊際成本幾乎為零的“流量”,而是執行生產任務時必不可少的“燃料”。
摩根大通在研報中對中國市場作出極為樂觀的預測,預計2025年至2030年,中國Token消耗量的年復合增長率將達330%,5年內將實現370倍增長。
胡延平同樣對長期趨勢保持堅定樂觀:“就中長期而言,無論OpenRouter上的統計數據如何波動,包括中國在內,全球Token消耗總量都處在快速增長通道,未來兩三年會有數十倍甚至數百倍的增加。”
漲十周、降兩周,看似是數據波動,實則是 AI 行業的一次深刻 “壓力測試”。
算力漲價,擠掉了行業的虛假繁榮,淘汰了低效產能與投機者,留下真正有技術、有場景、有商業化能力的玩家。Token 調用量的收縮,不是 AI 的終點,而是理性發展的起點—— 當每一分算力都用在 “創造價值” 上,AI 才能真正從 “概念熱潮” 走向 “產業剛需”。
至于 “誰為算力漲價買單”?答案是:所有人,但也只有扛過成本壓力、守住價值底線的人,才能笑到最后。
這場 AI 算力的 “大通脹”,才剛剛開始。