買不起 H100,中小企業的 AI 出路只剩租,中美 Token 格局反轉
May 15, 2026
根據OpenRouter的最新資料,截至2026年4月,全球AI大模型的Token調用量已經突破27萬億/月,環 比增長18.9%。更離譜的是,中國AI大模型的Token調用量已經連續五周超越美國。
這是什麼概念?你每問ChatGPT一個問題、讓豆包幫你寫個PPT、讓Kimi幫你整理個文檔,每一次操作都在燃燒Token。而Token消耗的速度,直接決定了需要多少GPU在工作、多少伺服器在發熱、多少電費在狂飆。
所以別問為什麼算力租賃現在這麼火。Token燒得越多,算力老闆笑得越開

01 “買不如租”?
中小企業:我太難了
以前搞AI是個體力活,你得自己買顯卡、自己建機房、自己搞定散熱。但現在一張NVIDIA A100售價10萬到15萬,H100更要20萬到30萬。
對於初創公司來說,光是買硬體就能把公司賣囉。
於是“以租代買”成了香餑餑。租一個GPU集群,初期成本直接砍掉70%以上,還能隨時換新硬體。國內一些電腦租賃商的高性能機型直接“上架即秒光”,和黃牛搶演唱會的票有得一拼。
這不是簡單的“省錢”了。而是讓中小企業也能玩得起AI的門票。

02 各路玩家瘋狂進場
豆包:收費是因為真的燒不起了 01
5月4日,位元組跳動的豆包在App Store推出付費會員,68元/月到500元/月三檔。
為什麼突然收費?三個數字說明一切:
▪ 豆包日均Token消耗已達120萬億,相比2024年5月發佈時增長了1000倍。
▪ 位元組跳動2026年規劃資本開支約1600億元,預計一半砸向AI晶片採購。
▪ 推理算力需求已經是訓練階段的10-15倍。
翻譯過來就是:用的人越多、用的越勤、任務越複雜,燒的Token就越狠。豆包不收費,難道用愛發電?
Anthropic x SpaceX
這波操作也挺魔幻 02
5月6日,Anthropic直接把SpaceX位於孟菲斯的Colossus 1資料中心整個租了下來。
這個資料中心有超過22萬塊英偉達GPU(H100、H200、GB200加速器),總功耗300兆瓦,相當於一個20-30萬戶家庭的中型城市全部用電量。
Anthroptic一個月內獲得超過300兆瓦新增算力,總算力直接從“不足10萬張H100當量”原地起飛,追平甚至超越OpenAI和Google DeepMind。
而SpaceX呢?原本為xAI訓練Grok建的Colossus 1,xAI解散併入SpaceX後閒置了,租給Anthropic不僅賺了錢,還順手給IPO講了個漂亮的現金流故事。
兩家公司甚至已經開始討論在近地軌道建“數吉瓦級AI算力”資料中心。我聽到這個的時候,人是麻的。。。

大廠都在搶
阿里、百度、騰訊全在提價 03
國內雲服務商已經完成了多輪提價,漲幅5%-34%不等。
核心玩家就三類:
1- IDC/AIDC廠商:光環新網、潤澤科技、奧飛資料,特點是節點儲備足。
2- 雲服務商:阿里、百度、騰訊,特點是全球調度能力。
3- 跨界租賃商:協創數據(Q1歸母淨利潤7.5億,同比+343%)、利通電子(Q1歸母淨利潤2.7億,同比+821%)、東陽光(160-190億元框架訂單)。
海外更誇張:CoreWeave資本開支從103億美元跳漲到300-350億美元,在手訂單逼近960億美元;甲骨文和OpenAI簽了4.5GW協定,2026年資本開支直接上調到500億美元以上。
這已經不是“卷”了,更像是軍備競賽。
03 商業模式在變
從“賣算力”到“賣Token”
五年前算力租賃就是個“伺服器二道販子”,買一批GPU,按小時出租,跟自動售貨機差不多。
現在?玩法完全不一樣了。
價格已經說明一切:
▪ H100一年期租賃價格從2025年10月的1.70美元/卡時,漲到2026年3月的2.35美元/卡時,漲幅接近40%
▪ H200月租金6萬-6.6萬元,漲幅25%-30%
▪ H100月租金5.5萬-6萬元,漲幅15%-20%
▪ 交付週期已經排到2027年Q2
而更深層的變革是:從“賣GPU執行時間”變成“賣Token”。
過去客戶關心“我用了多少小時GPU”,現在客戶只關心“模型能生成多少Token、完成多少任務”。相應地,出租方的服務模式也從“裸算力出租”升級為“模型服務即算力”乃至“Token分成模式”。

有人算帳說H100現在2.35美元/小時,100%出租率的話4個月就能回本。
業內人士笑而不語:更真實的帳本是2.5年回本。(折舊、電費、機櫃 / 機房 PUE、運維、頻寬、稅費、資金等多成本)
前提是:你拿得到最緊缺的高端GPU訂單,你有足夠的電力和散熱容量,你的客戶不是一次性交易而是3-5年長期鎖單。
在全球四大科技公司2026年合計7250億美元AI資本支出的背景下,中小玩家在供應鏈博弈中天然處於劣勢。“贏家通吃”的格局正在加速形成。
04 三個難題
決定未來誰能笑到最後
【第一題】
技術代際競賽,折舊速度比女朋友變臉還快
英偉達的產品更新速度:
▪ Blackwell平臺正在出貨
▪ Vera Rubin今年下半年就來了,性能功耗比是前代的10倍
▪ Rubin Ultra 2027年
▪ Feynman 2028年
每一代GPU出來,上一代的伺服器帳面價值就可能縮水。買過電子產品的都懂 ,買完就貶值,這事擱誰誰不肉疼?
但恰恰因此,租賃模式體現出了商業韌性:規模效應能消化反覆運算成本。就像梅賽德斯-賓士的F1車隊不會因為明年換新引擎就不參加今年的比賽,AI企業也不會因為明年硬體更強就不租現在的GPU。
在這個行業,不是越新越好,而是越快越好。
【第二題】
國產化與“算力鴻溝”,一個魔幻的現實
一個黑色幽默正在中國智算中心上演:
安裝了英偉達GPU的機櫃:出租率超過90%
國產GPU伺服器:出租率很低
問題不在硬體性能,而在軟體生態。CUDA沉澱了十幾年的開發者工具鏈,國產GPU在框架適配、編譯優化上還是有差距。
工信部已經發文推動“算力銀行”“算力超市”等創新業務。但如果底層算力還是以海外晶片為主所謂的“普惠”在深層供給上仍將受制於外部供應鏈。
【第三題】
算力跟實體產業怎麼融合?
現在的算力需求熱,主要是互聯網大模型企業在燒Token。
但這只是前菜,智慧製造、醫療影像、自動駕駛、數位孿生這些實體行業如果全面擁抱AI,算力需求的井噴量級將再翻數倍。
問題是:算力租賃商是繼續給互聯網大廠當“軍火商”賺快錢,還是下沉到各行各業成為“公共基礎設施”賺大錢?
這是兩條完全不同的路。

最後說兩句
AI的免費時代正在加速終結。而算力作為AI世界裡最剛需、最稀缺的生產資料,它的“租賃者”正在成為這場產業浪潮中確定性最強的受益者。
不是每家公司都能從大模型的演算法突破中分一杯羹,也不是每家公司都燒得起千億美元級的自建算力集群。
但幾乎每一家想要落地AI應用的企業,都繞不開“按月付費、按Token計費、按需擴容”的算力租賃路徑。
當AI付費潮從C端應用向B端基礎設施層層傳導,算力租賃便不再是某個細分賽道的邊緣生意,而是整個AI產業商業閉環中不可或缺的“水電煤”。
這場算力狂歡,才剛剛開始。
·END·
