SWIT Co., Ltd. | 時唯科技股份有限公司

買不起 H100，中小企業的 AI 出路只剩租，中美 Token 格局反轉

May 15, 2026

根據OpenRouter的最新資料，截至2026年4月，全球AI大模型的Token調用量已經突破27萬億/月，環比增長18.9%。更離譜的是，中國AI大模型的Token調用量已經連續五周超越美國。

這是什麼概念？你每問ChatGPT一個問題、讓豆包幫你寫個PPT、讓Kimi幫你整理個文檔，每一次操作都在燃燒Token。而Token消耗的速度，直接決定了需要多少GPU在工作、多少伺服器在發熱、多少電費在狂飆。

所以別問為什麼算力租賃現在這麼火。Token燒得越多，算力老闆笑得越開

01 “買不如租”？

中小企業：我太難了

以前搞AI是個體力活，你得自己買顯卡、自己建機房、自己搞定散熱。但現在一張NVIDIA A100售價10萬到15萬，H100更要20萬到30萬。

對於初創公司來說，光是買硬體就能把公司賣囉。

於是“以租代買”成了香餑餑。租一個GPU集群，初期成本直接砍掉70%以上，還能隨時換新硬體。國內一些電腦租賃商的高性能機型直接“上架即秒光”，和黃牛搶演唱會的票有得一拼。

這不是簡單的“省錢”了。而是讓中小企業也能玩得起AI的門票。

02 各路玩家瘋狂進場

豆包：收費是因為真的燒不起了 01

5月4日，位元組跳動的豆包在App Store推出付費會員，68元/月到500元/月三檔。

為什麼突然收費？三個數字說明一切：

▪ 豆包日均Token消耗已達120萬億，相比2024年5月發佈時增長了1000倍。

▪ 位元組跳動2026年規劃資本開支約1600億元，預計一半砸向AI晶片採購。

▪ 推理算力需求已經是訓練階段的10-15倍。

翻譯過來就是：用的人越多、用的越勤、任務越複雜，燒的Token就越狠。豆包不收費，難道用愛發電？

Anthropic x SpaceX

這波操作也挺魔幻 02

5月6日，Anthropic直接把SpaceX位於孟菲斯的Colossus 1資料中心整個租了下來。

這個資料中心有超過22萬塊英偉達GPU（H100、H200、GB200加速器），總功耗300兆瓦，相當於一個20-30萬戶家庭的中型城市全部用電量。

Anthroptic一個月內獲得超過300兆瓦新增算力，總算力直接從“不足10萬張H100當量”原地起飛，追平甚至超越OpenAI和Google DeepMind。

而SpaceX呢？原本為xAI訓練Grok建的Colossus 1，xAI解散併入SpaceX後閒置了，租給Anthropic不僅賺了錢，還順手給IPO講了個漂亮的現金流故事。

兩家公司甚至已經開始討論在近地軌道建“數吉瓦級AI算力”資料中心。我聽到這個的時候，人是麻的。。。

大廠都在搶

阿里、百度、騰訊全在提價 03

國內雲服務商已經完成了多輪提價，漲幅5%-34%不等。

核心玩家就三類：

1- IDC/AIDC廠商：光環新網、潤澤科技、奧飛資料，特點是節點儲備足。

2- 雲服務商：阿里、百度、騰訊，特點是全球調度能力。

3- 跨界租賃商：協創數據（Q1歸母淨利潤7.5億，同比+343%）、利通電子（Q1歸母淨利潤2.7億，同比+821%）、東陽光（160-190億元框架訂單）。

海外更誇張：CoreWeave資本開支從103億美元跳漲到300-350億美元，在手訂單逼近960億美元；甲骨文和OpenAI簽了4.5GW協定，2026年資本開支直接上調到500億美元以上。

這已經不是“卷”了，更像是軍備競賽。

03 商業模式在變

從“賣算力”到“賣Token”

五年前算力租賃就是個“伺服器二道販子”，買一批GPU，按小時出租，跟自動售貨機差不多。

現在？玩法完全不一樣了。

價格已經說明一切：

▪ H100一年期租賃價格從2025年10月的1.70美元/卡時，漲到2026年3月的2.35美元/卡時，漲幅接近40%

▪ H200月租金6萬-6.6萬元，漲幅25%-30%

▪ H100月租金5.5萬-6萬元，漲幅15%-20%

▪ 交付週期已經排到2027年Q2

而更深層的變革是：從“賣GPU執行時間”變成“賣Token”。

過去客戶關心“我用了多少小時GPU”，現在客戶只關心“模型能生成多少Token、完成多少任務”。相應地，出租方的服務模式也從“裸算力出租”升級為“模型服務即算力”乃至“Token分成模式”。

有人算帳說H100現在2.35美元/小時，100%出租率的話4個月就能回本。

業內人士笑而不語：更真實的帳本是2.5年回本。（折舊、電費、機櫃 / 機房 PUE、運維、頻寬、稅費、資金等多成本）

前提是：你拿得到最緊缺的高端GPU訂單，你有足夠的電力和散熱容量，你的客戶不是一次性交易而是3-5年長期鎖單。

在全球四大科技公司2026年合計7250億美元AI資本支出的背景下，中小玩家在供應鏈博弈中天然處於劣勢。“贏家通吃”的格局正在加速形成。

04 三個難題

決定未來誰能笑到最後

【第一題】

技術代際競賽，折舊速度比女朋友變臉還快

英偉達的產品更新速度：

▪ Blackwell平臺正在出貨

▪ Vera Rubin今年下半年就來了，性能功耗比是前代的10倍

▪ Rubin Ultra 2027年

▪ Feynman 2028年

每一代GPU出來，上一代的伺服器帳面價值就可能縮水。買過電子產品的都懂，買完就貶值，這事擱誰誰不肉疼？

但恰恰因此，租賃模式體現出了商業韌性：規模效應能消化反覆運算成本。就像梅賽德斯-賓士的F1車隊不會因為明年換新引擎就不參加今年的比賽，AI企業也不會因為明年硬體更強就不租現在的GPU。

在這個行業，不是越新越好，而是越快越好。

【第二題】

國產化與“算力鴻溝”，一個魔幻的現實

一個黑色幽默正在中國智算中心上演：

安裝了英偉達GPU的機櫃：出租率超過90%

國產GPU伺服器：出租率很低

問題不在硬體性能，而在軟體生態。CUDA沉澱了十幾年的開發者工具鏈，國產GPU在框架適配、編譯優化上還是有差距。

工信部已經發文推動“算力銀行”“算力超市”等創新業務。但如果底層算力還是以海外晶片為主所謂的“普惠”在深層供給上仍將受制於外部供應鏈。

【第三題】

算力跟實體產業怎麼融合？

現在的算力需求熱，主要是互聯網大模型企業在燒Token。

但這只是前菜，智慧製造、醫療影像、自動駕駛、數位孿生這些實體行業如果全面擁抱AI，算力需求的井噴量級將再翻數倍。

問題是：算力租賃商是繼續給互聯網大廠當“軍火商”賺快錢，還是下沉到各行各業成為“公共基礎設施”賺大錢？

這是兩條完全不同的路。

最後說兩句

AI的免費時代正在加速終結。而算力作為AI世界裡最剛需、最稀缺的生產資料，它的“租賃者”正在成為這場產業浪潮中確定性最強的受益者。

不是每家公司都能從大模型的演算法突破中分一杯羹，也不是每家公司都燒得起千億美元級的自建算力集群。

但幾乎每一家想要落地AI應用的企業，都繞不開“按月付費、按Token計費、按需擴容”的算力租賃路徑。

當AI付費潮從C端應用向B端基礎設施層層傳導，算力租賃便不再是某個細分賽道的邊緣生意，而是整個AI產業商業閉環中不可或缺的“水電煤”。

這場算力狂歡，才剛剛開始。

·END·

│ 智創未來，變革無限 │