top of page

買不起 H100,中小企業的 AI 出路只剩租,中美 Token 格局反轉

May 15, 2026

根據OpenRouter的最新資料,截至2026年4月,全球AI大模型的Token調用量已經突破27萬億/月,環比增長18.9%。更離譜的是,中國AI大模型的Token調用量已經連續五周超越美國


這是什麼概念?你每問ChatGPT一個問題、讓豆包幫你寫個PPT、讓Kimi幫你整理個文檔,每一次操作都在燃燒Token。而Token消耗的速度,直接決定了需要多少GPU在工作、多少伺服器在發熱、多少電費在狂飆。


所以別問為什麼算力租賃現在這麼火。Token燒得越多,算力老闆笑得越開



01 “買不如租”?


中小企業:我太難了


以前搞AI是個體力活,你得自己買顯卡、自己建機房、自己搞定散熱。但現在一張NVIDIA A100售價10萬到15萬,H100更要20萬到30萬。


對於初創公司來說,光是買硬體就能把公司賣囉。


於是“以租代買”成了香餑餑。租一個GPU集群,初期成本直接砍掉70%以上,還能隨時換新硬體。國內一些電腦租賃商的高性能機型直接“上架即秒光”,和黃牛搶演唱會的票有得一拼。


這不是簡單的“省錢”了。而是讓中小企業也能玩得起AI的門票。



02 各路玩家瘋狂進場


豆包:收費是因為真的燒不起了  01 

5月4日,位元組跳動的豆包在App Store推出付費會員,68元/月到500元/月三檔。


為什麼突然收費?三個數字說明一切:


▪ 豆包日均Token消耗已達120萬億,相比2024年5月發佈時增長了1000倍

▪ 位元組跳動2026年規劃資本開支約1600億元,預計一半砸向AI晶片採購。

▪ 推理算力需求已經是訓練階段的10-15倍


翻譯過來就是:用的人越多、用的越勤、任務越複雜,燒的Token就越狠。豆包不收費,難道用愛發電?


Anthropic x SpaceX

這波操作也挺魔幻  02 

5月6日,Anthropic直接把SpaceX位於孟菲斯的Colossus 1資料中心整個租了下來。


這個資料中心有超過22萬塊英偉達GPU(H100、H200、GB200加速器),總功耗300兆瓦,相當於一個20-30萬戶家庭的中型城市全部用電量。


Anthroptic一個月內獲得超過300兆瓦新增算力,總算力直接從“不足10萬張H100當量”原地起飛,追平甚至超越OpenAI和Google DeepMind。


而SpaceX呢?原本為xAI訓練Grok建的Colossus 1,xAI解散併入SpaceX後閒置了,租給Anthropic不僅賺了錢,還順手給IPO講了個漂亮的現金流故事。


兩家公司甚至已經開始討論在近地軌道建“數吉瓦級AI算力”資料中心我聽到這個的時候,人是麻的。。。



大廠都在搶

阿里、百度、騰訊全在提價  03 

國內雲服務商已經完成了多輪提價,漲幅5%-34%不等。


核心玩家就三類:

1- IDC/AIDC廠商:光環新網、潤澤科技、奧飛資料,特點是節點儲備足。

2- 雲服務商阿里、百度、騰訊,特點是全球調度能力。

3- 跨界租賃商:協創數據(Q1歸母淨利潤7.5億,同比+343%)、利通電子(Q1歸母淨利潤2.7億,同比+821%)、東陽光(160-190億元框架訂單)。


海外更誇張:CoreWeave資本開支從103億美元跳漲到300-350億美元,在手訂單逼近960億美元;甲骨文和OpenAI簽了4.5GW協定,2026年資本開支直接上調到500億美元以上。


這已經不是“卷”了,更像是軍備競賽。


03 商業模式在變


從“賣算力”到“賣Token”


五年前算力租賃就是個“伺服器二道販子”,買一批GPU,按小時出租,跟自動售貨機差不多。


現在?玩法完全不一樣了。


價格已經說明一切:

▪ H100一年期租賃價格從2025年10月的1.70美元/卡時,漲到2026年3月的2.35美元/卡時,漲幅接近40%

▪ H200月租金6萬-6.6萬元,漲幅25%-30%

▪ H100月租金5.5萬-6萬元漲幅15%-20%

▪ 交付週期已經排到2027年Q2


而更深層的變革是:“賣GPU執行時間”變成“賣Token”


過去客戶關心“我用了多少小時GPU”,現在客戶只關心“模型能生成多少Token、完成多少任務”。相應地,出租方的服務模式也從“裸算力出租”升級為“模型服務即算力”乃至“Token分成模式”。



有人算帳說H100現在2.35美元/小時,100%出租率的話4個月就能回本。


業內人士笑而不語:更真實的帳本是2.5年回本。(折舊、電費、機櫃 / 機房 PUE、運維、頻寬、稅費、資金等多成本)


前提是:你拿得到最緊缺的高端GPU訂單,你有足夠的電力和散熱容量,你的客戶不是一次性交易而是3-5年長期鎖單。


在全球四大科技公司2026年合計7250億美元AI資本支出的背景下,中小玩家在供應鏈博弈中天然處於劣勢。“贏家通吃”的格局正在加速形成。


04 三個難題

決定未來誰能笑到最後


【第一題】

技術代際競賽,折舊速度比女朋友變臉還快


英偉達的產品更新速度:

▪ Blackwell平臺正在出貨

▪ Vera Rubin今年下半年就來了,性能功耗比是前代的10倍

▪ Rubin Ultra 2027年

▪ Feynman 2028年


每一代GPU出來,上一代的伺服器帳面價值就可能縮水。買過電子產品的都懂,買完就貶值,這事擱誰誰不肉疼?


但恰恰因此,租賃模式體現出了商業韌性:規模效應能消化反覆運算成本就像梅賽德斯-賓士的F1車隊不會因為明年換新引擎就不參加今年的比賽,AI企業也不會因為明年硬體更強就不租現在的GPU。


在這個行業,不是越新越好,而是越快越好。


【第二題】

國產化與“算力鴻溝”,一個魔幻的現實


一個黑色幽默正在中國智算中心上演:

安裝了英偉達GPU的機櫃:出租率超過90%

國產GPU伺服器:出租率很低


問題不在硬體性能,而在軟體生態。CUDA沉澱了十幾年的開發者工具鏈,國產GPU在框架適配、編譯優化上還是有差距。


工信部已經發文推動“算力銀行”“算力超市”等創新業務。但如果底層算力還是以海外晶片為主所謂的“普惠”在深層供給上仍將受制於外部供應鏈。


【第三題】

算力跟實體產業怎麼融合?


現在的算力需求熱,主要是互聯網大模型企業在燒Token。


但這只是前菜,智慧製造、醫療影像、自動駕駛、數位孿生這些實體行業如果全面擁抱AI,算力需求的井噴量級將再翻數倍。


問題是:算力租賃商是繼續給互聯網大廠當“軍火商”賺快錢,還是下沉到各行各業成為“公共基礎設施”賺大錢?


這是兩條完全不同的路。



最後說兩句


AI的免費時代正在加速終結。而算力作為AI世界裡最剛需、最稀缺的生產資料,它的“租賃者”正在成為這場產業浪潮中確定性最強的受益者。


不是每家公司都能從大模型的演算法突破中分一杯羹,也不是每家公司都燒得起千億美元級的自建算力集群。


但幾乎每一家想要落地AI應用的企業,都繞不開“按月付費、按Token計費、按需擴容”的算力租賃路徑。


當AI付費潮從C端應用向B端基礎設施層層傳導,算力租賃便不再是某個細分賽道的邊緣生意,而是整個AI產業商業閉環中不可或缺的“水電煤”。


這場算力狂歡,才剛剛開始。



·END·

Shiwei Technology Co., Ltd.

SWIT CO.,LTD

Company Address: 1F, No. 78, Minyou Street, Linkou District, New Taipei City 244, Taiwan

Company Address: 4F, No. 203, Gongyuan Rd., Linkou Dist., New Taipei City 244, Taiwan

Address: Room 1003, 10th Floor, Block B, Lechuanghui Building, Guanguang Road, Longhua District, Shenzhen, Guangdong Province

Business phone number: +886916520103

Business email: w3@swit-tw.com

About Us

Business LINE

About Us

Business WECHAT

 

© 2025 by Shiwei Technology Co., Ltd. Powered and secured by SWIT

 

bottom of page