即市新聞

27/04/2026 14:25

【FOCUS】魚翅VS蘿蔔,成本降維加持「token經濟」

  【FOCUS】短短48小時,AI界迎來兩大前沿模型「上新」--OpenAI旗下GPT-5.5,以及DeepsSeek-V4。「誰更聰明」見仁見智,但「誰更便宜」一目了然--以每百萬token輸出價格計,前者高達30美元,後者低至6元人民幣,可謂「魚翅VS蘿蔔」。放在內地日均token調用量突破140萬億(截至3月)的背景下,或意味北京的策略方向,已從算力追趕,變為token轉化。

*區分精讀跳讀,百萬上下文成標配*

  「今天你用了多少token?」被內地官方譯作「詞元」的Token,是AI理解自然語言指令的最小單位。例如,「example」相當於1個token;而向DeepsSeek-V4上傳三部曲,則約消耗54萬個token。換言之,無論是輸入還是生成,token相當於串聯所有指令、數據、場景的核心。

  面對晶片的物理制約,尤其是中國自身的算力瓶頸,如何極緻優化調用token的效率,正正是今次DeepsSeek版本更新的最大看點。以專業版的DeepsSeek V4-Pro為例,憑藉全新的混合注意力架構(壓縮稀疏注意力+高度壓縮注意力),將處理每百萬token上下文的FLOPs(相當於算力)、KV cache(相當於內存),降至上一代版本V3.2的27%、10%。

  這種對強關聯的token「精讀」,對弱關聯的token「跳讀」的做法,令其成本僅為GPT-5.5的零頭,難怪DeepsSeek宣布,「從現在開始,百萬上下文將是DeepSeek所有官方服務的標配。」

*軟硬協同反制壟斷,利規模化落地*

  值得一提的是,就在DeepSeek V4發布約一小時後,華為宣布V4將於旗下昇騰平台首發,緊接著英偉達聲稱,V4已在Blackwell平台完成適配,意味老黃苦心經營的「硬件(GPU)+軟件(CUDA生態)」,遭DeepSeek、華為聯手撕開一道缺口。而更引發遐想的是,DeepSeek提及,預計下半年昇騰950超節點批量上市後,V4-Pro模型價格會大幅下調。

  有何意義?儘管在推理能力上仍落後GPT-5.5等閉源模型,但看看中國的雄心壯志--到2027年,推動3至5個通用大模型在製造業深度應用,推廣500個工業領域典型應用場景--更具「智能成本比」的token,無疑將推動其大規模商業化落地。

  此外,更低成本的實現,亦將倒逼各家大模型公司加速業務重組,例如阿里(09988)3月宣布成立Alibaba Token Hub業務單元,小米(01810)最新MiMo v2.5大模型聲稱較月之暗面的Kimi K2.6節省42% Token。畢竟,未來誰控制最有性價比的token,誰將從源頭擁有優勢地位,部署「token經濟」及「token出海」。

【香港好去處】2026去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇

人氣文章
財經新聞
評論
專題
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

中東戰火

貨幣攻略

大國博弈

說說心理話

理財秘笈

Wonder in Art

北上食買玩

Watch Trends 2026

山今養生智慧

輕鬆護老

照顧者 情緒健康