中國內卷，襲捲世界

下一個要卷什麼呢?

ChrisTorng

Jan 28, 2025

試著預測接下來可能的發展:

卷顯卡

不是累積最多顯卡的團隊得勝，是在限制運算資源條件下仍能動腦筋突破限制的團隊得勝。
GPU-Rich 已經投入高價成本買了大量 GPU，花那麼多成本訓練，投資卻遲遲回收不回來。R1 打亂了原本的投資成本回收計劃，投資者質疑購買大量顯卡的成效為何，因此 GPU-Rich 暫時不願再高價瘋搶顯卡，必須要先在現有顯卡集群上，提高訓練與推理效率，顯出確實能在競爭中存活的能耐。
團隊向投資方要更多錢買頂級 GPU 越來越困難，只能放下身段，好好學習中國 AI 實驗室，埋頭研究如何在目前限制下提高效率，包括如何在其他廠商的明顯較低價卻仍有一定效率的 GPU 上，取得更多成果。
無法存活的廠商停止營運，釋出顯卡資源，有很多二手便宜貨可搶。
NVIDIA 股票大跌，代表投資方已不看好它的未來發展，質疑它無法再賺進大把鈔票。
NVIDIA CUDA 護城河的破口越來越明顯，其他顯卡競爭壓力升溫。
NVIDIA 顯卡大降價，企圖阻止其他競爭廠商危及其市佔率。
GPU-Poor 開始撿便宜，但仍然要繼續搶一定顯卡份量。
其他 AI 晶片銷量開始上升，但要能搶市占率，也得跟著降價，要能存活仍然不容易。
著重推理速度的晶片，開始被重視，因為前沿模型要提高成績，增加推理長度是最簡單粗暴的方法，能夠加快推理速度的晶片就火熱起來。
但它們要能開始取代 NVIDIA，還需要一些時間磨合期，因為一時也無法快速提高產量。賣出去後，大家再研究如何針對各種模型做優化，再一些時間才能真正在市場上廣泛推出。但這個再一些時間，應該就在今年內。

卷人才

人才還是要搶，但團隊再瘦身，因為不是人多的團隊獲勝，超高薪資集中到更少數人身上。

卷模型

開發進度無法跟上，燒錢卻無法證明其有效性，仍然沒找到存在價值的團隊，都可以關門了。
眼下只剩 OpenAI 尚未公佈的 o3 API 還有其最前沿價值，其他閉源公司的 API 沒有使用的必要，因為提供開源頂級模型 API 的廠商更多，價格更低。閉源公司也只能跟進價格戰，但比開源模型能力還差，價錢再低又有何意義呢?
只有更小、更高效才能推出新模型、發論文、賣得出去。接著準備推出新模型的廠商，訓練到一半的模型，都可以直接停止訓練，幾個月的訓練花費直接打水漂。這下得重新研究 R1 論文，把方法再套回自家模型。除了 OpenAI o3 外，一兩個月後看這些 GPU-Rich，誰有能耐第一個端出更厲害的菜?
單比 LLM 已經追不上人，多模態是接下來的常態。

卷市場

各 API 跳樓降價，推理模型的長時間已不再需要以往的高成本。
AI 能力再提升，用戶追求更厲害前沿的模型。但為了更高成績，推理時間不斷拉長，因此唯有更快推理速度的服務，才能脫穎而出。
完全免費的應用越來越多。
免費試用版提供的額度必須拉更高，要不然用戶用完額度後，直接跳槽。也因此付費版提供更多推理額度已經不再吸引人，因為真的用不完，很難不降價。
不要讓用戶苦苦等待推理結果，把事情更快地一次完成，才有更高價值。

中國內卷，襲捲全球。現在由 AI 模型引爆，下一個要卷什麼呢?

Grounded till Now ↣ Infer the Future

Discussion about this post

Ready for more?