試著預測接下來可能的發展:
卷顯卡
不是累積最多顯卡的團隊得勝,是在限制運算資源條件下仍能動腦筋突破限制的團隊得勝。
GPU-Rich 已經投入高價成本買了大量 GPU,花那麼多成本訓練,投資卻遲遲回收不回來。R1 打亂了原本的投資成本回收計劃,投資者質疑購買大量顯卡的成效為何,因此 GPU-Rich 暫時不願再高價瘋搶顯卡,必須要先在現有顯卡集群上,提高訓練與推理效率,顯出確實能在競爭中存活的能耐。
團隊向投資方要更多錢買頂級 GPU 越來越困難,只能放下身段,好好學習中國 AI 實驗室,埋頭研究如何在目前限制下提高效率,包括如何在其他廠商的明顯較低價卻仍有一定效率的 GPU 上,取得更多成果。
無法存活的廠商停止營運,釋出顯卡資源,有很多二手便宜貨可搶。
NVIDIA 股票大跌,代表投資方已不看好它的未來發展,質疑它無法再賺進大把鈔票。
NVIDIA CUDA 護城河的破口越來越明顯,其他顯卡競爭壓力升溫。
NVIDIA 顯卡大降價,企圖阻止其他競爭廠商危及其市佔率。
GPU-Poor 開始撿便宜,但仍然要繼續搶一定顯卡份量。
其他 AI 晶片銷量開始上升,但要能搶市占率,也得跟著降價,要能存活仍然不容易。
著重推理速度的晶片,開始被重視,因為前沿模型要提高成績,增加推理長度是最簡單粗暴的方法,能夠加快推理速度的晶片就火熱起來。
但它們要能開始取代 NVIDIA,還需要一些時間磨合期,因為一時也無法快速提高產量。賣出去後,大家再研究如何針對各種模型做優化,再一些時間才能真正在市場上廣泛推出。但這個再一些時間,應該就在今年內。
卷人才
人才還是要搶,但團隊再瘦身,因為不是人多的團隊獲勝,超高薪資集中到更少數人身上。
卷模型
開發進度無法跟上,燒錢卻無法證明其有效性,仍然沒找到存在價值的團隊,都可以關門了。
眼下只剩 OpenAI 尚未公佈的 o3 API 還有其最前沿價值,其他閉源公司的 API 沒有使用的必要,因為提供開源頂級模型 API 的廠商更多,價格更低。閉源公司也只能跟進價格戰,但比開源模型能力還差,價錢再低又有何意義呢?
只有更小、更高效才能推出新模型、發論文、賣得出去。接著準備推出新模型的廠商,訓練到一半的模型,都可以直接停止訓練,幾個月的訓練花費直接打水漂。這下得重新研究 R1 論文,把方法再套回自家模型。除了 OpenAI o3 外,一兩個月後看這些 GPU-Rich,誰有能耐第一個端出更厲害的菜?
單比 LLM 已經追不上人,多模態是接下來的常態。
卷市場
各 API 跳樓降價,推理模型的長時間已不再需要以往的高成本。
AI 能力再提升,用戶追求更厲害前沿的模型。但為了更高成績,推理時間不斷拉長,因此唯有更快推理速度的服務,才能脫穎而出。
完全免費的應用越來越多。
免費試用版提供的額度必須拉更高,要不然用戶用完額度後,直接跳槽。也因此付費版提供更多推理額度已經不再吸引人,因為真的用不完,很難不降價。
不要讓用戶苦苦等待推理結果,把事情更快地一次完成,才有更高價值。
中國內卷,襲捲全球。現在由 AI 模型引爆,下一個要卷什麼呢?


