|
樓主 |
發表於 2025-2-8 11:29:37
|
顯示全部樓層
為何要管制競爭對手以外的國家?為的就是避免中國暗渡陳倉,取得算力。不管是在新加坡、日本甚至台灣成立公司採購,還是以走私方式進口,又或者是在禁令實施前大量儲備,甚至調用海外雲端服務,從中國科技巨頭與新創的公開發言中,便能看出他們手上都有一定數量的先進晶片,只是效能上有所減損。
當然,這對中國企業研發基礎模型來說,仍然是種限制。因此,據傳只利用「降級版」的H800訓練,卻能與OpenAI產出的模型競爭,這是DeepSeek受到矚目的重要原因之一。
「最新的發明還是美國厲害,但中國能夠找到方法節省成本,用更少的錢,或者是更優質的工程技術,訓練出同樣好的模型。」李開復解釋,美國創投市場願意給AI模型企業更高估值,企業也因此有辦法購買更多GPU,中國AI模型創業家們資金相對沒那麼充裕,因此要在模型架構、硬體配適等層次下苦工。
DeepSeek在介紹DeepSeek-V3的論文便提到,透過改善演算法、架構與硬體協同設計,模型的總訓練成本能夠壓低至約560萬美元。雖然DeepSeek並未刻意標舉其訓練模型成本的低廉,但仍引發大量質疑。 |
|