最近中國的 AI 團隊 DeepSeek 宣布了一個大突破,透過 DualPipe、FP8 低精度計算、
通訊優化 這些技術,讓 AI 訓練的效率大幅提升,意思就是說 用比較少的 GPU 就能達
到原本需要超大量 GPU 才能完成的 AI 訓練。
表面上看起來這對中國 AI 產業是個好消息,因為 美國對中國禁售高端 GPU,中國 AI
企業的算力一直是硬傷。所以很多人說deepseek是中國彎道超車,讓中國即使不用美國高
端晶片也能達成相同效果。
但問題來了,美國 AI 巨頭(OpenAI、Google、Meta)目前擁有最新最強的 NVIDIA GPU
,如果這些公司也大規模使用 DeepSeek 的技術,老美也擴大加重晶片管制,那這不反而
讓美國AI 訓練的速度更快,成本更低,進一步擴大中美之間的差距嗎?畢竟中國再怎樣
使用從軟體上優化, 但那個硬體限制還是在啊...本來美國 AI 就已經遙遙領先,現在如
果效率又大幅提升,中國 AI 還追得上嗎?
DeepSeek 這個技術到底能不能彌補中國 AI 企業因為晶片短缺而落後的問題?
還是這種技術其實對美國 AI 企業的幫助更大,讓它們以更快的速度繼續拋開中國?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.190.13.72 (澳大利亞)
※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1738200517.A.861.html
推文 (20)
推
hidog
目前的問題是如何商品化(#
114.137.63.10 01/30 09:31
→
Lordaeron
LLM 能用來幹嘛?
111.241.161.153 01/30 09:31
推
xiemark
優化需要很多工程師。
1.200.26.114 01/30 09:42
推
godog
你怎麼知道DS有把家底全部都秀出來
110.28.64.5 01/30 10:26
→
godog
?
110.28.64.5 01/30 10:26
推
s213092921
DS還有許多王炸還沒丟出來,下一個
42.77.62.37 01/30 11:52
→
s213092921
是文生影片模型
42.77.62.37 01/30 11:52
推
zxp9505007
大家都開源 最終能有效制裁的只有硬
24.7.63.0 01/30 12:39
→
zxp9505007
體
24.7.63.0 01/30 12:39
→
zxp9505007
但晶片到他國繞一圈到中國就好了
24.7.63.0 01/30 12:40
→
zxp9505007
心照不宣而已
24.7.63.0 01/30 12:40
推
zaiter
其實千問也很強 比較不知名而已 還
101.8.27.48 01/30 13:28
→
zaiter
有華為的 華為才是軍事背景背後深不
101.8.27.48 01/30 13:28
→
zaiter
見底的
101.8.27.48 01/30 13:28
→
shanaandlai
光圖片都破成那樣
27.242.131.117 01/30 16:54
推
tv5566
本來可以商品化 現在中國ㄧ捲…
114.34.211.54 01/30 18:56
推
yueayase
難說
61.227.4.31 01/30 23:14
噓
kriswu8021
王炸 LOL
111.108.30.91 01/31 01:07
→
unima
兩個月跟兩年差很多!但兩個月跟兩
111.243.9.113 02/02 15:06
→
unima
週就沒太大優勢。
111.243.9.113 02/02 15:06