楊立昆解讀 DeepSeek:不是中國 AI 超越美國,而是開源模型超越專有模型
https://tinyurl.com/2c26ddpl
中國 AI 公司 DeepSeek 釋出 DeepSeek-R1 模型正式版,基準測試結果可說是追平
OpenAI o1,開發成本卻遠遠低於 OpenAI、Google 等所開發的模型,震驚 AI 業界。
圖靈獎得主、主導 Meta AI 研究的首席科學家楊立昆(Yann LeCun)認為,DeepSeek 成
功的最大收穫並非中國競爭對其他國家帶來更大威脅,而是 AI 開源(open-source)的
價值使任何人都能受益。
「對那些看到 DeepSeek 表現並認為『中國在 AI 領域正超越美國』的人而言,你的解讀
錯了」,楊立昆在 Threads 寫道,「正確解讀應是『開源模型正超越專有模型』」
DeepSeek-R1 開源釋出,Meta Llama 也類似這種做法。OpenAI 成立使命是以 AGI(
Artificial General Intelligence,通用人工智慧)造福全人類,起初採取開源做法,
近年來已轉向閉源(closed-source),不對外分享。
OpenAI 執行長奧特曼(Sam Altman)去年 11 月在 Reddit AMA(Ask Me Anything)活
動曾表示,閉源做法為 OpenAI 提供一種更容易達到安全門檻的方法,同時補充說,希望
OpenAI 將來開源釋出更多東西。
「DeepSeek 從開放研究和開源獲益良多(如同 PyTorch 和 Llama),他們提出新想法,
並從其他人的工作基礎加以建構。」楊立昆也寫道,「他們發布且採開源,所以每個人都
能從中受益,這就是開放研究和開源的力量。」
https://is.gd/DsPOuR
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.26.136.149 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1737887132.A.1D8.html
推文 (46)
→
squelch
這個解釋 很中肯
42.70.45.1 01/26 19:18
推
TSMCfabXX
LeCun 你去跟你家老闆說啊...
27.247.162.151 01/26 19:57
→
ader888
樓上是要他說什麼?llamma 就已經開
1.34.75.223 01/26 21:14
→
ader888
源了啊
1.34.75.223 01/26 21:14
→
MTKer5566
我只是不小心把內積換成卷積
114.137.33.171 01/26 22:07
→
MisterSmile
避重就輕,DeepSeek不開源就做不出
42.70.229.39 01/26 22:46
→
MisterSmile
來嗎?
42.70.229.39 01/26 22:46
→
willism
米國沒有輸!
114.47.51.141 01/27 00:01
推
willism
那你家Llama有贏嗎?
114.47.51.141 01/27 00:07
推
j112233446
阿就用開源的模型為基礎發展出來的
27.53.246.29 01/27 00:11
→
j112233446
這麼說沒錯吧
27.53.246.29 01/27 00:11
→
DrTech
llama只開源模型"權重"。deepseek是
42.200.20.164 01/27 00:33
→
DrTech
開源,訓練資料,訓練方法,模型權
42.200.20.164 01/27 00:33
→
DrTech
重,量化方式。
42.200.20.164 01/27 00:33
→
DrTech
而且llama系列模型是 llama license
42.200.20.164 01/27 00:37
→
DrTech
商用有限制。deepseek是MIT licens
42.200.20.164 01/27 00:37
→
DrTech
e,完全自由。開源程度差太多了。
42.200.20.164 01/27 00:37
推
aria0520
你家? 也不太對 對LeCun來說llama
103.224.201.110 01/27 02:03
→
aria0520
團隊是跟他的world model爭資源的
103.224.201.110 01/27 02:04
→
aria0520
競爭團隊
103.224.201.110 01/27 02:04
→
aria0520
lecun從頭到尾就沒看好過LLM
103.224.201.110 01/27 02:04
推
nctugoodman
gitGub上有 deepseek-R1 的paper
136.226.241.0 01/27 09:15
→
willism
World Models又不是LLM,整天在那
114.47.50.90 01/27 10:59
→
willism
抬槓
114.47.50.90 01/27 10:59
噓
cityhunter04
又來一篇?大過年的!KPI那麼難達
42.70.36.41 01/27 11:32
→
cityhunter04
成?
42.70.36.41 01/27 11:32
→
aria0520
llama從頭到尾leCun團隊就沒參與
103.224.201.110 01/27 14:13
→
aria0520
所以你硬說是他家他應該也滿頭問號
103.224.201.110 01/27 14:14
→
aria0520
他之前還抱怨過llama佔用太多資源
103.224.201.110 01/27 14:14
→
TSMCfabXX
Meta祖說 跟美AI差距小 呼籲政府減
27.247.162.151 01/27 14:16
→
TSMCfabXX
少對企業限制
27.247.162.151 01/27 14:16
→
TSMCfabXX
抗中保美的戲碼
27.247.162.151 01/27 14:18
→
TSMCfabXX
所以才說他跟他家老闆講話不同調
27.247.162.151 01/27 14:19
→
TSMCfabXX
除非你覺得Meta AI 跟 Meta 沒關係
27.247.162.151 01/27 14:20
→
Rain0224
楊立昆一直以來的發言和立場都是認
118.160.133.77 01/27 18:07
→
Rain0224
為大語言模型無法達成AGI
118.160.133.77 01/27 18:07
→
Rain0224
對LLM也多是批判的
118.160.133.77 01/27 18:08
→
willism
除非楊立昆自己創業啦,他現在領是
114.47.50.90 01/27 19:50
→
willism
fb薪水,他家當然是指fb,這種程度
114.47.50.90 01/27 19:50
→
willism
中文用語應該不需解釋。其他那些“
114.47.50.90 01/27 19:50
→
willism
常識”,大家都知道,不需要拿出來
114.47.50.90 01/27 19:50
→
willism
模糊焦點
114.47.50.90 01/27 19:50
推
TPERepublic
說得挺好的,不過既然開源那這樣是
223.137.231.60 01/28 11:13
→
TPERepublic
否代表大家都回到原點重新開始競爭
223.137.231.60 01/28 11:13
→
TPERepublic
了
223.137.231.60 01/28 11:13
→
camp0102
還是輸Gemini
49.216.105.106 01/28 13:47