OpenAI 強大新勁敵,中國 AI 公司 DeepSeek 令矽谷震驚
https://bit.ly/4hxOiYJ
中國幻方成立的 AI 研究公司 DeepSeek 公布最新研究成果,震驚了全世界,無視美國阻止
中國發展尖端科技的野心。
幻方的創始團隊在 2015 年組成,其中代表人物為梁文鋒,團隊從零開始探索全自動化交易
;到了 2015 年創立幻方量化,依靠數學與 AI 進行量化投資。來到 2023 年 4 月,幻方
宣布成立一家研究公司 DeepSeek 以探索 AGI(Artificial General Intelligence,通用
人工智慧),本週 20 日釋出的 DeepSeek-R1 模型正式版,在 AI 業界掀起熱烈討論。
「今日發表 DeepSeek-R1,同步開源模型權重。DeepSeek-R1 遵循 MIT 授權條款,允許研
究人員以蒸餾技術用 DeepSeek-R1 訓練其他模型」,DeepSeek 表示,而 DeepSeek-R1 基
準測試結果可說是追平 OpenAI o1。
同樣在 20 日,中國國務院總理李強主持由專家、企業家及各領域代表參與的座談會,聽取
政府工作報告並提出建議,梁文鋒正是其中一員,以自身經驗對 AI 發展提出建言。
來自美國的 OpenAI 和 Google DeepMind 率先開發推理模型,這是一種相對新穎的 AI 研
究領域,試圖使模型接近人類認知能力。其中,OpenAI 先後發表 o1、o3,Google 則有 Ge
mini 2.0 Flash Thinking Experimental,雙方對研究方法保密到家。
DeepSeek-R1 釋出在矽谷引發激烈爭論,重點在於資源相對充足的美國 AI 公司,是否能夠
持續捍衛自身技術優勢。
華盛頓當局禁止 NVIDIA 向中國供應最先進的晶片,無法建構充足算力下,中國當地 AI 公
司被迫找出創新方法,盡可能提高既有晶片的算力,而梁文鋒的團隊知道如何解決這樣的問
題。
DeepSeek 宣稱,使用供應中國市場的 2,048 個 NVIDIA H800 和不到 600 萬美元訓練一款
擁有 6,710 億參數的模型,所需費用遠遠不及 OpenAI 和 Google 訓練同等規模的模型。
不只如此,DeepSeeK 願意開源分享研究成果,而不是為了商業利益而保護它。DeepSeek 未
從外部資源籌措資金,是靠母公司在對沖基金交易的收益支撐,也沒有採取重大措施將模型
商業化。
加州大學柏克萊分校的 AI 政策研究員 Ritwik Gupta 表示,DeepSeek 近來推出模型表明
「AI 能力沒有護城河」,認為第一個訓練模型的人必須耗費大量資源才能達成目標,但後
進者能以更便宜、更快速的方法辦到。他補充說,中國比起美國擁有更龐大的人才庫,他們
了解如何充分利用運算資源,以更便宜的方法訓練、運行模型。
業界人士則表示,儘管 DeepSeek 以有限資源取得受人矚目的成績,但隨 AI 產業發展,能
否繼續保有競爭力仍是一個大問題。DeepSeek 面對的美國競爭對手並沒有坐以待斃,他們
利用 NVIDIA 下一代 Blackwell 架構晶片建構運算叢集,強大算力有助於拉開競爭差距。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.232.174.138 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1737806116.A.0EE.html
推文 (117)
推
TyuzuChou
老黃老早就說過了
150.117.197.216 01/25 20:28
推
admon
先進晶片裡跑一堆垃圾雜訊
223.138.200.204 01/25 20:31
→
SabreN
如果成真,那幫美股大科技們哭哭,
36.237.101.106 01/25 20:36
→
SabreN
幾千億美元的資本支出白花了,但可
36.237.101.106 01/25 20:36
→
SabreN
能嗎?
36.237.101.106 01/25 20:36
→
enso
要deepseek 自介,結果自稱chat gp
123.192.176.165 01/25 20:53
→
enso
t 4這就是中國研發
123.192.176.165 01/25 20:53
→
rodion
內建習近平思想的AI 就問你怕了沒
123.195.45.161 01/25 21:10
推
jW72
中國又在徵文比賽了喔之前的電動車
114.136.174.18 01/25 21:21
→
jW72
呢?
114.136.174.18 01/25 21:21
推
cecille
看過一個比喻很傳神:從頭到尾. 從
119.77.142.25 01/25 21:31
→
cecille
採買到煮菜完成一到料理-》 美國A
119.77.142.25 01/25 21:31
→
cecille
I巨頭。買半成品再研究怎麼煮的快
119.77.142.25 01/25 21:31
→
cecille
又好-〉 deepseek
119.77.142.25 01/25 21:31
推
Basket0205
上車的是
114.25.202.49 01/25 22:40
推
MisterSmile
中國的DeepSeek比美國還自由開放
42.70.229.39 01/25 23:04
推
zerobx
ok 調高AI關稅200%
61.228.77.172 01/25 23:18
噓
cityhunter04
繼續吹,看吹多久能成功..
114.24.100.161 01/25 23:29
噓
IMBonjwa
純噓16 F
49.216.104.225 01/25 23:36
推
Fegnzi
本來以為科技版會就事論事素質比八
101.10.56.192 01/25 23:52
→
Fegnzi
卦版好一點結果素質比八卦版更糟XD
101.10.56.192 01/25 23:52
→
camerara
恐內建豆包人工智障
123.193.30.27 01/26 00:12
→
MTKer5566
科技版炫耀薪資下限用的,一堆打工
114.137.33.171 01/26 00:48
→
MTKer5566
宅
114.137.33.171 01/26 00:48
推
centra
如果成本優勢極大,那美國AI相關公
114.137.160.74 01/26 01:08
→
centra
司的股價應該就崩盤了
114.137.160.74 01/26 01:08
噓
stockking11
又遙遙領先
118.238.217.4 01/26 01:26
噓
dc177674
純噓6樓,你真的有去問他自介嗎
111.71.24.209 01/26 02:04
推
BoXeX
這邊大概一堆人搞不清楚open sourc
36.234.253.246 01/26 02:54
→
BoXeX
e的意義吧
36.234.253.246 01/26 02:54
推
s213092921
http://i.imgur.com/nxhV6z5.jpg
223.140.65.30 01/26 05:53
推
scitamehtam
文組ID只 只剩下「吹」這等級的用
223.136.89.63 01/26 06:33
→
scitamehtam
詞,畢竟根本AI 哈哈
223.136.89.63 01/26 06:33
→
scitamehtam
這要討論起來,文組青鳥大概,什麼
223.136.89.63 01/26 06:34
→
scitamehtam
都插不上話,只能靠逢中必反的政治
223.136.89.63 01/26 06:34
→
scitamehtam
立場來模糊焦點,大家繼續觀察就知
223.136.89.63 01/26 06:34
→
scitamehtam
道那幾個特定人士在洗了XDD
223.136.89.63 01/26 06:34
→
scitamehtam
*畢竟根本不懂AI
223.136.89.63 01/26 06:34
→
mike0
一堆政黑柵欄關不住,跑來丟人現眼
101.12.22.75 01/26 07:54
推
cplusplus426
我看又是the 抄
136.23.35.32 01/26 08:01
→
houseguy
中國人才內捲是可以搞出一些東西,
182.234.97.156 01/26 08:17
→
houseguy
只是台灣不屬於中國,宅男發財還是
182.234.97.156 01/26 08:17
→
houseguy
宅
182.234.97.156 01/26 08:17
推
beariscut
這推文是科技版?根本是奴隸版
118.166.21.204 01/26 08:18
→
otaku690
Scale.AI CEO: “My understanding
50.209.152.73 01/26 08:32
→
otaku690
is that DeepSeek has about 50,000
50.209.152.73 01/26 08:32
→
otaku690
H100s—which they can’t talk ab
50.209.152.73 01/26 08:32
→
otaku690
out, obviously, because it is aga
50.209.152.73 01/26 08:32
→
otaku690
inst the export controls that the
50.209.152.73 01/26 08:32
→
otaku690
United States has put in place.
50.209.152.73 01/26 08:32
→
otaku690
”
50.209.152.73 01/26 08:32
推
sean44555
這裡的老人有幾個看得懂AI的都難說
223.137.103.48 01/26 08:56
推
Lhmstu
怎麼這麼多,丟人現眼的...
1.162.105.141 01/26 09:04
推
wts4832
只能證明對中國的晶片禁令還不夠嚴
49.216.40.160 01/26 09:47
→
wts4832
格,應該是新加坡偷賣太多了
49.216.40.160 01/26 09:47
推
CoNsTaR
Reddit 有人做實驗,跑deepseek r1
111.240.86.77 01/26 10:04
→
CoNsTaR
需要大約 150k USD 的設備
111.240.86.77 01/26 10:04
→
CoNsTaR
其實沒到真的很多很貴吧
111.240.86.77 01/26 10:04
推
bigair888
…世界上便宜又好用會造成市場失衡
223.138.147.35 01/26 11:49
→
bigair888
,你要先看中國ai有讓美國害怕的實
223.138.147.35 01/26 11:49
→
bigair888
力?有的話,明天七大巨頭科技AI就
223.138.147.35 01/26 11:49
→
bigair888
應該要跌50趴
223.138.147.35 01/26 11:49
推
dakkk
ai重點是有大數據得天下 中國不缺
118.233.142.152 01/26 12:21
→
dakkk
數據
118.233.142.152 01/26 12:21
→
dakkk
只是與西方數據base有差
118.233.142.152 01/26 12:21
→
houseguy
捲積網路還真適合內捲的國家開發呢
182.234.97.156 01/26 12:32
→
lolicat
又遙遙領先
123.194.45.24 01/26 12:38
推
CoNsTaR
樓上,現在已經沒有人在用卷積了吧
27.242.132.221 01/26 12:48
→
CoNsTaR
,現在不都內積?
27.242.132.221 01/26 12:48
→
kevinmeng2
現在台灣政府的方向就是跟世界脫軌
180.217.250.214 01/26 13:16
→
kevinmeng2
你看那數位幣就明白了,從世界先進
180.217.250.214 01/26 13:16
→
kevinmeng2
變成對岸差不多的法規了…
180.217.250.214 01/26 13:16
推
blent
跑 R1 是訓練還是做 inference?
42.77.39.218 01/26 13:46
推
chaohsiung
用ChatGPT來訓練較小的模型。不需要
222.250.254.135 01/26 14:13
→
chaohsiung
大量的人工建構的資料,訓練成本當
222.250.254.135 01/26 14:13
→
chaohsiung
然比較低。模型參數少了,當然運行
222.250.254.135 01/26 14:13
→
chaohsiung
成本降低。open ai也有自己的蒸餾模
222.250.254.135 01/26 14:13
→
chaohsiung
型。跟著做的本來就比較容易
222.250.254.135 01/26 14:13
推
swimbert
為什麼這麼多明明不懂硬要裝懂的人
123.204.11.251 01/26 15:29
→
swimbert
啊
123.204.11.251 01/26 15:29
推
xy390533kimo
這我信,強調cp值的國家
42.72.39.127 01/26 16:05
推
uxy82
剛剛試用了一下,以免費仔的立場來
42.78.230.201 01/26 18:08
→
uxy82
說還真的蠻好用的
42.78.230.201 01/26 18:08
推
kanpfer
中研院又能用中國模型了
118.231.129.23 01/26 19:28
推
Iversonshao
合作才能更強 現在要這樣搞 就是看
49.216.50.236 01/26 19:36
→
Iversonshao
哪一邊技勝ㄧ籌
49.216.50.236 01/26 19:36
噓
SkyIsMyLimit
人家都開源了 數發部還在點麵線
223.137.153.188 01/26 20:19
→
yunf
同84樓ww
49.216.51.19 01/26 20:47
→
yunf
https://tinyurl.com/2cmckv3o
49.216.51.19 01/26 20:47
推
randystock
共產黨的AI
189.224.250.87 01/26 21:06
噓
johnny7757
看到一堆講到中國就高潮的ID就知道
61.61.53.104 01/26 22:04
→
johnny7757
台灣真的沒救了
61.61.53.104 01/26 22:04
→
slybear
祖國已成最大贏家,厲害了,我的國
61.228.84.240 01/26 23:39
→
vjod
故意炒作的話題,稍差的表現、超低
106.248.243.74 01/27 07:49
→
vjod
的cost在AI發展史出現很多次,沒有
106.248.243.74 01/27 07:49
→
vjod
一次能成為之後發展重心
106.248.243.74 01/27 07:49
→
vjod
成長AI世界只有performance是一切
106.248.243.74 01/27 07:49
推
Dungeon
厲害+1
1.47.146.51 01/27 08:20
推
jessel
看一堆人這樣都可以崩潰真有趣
99.57.232.89 01/27 10:00
推
HAPPYISCASH
ptt哪有什麼素質好的版
125.231.113.16 01/27 12:55
→
HAPPYISCASH
ptt各個版都是互相流動的
125.231.113.16 01/27 12:55
→
HAPPYISCASH
推文每個人都進入過八卦版
125.231.113.16 01/27 12:55
→
HAPPYISCASH
每個都是柵欄仔
125.231.113.16 01/27 12:55
→
HAPPYISCASH
論文跟內部架構都100%免費公開了
125.231.113.16 01/27 12:57
→
HAPPYISCASH
deepseek架構大家都能採用
125.231.113.16 01/27 12:57
推
HAPPYISCASH
而且台灣幾乎沒有ai相關科系跟人才
125.231.113.16 01/27 13:01
→
HAPPYISCASH
看不懂很正常 這幾乎是個全新的產
125.231.113.16 01/27 13:01
→
HAPPYISCASH
業
125.231.113.16 01/27 13:01
→
HAPPYISCASH
台灣只有滿地搞硬體的黑手
125.231.113.16 01/27 13:01
推
xyz0123
台積狗只會顧產線 啥AI都不知道
114.36.64.125 01/27 20:42
推
BarryBai
硬體才是比較難超越的…畢竟是物理
114.32.244.126 01/27 20:52
推
youkiller
這篇文章應該是deepseek請chatgpt
1.172.237.174 01/28 02:20
→
youkiller
撰寫的
1.172.237.174 01/28 02:20
→
dickey2
厲害,量子電腦AI都世界第一,卻做
223.138.24.25 01/28 10:29
→
dickey2
不出N3或更高階的製程
223.138.24.25 01/28 10:29
噓
ROTFL
ds從出名後卡到現在,連聊色都屏蔽
112.78.84.209 01/30 16:10
→
ROTFL
了幹
112.78.84.209 01/30 16:10