[新聞] 中國 AI 公司 DeepSeek 令矽谷震驚

作者KotoriCute (乙醯胺酚)

標題[新聞] 中國 AI 公司 DeepSeek 令矽谷震驚

時間Sat Jan 25 19:55:14 2025

OpenAI 強大新勁敵，中國 AI 公司 DeepSeek 令矽谷震驚 https://bit.ly/4hxOiYJ 中國幻方成立的 AI 研究公司 DeepSeek 公布最新研究成果，震驚了全世界，無視美國阻止中國發展尖端科技的野心。幻方的創始團隊在 2015 年組成，其中代表人物為梁文鋒，團隊從零開始探索全自動化交易；到了 2015 年創立幻方量化，依靠數學與 AI 進行量化投資。來到 2023 年 4 月，幻方宣布成立一家研究公司 DeepSeek 以探索 AGI（Artificial General Intelligence，通用人工智慧），本週 20 日釋出的 DeepSeek-R1 模型正式版，在 AI 業界掀起熱烈討論。「今日發表 DeepSeek-R1，同步開源模型權重。DeepSeek-R1 遵循 MIT 授權條款，允許研究人員以蒸餾技術用 DeepSeek-R1 訓練其他模型」，DeepSeek 表示，而 DeepSeek-R1 基準測試結果可說是追平 OpenAI o1。同樣在 20 日，中國國務院總理李強主持由專家、企業家及各領域代表參與的座談會，聽取政府工作報告並提出建議，梁文鋒正是其中一員，以自身經驗對 AI 發展提出建言。來自美國的 OpenAI 和 Google DeepMind 率先開發推理模型，這是一種相對新穎的 AI 研究領域，試圖使模型接近人類認知能力。其中，OpenAI 先後發表 o1、o3，Google 則有 Ge mini 2.0 Flash Thinking Experimental，雙方對研究方法保密到家。 DeepSeek-R1 釋出在矽谷引發激烈爭論，重點在於資源相對充足的美國 AI 公司，是否能夠持續捍衛自身技術優勢。華盛頓當局禁止 NVIDIA 向中國供應最先進的晶片，無法建構充足算力下，中國當地 AI 公司被迫找出創新方法，盡可能提高既有晶片的算力，而梁文鋒的團隊知道如何解決這樣的問題。 DeepSeek 宣稱，使用供應中國市場的 2,048 個 NVIDIA H800 和不到 600 萬美元訓練一款擁有 6,710 億參數的模型，所需費用遠遠不及 OpenAI 和 Google 訓練同等規模的模型。不只如此，DeepSeeK 願意開源分享研究成果，而不是為了商業利益而保護它。DeepSeek 未從外部資源籌措資金，是靠母公司在對沖基金交易的收益支撐，也沒有採取重大措施將模型商業化。加州大學柏克萊分校的 AI 政策研究員 Ritwik Gupta 表示，DeepSeek 近來推出模型表明「AI 能力沒有護城河」，認為第一個訓練模型的人必須耗費大量資源才能達成目標，但後進者能以更便宜、更快速的方法辦到。他補充說，中國比起美國擁有更龐大的人才庫，他們了解如何充分利用運算資源，以更便宜的方法訓練、運行模型。業界人士則表示，儘管 DeepSeek 以有限資源取得受人矚目的成績，但隨 AI 產業發展，能否繼續保有競爭力仍是一個大問題。DeepSeek 面對的美國競爭對手並沒有坐以待斃，他們利用 NVIDIA 下一代 Blackwell 架構晶片建構運算叢集，強大算力有助於拉開競爭差距。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.232.174.138 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1737806116.A.0EE.html

推文 (117)

推 TyuzuChou 老黃老早就說過了 150.117.197.216 01/25 20:28

推 admon 先進晶片裡跑一堆垃圾雜訊 223.138.200.204 01/25 20:31

→ SabreN 如果成真，那幫美股大科技們哭哭， 36.237.101.106 01/25 20:36

→ SabreN 幾千億美元的資本支出白花了，但可 36.237.101.106 01/25 20:36

→ SabreN 能嗎？ 36.237.101.106 01/25 20:36

→ enso 要deepseek 自介，結果自稱chat gp 123.192.176.165 01/25 20:53

→ enso t 4這就是中國研發 123.192.176.165 01/25 20:53

→ rodion 內建習近平思想的ＡＩ就問你怕了沒 123.195.45.161 01/25 21:10

推 jW72 中國又在徵文比賽了喔之前的電動車 114.136.174.18 01/25 21:21

→ jW72 呢？ 114.136.174.18 01/25 21:21

推 cecille 看過一個比喻很傳神：從頭到尾. 從 119.77.142.25 01/25 21:31

→ cecille 採買到煮菜完成一到料理-》美國A 119.77.142.25 01/25 21:31

→ cecille I巨頭。買半成品再研究怎麼煮的快 119.77.142.25 01/25 21:31

→ cecille 又好-〉 deepseek 119.77.142.25 01/25 21:31

推 Basket0205 上車的是 114.25.202.49 01/25 22:40

推 MisterSmile 中國的DeepSeek比美國還自由開放 42.70.229.39 01/25 23:04

推 zerobx ok 調高AI關稅200% 61.228.77.172 01/25 23:18

噓 cityhunter04 繼續吹，看吹多久能成功.. 114.24.100.161 01/25 23:29

噓 IMBonjwa 純噓16 F 49.216.104.225 01/25 23:36

推 Fegnzi 本來以為科技版會就事論事素質比八 101.10.56.192 01/25 23:52

→ Fegnzi 卦版好一點結果素質比八卦版更糟XD 101.10.56.192 01/25 23:52

→ camerara 恐內建豆包人工智障 123.193.30.27 01/26 00:12

→ MTKer5566 科技版炫耀薪資下限用的，一堆打工 114.137.33.171 01/26 00:48

→ MTKer5566 宅 114.137.33.171 01/26 00:48

推 centra 如果成本優勢極大，那美國AI相關公 114.137.160.74 01/26 01:08

→ centra 司的股價應該就崩盤了 114.137.160.74 01/26 01:08

噓 stockking11 又遙遙領先 118.238.217.4 01/26 01:26

噓 dc177674 純噓6樓，你真的有去問他自介嗎 111.71.24.209 01/26 02:04

推 BoXeX 這邊大概一堆人搞不清楚open sourc 36.234.253.246 01/26 02:54

→ BoXeX e的意義吧 36.234.253.246 01/26 02:54

推 s213092921 http://i.imgur.com/nxhV6z5.jpg 223.140.65.30 01/26 05:53

推 scitamehtam 文組ID只只剩下「吹」這等級的用 223.136.89.63 01/26 06:33

→ scitamehtam 詞，畢竟根本AI 哈哈 223.136.89.63 01/26 06:33

→ scitamehtam 這要討論起來，文組青鳥大概，什麼 223.136.89.63 01/26 06:34

→ scitamehtam 都插不上話，只能靠逢中必反的政治 223.136.89.63 01/26 06:34

→ scitamehtam 立場來模糊焦點，大家繼續觀察就知 223.136.89.63 01/26 06:34

→ scitamehtam 道那幾個特定人士在洗了XDD 223.136.89.63 01/26 06:34

→ scitamehtam *畢竟根本不懂AI 223.136.89.63 01/26 06:34

→ mike0 一堆政黑柵欄關不住，跑來丟人現眼 101.12.22.75 01/26 07:54

推 cplusplus426 我看又是the 抄 136.23.35.32 01/26 08:01

→ houseguy 中國人才內捲是可以搞出一些東西， 182.234.97.156 01/26 08:17

→ houseguy 只是台灣不屬於中國，宅男發財還是 182.234.97.156 01/26 08:17

→ houseguy 宅 182.234.97.156 01/26 08:17

推 beariscut 這推文是科技版？根本是奴隸版 118.166.21.204 01/26 08:18

→ otaku690 Scale.AI CEO: “My understanding 50.209.152.73 01/26 08:32

→ otaku690 is that DeepSeek has about 50,000 50.209.152.73 01/26 08:32

→ otaku690 H100s—which they can’t talk ab 50.209.152.73 01/26 08:32

→ otaku690 out, obviously, because it is aga 50.209.152.73 01/26 08:32

→ otaku690 inst the export controls that the 50.209.152.73 01/26 08:32

→ otaku690 United States has put in place. 50.209.152.73 01/26 08:32

→ otaku690 ” 50.209.152.73 01/26 08:32

推 sean44555 這裡的老人有幾個看得懂AI的都難說 223.137.103.48 01/26 08:56

推 Lhmstu 怎麼這麼多，丟人現眼的... 1.162.105.141 01/26 09:04

推 wts4832 只能證明對中國的晶片禁令還不夠嚴 49.216.40.160 01/26 09:47

→ wts4832 格，應該是新加坡偷賣太多了 49.216.40.160 01/26 09:47

推 CoNsTaR Reddit 有人做實驗，跑deepseek r1 111.240.86.77 01/26 10:04

→ CoNsTaR 需要大約 150k USD 的設備 111.240.86.77 01/26 10:04

→ CoNsTaR 其實沒到真的很多很貴吧 111.240.86.77 01/26 10:04

推 bigair888 …世界上便宜又好用會造成市場失衡 223.138.147.35 01/26 11:49

→ bigair888 ，你要先看中國ai有讓美國害怕的實 223.138.147.35 01/26 11:49

→ bigair888 力？有的話，明天七大巨頭科技AI就 223.138.147.35 01/26 11:49

→ bigair888 應該要跌50趴 223.138.147.35 01/26 11:49

推 dakkk ai重點是有大數據得天下中國不缺 118.233.142.152 01/26 12:21

→ dakkk 數據 118.233.142.152 01/26 12:21

→ dakkk 只是與西方數據base有差 118.233.142.152 01/26 12:21

→ houseguy 捲積網路還真適合內捲的國家開發呢 182.234.97.156 01/26 12:32

→ lolicat 又遙遙領先 123.194.45.24 01/26 12:38

推 CoNsTaR 樓上，現在已經沒有人在用卷積了吧 27.242.132.221 01/26 12:48

→ CoNsTaR ，現在不都內積？ 27.242.132.221 01/26 12:48

→ kevinmeng2 現在台灣政府的方向就是跟世界脫軌 180.217.250.214 01/26 13:16

→ kevinmeng2 你看那數位幣就明白了，從世界先進 180.217.250.214 01/26 13:16

→ kevinmeng2 變成對岸差不多的法規了… 180.217.250.214 01/26 13:16

推 blent 跑 R1 是訓練還是做 inference? 42.77.39.218 01/26 13:46

推 chaohsiung 用ChatGPT來訓練較小的模型。不需要 222.250.254.135 01/26 14:13

→ chaohsiung 大量的人工建構的資料，訓練成本當 222.250.254.135 01/26 14:13

→ chaohsiung 然比較低。模型參數少了，當然運行 222.250.254.135 01/26 14:13

→ chaohsiung 成本降低。open ai也有自己的蒸餾模 222.250.254.135 01/26 14:13

→ chaohsiung 型。跟著做的本來就比較容易 222.250.254.135 01/26 14:13

推 swimbert 為什麼這麼多明明不懂硬要裝懂的人 123.204.11.251 01/26 15:29

→ swimbert 啊 123.204.11.251 01/26 15:29

推 xy390533kimo 這我信，強調cp值的國家 42.72.39.127 01/26 16:05

推 uxy82 剛剛試用了一下，以免費仔的立場來 42.78.230.201 01/26 18:08

→ uxy82 說還真的蠻好用的 42.78.230.201 01/26 18:08

推 kanpfer 中研院又能用中國模型了 118.231.129.23 01/26 19:28

推 Iversonshao 合作才能更強現在要這樣搞就是看 49.216.50.236 01/26 19:36

→ Iversonshao 哪一邊技勝ㄧ籌 49.216.50.236 01/26 19:36

噓 SkyIsMyLimit 人家都開源了數發部還在點麵線 223.137.153.188 01/26 20:19

→ yunf 同84樓ww 49.216.51.19 01/26 20:47

→ yunf https://tinyurl.com/2cmckv3o 49.216.51.19 01/26 20:47

推 randystock 共產黨的AI 189.224.250.87 01/26 21:06

噓 johnny7757 看到一堆講到中國就高潮的ID就知道 61.61.53.104 01/26 22:04

→ johnny7757 台灣真的沒救了 61.61.53.104 01/26 22:04

→ slybear 祖國已成最大贏家，厲害了，我的國 61.228.84.240 01/26 23:39

→ vjod 故意炒作的話題，稍差的表現、超低 106.248.243.74 01/27 07:49

→ vjod 的cost在AI發展史出現很多次，沒有 106.248.243.74 01/27 07:49

→ vjod 一次能成為之後發展重心 106.248.243.74 01/27 07:49

→ vjod 成長AI世界只有performance是一切 106.248.243.74 01/27 07:49

推 Dungeon 厲害+1 1.47.146.51 01/27 08:20

推 jessel 看一堆人這樣都可以崩潰真有趣 99.57.232.89 01/27 10:00

推 HAPPYISCASH ptt哪有什麼素質好的版 125.231.113.16 01/27 12:55

→ HAPPYISCASH ptt各個版都是互相流動的 125.231.113.16 01/27 12:55

→ HAPPYISCASH 推文每個人都進入過八卦版 125.231.113.16 01/27 12:55

→ HAPPYISCASH 每個都是柵欄仔 125.231.113.16 01/27 12:55

→ HAPPYISCASH 論文跟內部架構都100%免費公開了 125.231.113.16 01/27 12:57

→ HAPPYISCASH deepseek架構大家都能採用 125.231.113.16 01/27 12:57

推 HAPPYISCASH 而且台灣幾乎沒有ai相關科系跟人才 125.231.113.16 01/27 13:01

→ HAPPYISCASH 看不懂很正常這幾乎是個全新的產 125.231.113.16 01/27 13:01

→ HAPPYISCASH 業 125.231.113.16 01/27 13:01

→ HAPPYISCASH 台灣只有滿地搞硬體的黑手 125.231.113.16 01/27 13:01

推 xyz0123 台積狗只會顧產線啥AI都不知道 114.36.64.125 01/27 20:42

推 BarryBai 硬體才是比較難超越的…畢竟是物理 114.32.244.126 01/27 20:52

推 youkiller 這篇文章應該是deepseek請chatgpt 1.172.237.174 01/28 02:20

→ youkiller 撰寫的 1.172.237.174 01/28 02:20

→ dickey2 厲害，量子電腦AI都世界第一，卻做 223.138.24.25 01/28 10:29

→ dickey2 不出N3或更高階的製程 223.138.24.25 01/28 10:29

噓 ROTFL ds從出名後卡到現在，連聊色都屏蔽 112.78.84.209 01/30 16:10

→ ROTFL 了幹 112.78.84.209 01/30 16:10