Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預

作者Latte7 (nonono)

標題Re: [新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預

時間Sat Jan 25 22:54:44 2025

結果Meta執行長馬上宣布 2025年 AI資本支出650億美金我覺得，那帖子的真實性令人存疑而且大陸的數據本來就不可信他真實的成本應該是美化過的數字 ※ 引述《Lushen (pttlushen)》之銘言： : 原文標題： : Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋 : 原文連結：https://www.jiqizhixin.com/articles/2025-01-24-2 : 發布時間：2025/01/24 : 記者署名：機器之心 : 原文內容： : 「工程師正在瘋狂地分析 DeepSeek，試圖從中複製任何可能的東西。」 : DeepSeek 開源大模型的陽謀，切切實實震撼著美國 AI 公司。 : 最先陷入恐慌的，似乎是同樣推崇開源的 Meta。 : 最近，有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到，? : 原文如下： : 這一切始於 DeepSeek-V3，它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁? : 工程師們正在瘋狂地分析 DeepSeek，試圖從中複製任何可能的東西。這一點都不誇張。 : 管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每 : DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息，但這些很快就會公開。 : 這本來應該是一個以工程為重點的小型組織，但是因為很多人想要參與進來分一杯羹，人 : https://i.imgur.com/hKZ6h5W.png : 貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 202 5 : 其中，DeepSeek-V3 在發佈時提到，該模型在多項評測成績超越了Qwen2.5-72B 和Llam a- : 不過，更引人注目的是，這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元? : https://i.imgur.com/mJn5POl.png : 而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上，? : https://i.imgur.com/NLhp4Nj.png : 看到這裡，我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有? : 有人指出，其實該慌的不只 Meta，OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。 : https://i.imgur.com/gQ5fHDH.png : 還有人擔心起了英偉達的股價，表示「如果 DeeSeek 的創新是真的，那麼 AI 公司是否? : https://i.imgur.com/HIFcTx6.png : 不過，也有人質疑，DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝？有人回覆? : https://i.imgur.com/HIFcTx6.png : 目前，我們還無法確定貼文的真實性。 : 不知道 Meta 後續會如何回應，即將到來的 Llama 4 又會達到怎樣的表現。 : 心得/評論： : Meta工程師在TeamBlind(一個匿名的職涯討論區，需要經過公司Email驗證)爆料中國的 De : DeepSeek R1訓練成本550萬美元可能比一個Meta大頭的年薪還便宜 : DeepSeek 這件事情也不光是中國自己在吹噓 : 看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大 : DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論 : https://i.imgur.com/NLhp4Nj.png : DeepSeek R1 開源+論文公開應該會推進一波AI界的發展 : DeepSeek 後續發展值得關注一下 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.46.4 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Stock/M.1737816886.A.6AE.html

推文 (85)

推 s213092921 http://i.imgur.com/u8wpYYZ.jpg 成本都是假的 01/25 23:01

→ s213092921 可憐Meta只能繼續砸錢投入無底洞，無法優化節省成本 01/25 23:02

推 vindiesl2000 多投錢加薪就做的出來了 01/25 23:04

→ vindiesl2000 老美工程師一直都是這樣講 01/25 23:04

推 ck326 Meta 裁員的錢都拿來蓋這些了，反正Meta 有的是錢 01/25 23:05

推 FK6819 花錢請五毛幫忙吹，保證吹到外太空 01/25 23:08

推 Blastodern 中吹忙了半天Meta股價創新高，笑死 01/25 23:32

→ Brioni 技術拼不出差距就當大課長，沒有什麼是課金不能解決 01/25 23:34

→ Brioni 的 01/25 23:34

→ Brioni 拉不開差距就只是錢還砸不夠多 01/25 23:35

→ Brioni 技術研究再多也拼不贏本多忠勝 01/25 23:36

推 junior020486 TSM250 01/25 23:38

推 bella1815 從12月多就開始吹DS，，整天喊屌打美國幾條街，結 01/25 23:43

→ bella1815 果SP500又創新高了 01/25 23:43

推 KSUGOD AMD都加入了我相信是真的 01/25 23:48

→ doubi 成本這個跟大陸無關, 都開源了, 你可以自己照做 01/25 23:49

→ doubi 它連訓練方式都開源, 低成本應該騙不了人 01/25 23:49

→ doubi 這次比較驚艷的應該是強化學習用在 LLM 吧 01/25 23:50

→ doubi 類似 AlphaGO 自己跟自己下棋增加 Data 量一樣 01/25 23:50

推 bj45566 DeepSeek 是不是真貨和 SP500 創新高有什麼邏輯關係 01/26 00:00

→ bj45566 ？現在誰靠大語言模型賺大錢了嗎？Meta 市值創新高 01/26 00:00

→ bj45566 ，但 Meta 在 LLM 是輸給 Google 喔，怎麼不是 Goog 01/26 00:00

→ bj45566 le 市值創新高？ 01/26 00:00

推 eriker 就花錢請網軍行銷吧不然AMD沒cuda是要AI什麼 01/26 00:03

推 abcd5566 Meta這次建構的是廠房設備怎樣都不虧 01/26 00:03

→ eriker 更不用cuda有google fb支援torch tensorflow 01/26 00:05

推 abcd5566 跟OpenAI這種閉源盈利比較有關係 Meta是來玩的 01/26 00:09

推 bj45566 連國中英文都看不懂的 AI 名人又來高談闊論了，嘻嘻 01/26 00:12

→ bj45566 wwww 01/26 00:12

推 bj45566 Meta 裏面做 AI 的和做 FB 的根本不是同一個團隊 ww 01/26 00:29

→ bj45566 ww 01/26 00:29

推 ChikanDesu 那你就學過來或買過來阿用這個資金去訓練Deepseek 01/26 00:40

→ ChikanDesu 不就海放 01/26 00:40

推 bj45566 Meta AI 是很認真在做研發的，鬼才跟你來玩 =.= 01/26 00:55

推 YandereLove AI不只LLM還有很多要搞 01/26 01:50

→ fitenessboyz Meta頭都洗了難道要叫他現在縮手嗎 01/26 02:21

推 bella1815 跟SP500沒關係？你說DS用不到1/10的預算就能超越美 01/26 02:32

→ bella1815 國頂尖AI公司，真是這樣美國7巨頭早就跌成一片了， 01/26 02:32

→ bella1815 SP500能不跌嗎？ 01/26 02:32

推 Brioni 沒人說超越吧？DS只是CP值超高，但不代表領先，這是 01/26 03:08

→ Brioni 兩個概念 01/26 03:08

推 bella1815 https://i.imgur.com/2w3ahbi.jpeg 01/26 03:27

推 bj45566 好笑，美國頂尖 AI 公司又不只一家，而且一家又不只 01/26 03:47

→ bj45566 推出一個產品 wwww wwww 01/26 03:47

推 bj45566 DeepSeek-R1 在論文中的效能表現超越了，例如，同 01/26 03:53

→ bj45566 樣是免費的 OpenAI o1-mini -- 有什麼問題嗎？ 01/26 03:53

推 bj45566 Meta 也是美國頂尖的 AI 公司，更早發布的 DeepSeek 01/26 04:00

→ bj45566 -V3 在效能表現也打平甚至超越了 Meta 目前所有的開 01/26 04:00

→ bj45566 源碼產品 -- 用 1/10 的成本 01/26 04:00

推 bj45566 但是目前表現最好的大語言模型仍然是 -- 非開源碼 01/26 04:01

→ bj45566 的 -- OpenAI o3 01/26 04:01

→ jatj 到底在ww 什麼東西… 01/26 04:02

推 bj45566 到底腦袋要長怎麼樣才會認為如果這東西是真的，美 01/26 04:07

→ bj45566 國七巨頭會崩潰、SP500 會大跌？ -- 美國 M7 誰靠 01/26 04:07

→ bj45566 賣 LLM 吃飯？還有，誰說 AI 競賽已經結束了？ 01/26 04:07

推 bj45566 Google 上市前也有歐洲的新創公司說自己的 Search E 01/26 04:14

→ bj45566 ngine 表現不輸 Google 還開放免費公測 so what ??? 01/26 04:14

→ bj45566 Google 也沒崩潰，大家都只想用 Google 01/26 04:14

推 bj45566 軟體業誰能賺大錢本來就取決於許多技術面以外的因 01/26 04:21

→ bj45566 素 -- 不然當初 MS-DOS 這爛東西怎麼能稱霸個人電 01/26 04:21

→ bj45566 腦市場？ 01/26 04:21

推 bj45566 忘了和那隻腦袋不知道長成怎麼樣的再舉一個例子 -- 01/26 04:38

→ bj45566 TikTok 穩坐 app 下載冠軍已經四年了，風靡歐美， 01/26 04:38

→ bj45566 怎麼 Meta 不但沒崩潰反而市值還創新高？ 01/26 04:38

推 bj45566 Meta 可是妥妥靠 SNS apps 吃飯的耶！ 01/26 04:40

→ Leo4891 除了大語言模型推論型AI也要發展啊講得好像一 01/26 07:35

→ Leo4891 副不用砸錢ai自己就能發展了 01/26 07:35

→ Leo4891 大語言模型就只是一個的開端而已 01/26 07:36

推 shorty5566 可是scale ai 的ceo說deepseek有5萬台h100 只是因 01/26 07:41

→ shorty5566 為政策關係那些不能說他們有 01/26 07:41

推 WTF55665566 基本上就另一個C919啦還以為多厲害其實就是中共 01/26 07:46

→ WTF55665566 那套宣傳體系嚇人而已 01/26 07:46

→ WTF55665566 成本靠著不透明跟國家輸血想改多低就多低 01/26 07:46

推 mamorui 我餵給DS R1正常的幾何數學題跟正常簡單的邏輯題都 01/26 07:56

→ mamorui 會錯了，主打推理方面就得講究正確率，coding我用 01/26 07:56

→ mamorui 平板就沒餵了。 01/26 07:56

→ qazwsx0128 誰跟你說成本降低就要砍資本支出？你會嫌ai智力太 01/26 08:42

→ qazwsx0128 高是不是 01/26 08:42

推 richaad 再說一次，中國人不傻，但美國人絕對不是白癡，scal 01/26 10:40

→ richaad ing law依然存在，懂的就懂 01/26 10:40

推 bella1815 我有說7巨頭會崩潰? 別自己亂扭曲。以微軟為例，20 01/26 11:34

→ bella1815 23.04就是因為AI，股價開始大多頭。數月前OpenAI因 01/26 11:34

→ bella1815 訓練成本太高、虧損的消息一出，微軟股價就表現不 01/26 11:34

→ bella1815 好了。我就問你AI會不會影響股價? 01/26 11:34

推 h0103661 加錢不就更加證明他被威脅到了? 01/26 11:42