結果Meta執行長馬上宣布
2025年 AI資本支出650億美金
我覺得,那帖子的真實性令人存疑
而且大陸的數據本來就不可信
他真實的成本應該是美化過的數字
※ 引述《Lushen (pttlushen)》之銘言:
: 原文標題:
: Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
: 原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2
: 發布時間:2025/01/24
: 記者署名:機器之心
: 原文內容:
: 「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」
: DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。
: 最先陷入恐慌的,似乎是同樣推崇開源的 Meta。
: 最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到
,?
: 原文如下:
: 這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「
擁?
: 工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張
。
: 管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的
每
: DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。
: 這本來應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,
人
: https://i.imgur.com/hKZ6h5W.png
: 貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 202
5
: 其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了Qwen2.5-72B 和Llam
a-
: 不過,更引人注目的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美
元?
: https://i.imgur.com/mJn5POl.png
: 而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上
,?
: https://i.imgur.com/NLhp4Nj.png
: 看到這裡,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒
有?
: 有人指出,其實該慌的不只 Meta,OpenAI、Google、Anthropic 又何嘗沒有受到挑戰
。
: https://i.imgur.com/gQ5fHDH.png
: 還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那麼 AI 公司是
否?
: https://i.imgur.com/HIFcTx6.png
: 不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回
覆?
: https://i.imgur.com/HIFcTx6.png
: 目前,我們還無法確定貼文的真實性。
: 不知道 Meta 後續會如何回應,即將到來的 Llama 4 又會達到怎樣的表現。
: 心得/評論:
: Meta工程師在TeamBlind(一個匿名的職涯討論區,需要經過公司Email驗證)爆料中國的
De
: DeepSeek R1訓練成本550萬美元 可能比一個Meta大頭的年薪還便宜
: DeepSeek 這件事情也不光是中國自己在吹噓
: 看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大
: DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論
: https://i.imgur.com/NLhp4Nj.png
: DeepSeek R1 開源+論文公開應該會推進一波AI界的發展
: DeepSeek 後續發展值得關注一下
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.46.4 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1737816886.A.6AE.html
推文 (85)
推
s213092921
http://i.imgur.com/u8wpYYZ.jpg 成本都是假的
01/25 23:01
→
s213092921
可憐Meta只能繼續砸錢投入無底洞,無法優化節省成本
01/25 23:02
推
vindiesl2000
多投錢加薪就做的出來了
01/25 23:04
→
vindiesl2000
老美工程師一直都是這樣講
01/25 23:04
推
ck326
Meta 裁員的錢都拿來蓋這些了,反正Meta 有的是錢
01/25 23:05
推
FK6819
花錢請五毛幫忙吹,保證吹到外太空
01/25 23:08
推
Blastodern
中吹忙了半天Meta股價創新高,笑死
01/25 23:32
→
Brioni
技術拼不出差距就當大課長,沒有什麼是課金不能解決
01/25 23:34
→
Brioni
的
01/25 23:34
→
Brioni
拉不開差距就只是錢還砸不夠多
01/25 23:35
→
Brioni
技術研究再多也拼不贏本多忠勝
01/25 23:36
推
junior020486
TSM250
01/25 23:38
推
bella1815
從12月多就開始吹DS,,整天喊屌打美國幾條街,結
01/25 23:43
→
bella1815
果SP500又創新高了
01/25 23:43
推
KSUGOD
AMD都加入了 我相信是真的
01/25 23:48
→
doubi
成本這個跟大陸無關, 都開源了, 你可以自己照做
01/25 23:49
→
doubi
它連訓練方式都開源, 低成本應該騙不了人
01/25 23:49
→
doubi
這次比較驚艷的應該是強化學習用在 LLM 吧
01/25 23:50
→
doubi
類似 AlphaGO 自己跟自己下棋增加 Data 量一樣
01/25 23:50
推
bj45566
DeepSeek 是不是真貨和 SP500 創新高有什麼邏輯關係
01/26 00:00
→
bj45566
?現在誰靠大語言模型賺大錢了嗎?Meta 市值創新高
01/26 00:00
→
bj45566
,但 Meta 在 LLM 是輸給 Google 喔,怎麼不是 Goog
01/26 00:00
→
bj45566
le 市值創新高?
01/26 00:00
推
eriker
就花錢請網軍行銷吧 不然AMD沒cuda是要AI什麼
01/26 00:03
推
abcd5566
Meta這次建構的是廠房設備 怎樣都不虧
01/26 00:03
→
eriker
更不用cuda有google fb支援torch tensorflow
01/26 00:05
推
abcd5566
跟OpenAI這種閉源盈利比較有關係 Meta是來玩的
01/26 00:09
推
bj45566
連國中英文都看不懂的 AI 名人又來高談闊論了,嘻嘻
01/26 00:12
→
bj45566
wwww
01/26 00:12
推
bj45566
Meta 裏面做 AI 的和做 FB 的根本不是同一個團隊 ww
01/26 00:29
→
bj45566
ww
01/26 00:29
推
ChikanDesu
那你就學過來或買過來阿 用這個資金去訓練Deepseek
01/26 00:40
→
ChikanDesu
不就海放
01/26 00:40
推
bj45566
Meta AI 是很認真在做研發的,鬼才跟你來玩 =.=
01/26 00:55
推
YandereLove
AI不只LLM還有很多要搞
01/26 01:50
→
fitenessboyz
Meta頭都洗了 難道要叫他現在縮手嗎
01/26 02:21
推
bella1815
跟SP500沒關係?你說DS用不到1/10的預算就能超越美
01/26 02:32
→
bella1815
國頂尖AI公司,真是這樣美國7巨頭早就跌成一片了,
01/26 02:32
→
bella1815
SP500能不跌嗎?
01/26 02:32
推
Brioni
沒人說超越吧?DS只是CP值超高,但不代表領先,這是
01/26 03:08
→
Brioni
兩個概念
01/26 03:08
推
bella1815
https://i.imgur.com/2w3ahbi.jpeg
01/26 03:27
推
bj45566
好笑,美國頂尖 AI 公司又不只一家,而且一家又不只
01/26 03:47
→
bj45566
推出一個產品 wwww wwww
01/26 03:47
推
bj45566
DeepSeek-R1 在論文中的效能表現超越了,例如,同
01/26 03:53
→
bj45566
樣是免費的 OpenAI o1-mini -- 有什麼問題嗎?
01/26 03:53
推
bj45566
Meta 也是美國頂尖的 AI 公司,更早發布的 DeepSeek
01/26 04:00
→
bj45566
-V3 在效能表現也打平甚至超越了 Meta 目前所有的開
01/26 04:00
→
bj45566
源碼產品 -- 用 1/10 的成本
01/26 04:00
推
bj45566
但是目前表現最好的大語言模型仍然是 -- 非開源碼
01/26 04:01
→
bj45566
的 -- OpenAI o3
01/26 04:01
→
jatj
到底在ww 什麼東西…
01/26 04:02
推
bj45566
到底腦袋要長怎麼樣才會認為如果這東西是真的,美
01/26 04:07
→
bj45566
國七巨頭會崩潰、SP500 會大跌? -- 美國 M7 誰靠
01/26 04:07
→
bj45566
賣 LLM 吃飯?還有,誰說 AI 競賽已經結束了?
01/26 04:07
推
bj45566
Google 上市前也有歐洲的新創公司說自己的 Search E
01/26 04:14
→
bj45566
ngine 表現不輸 Google 還開放免費公測 so what ???
01/26 04:14
→
bj45566
Google 也沒崩潰,大家都只想用 Google
01/26 04:14
推
bj45566
軟體業誰能賺大錢本來就取決於許多技術面以外的因
01/26 04:21
→
bj45566
素 -- 不然當初 MS-DOS 這爛東西怎麼能稱霸個人電
01/26 04:21
→
bj45566
腦市場?
01/26 04:21
推
bj45566
忘了和那隻腦袋不知道長成怎麼樣的再舉一個例子 --
01/26 04:38
→
bj45566
TikTok 穩坐 app 下載冠軍已經四年了,風靡歐美,
01/26 04:38
→
bj45566
怎麼 Meta 不但沒崩潰反而市值還創新高?
01/26 04:38
推
bj45566
Meta 可是妥妥靠 SNS apps 吃飯的耶!
01/26 04:40
→
Leo4891
除了大語言模型 推論型AI也要發展啊 講得好像一
01/26 07:35
→
Leo4891
副不用砸錢ai自己就能發展了
01/26 07:35
→
Leo4891
大語言模型就只是一個的開端而已
01/26 07:36
推
shorty5566
可是scale ai 的ceo說deepseek有5萬台h100 只是因
01/26 07:41
→
shorty5566
為政策關係那些不能說他們有
01/26 07:41
推
WTF55665566
基本上就另一個C919啦 還以為多厲害 其實就是中共
01/26 07:46
→
WTF55665566
那套宣傳體系嚇人而已
01/26 07:46
→
WTF55665566
成本靠著不透明跟國家輸血 想改多低就多低
01/26 07:46
推
mamorui
我餵給DS R1正常的幾何數學題跟正常簡單的邏輯題都
01/26 07:56
→
mamorui
會錯了,主打推理方面就得講究正確率,coding我用
01/26 07:56
→
mamorui
平板就沒餵了。
01/26 07:56
→
qazwsx0128
誰跟你說成本降低就要砍資本支出?你會嫌ai智力太
01/26 08:42
→
qazwsx0128
高是不是
01/26 08:42
推
richaad
再說一次,中國人不傻,但美國人絕對不是白癡,scal
01/26 10:40
→
richaad
ing law依然存在,懂的就懂
01/26 10:40
推
bella1815
我有說7巨頭會崩潰? 別自己亂扭曲。以微軟為例,20
01/26 11:34
→
bella1815
23.04就是因為AI,股價開始大多頭。數月前OpenAI因
01/26 11:34
→
bella1815
訓練成本太高、虧損的消息一出,微軟股價就表現不
01/26 11:34
→
bella1815
好了。我就問你AI會不會影響股價?
01/26 11:34
推
h0103661
加錢不就更加證明他被威脅到了?
01/26 11:42