Re: [新聞] OpenAI執行長：DeepSeek令人驚豔但關鍵

作者LDPC (Channel Coding)

標題Re: [新聞] OpenAI執行長：DeepSeek令人驚豔但關鍵

時間Tue Jan 28 15:24:11 2025

就是算力才是絕對 (新聞用運算這詞可能不太好懂) https://x.com/karpathy/status/1883941452738355376 吃瓜可以看下面翻譯 https://x.com/op7418/status/1884065603184681162 無窮算力->無窮智能這就是OpenAI和Andrej Karpathy, Jim Fan甚至認為高算力模型可以訓練更強大模型不要忽視scale 像之前有人在懷疑v3有用到gpt合成數據 Andrej論點是你要合成高品質數據也是要算力這又跟老黃提到高品質render ->算力好了QQ 不要再跌了我已經在看youtube學習如何炸薯條了 ※ 引述《rayisgreat (在過往中無盡徘徊)》之銘言： : 原文標題： : OpenAI執行長：DeepSeek令人驚豔但關鍵在運算 : 原文連結： : https://www.cna.com.tw/news/aopl/202501280099.aspx : 發布時間： : 中央社 2025/1/28 13:29（1/28 13:48 更新） : 記者署名： : 曾依璇/李佩珊 : 原文內容： : （中央社舊金山27日綜合外電報導）人工智慧（AI）公司OpenAI執行長阿特曼今天說，中 : 國新創公司「深度求索」（DeepSeek）的R1模型「令人印象深刻」，但OpenAI認為更強大 : 的運算能力是OpenAI成功的關鍵。 : 路透社報導，成本低廉的中國AI模型DeepSeek上月開始吸引全球目光，當時這家公司在論 : 文中表示，使用較低性能的輝達（Nvidia）H800晶片訓練其DeepSeek-V3模型，只花費不 : 到600萬美元。 : 根據DeepSeek官方微信帳號貼文，上週推出的DeepSeek-R1模型比OpenAI的o1模型便宜20 : 倍到50倍，依任務內容而有不同。 : 阿特曼（Sam Altman）在社群平台X寫道：「DeepSeek的R1模型令人印象深刻，尤其是以 : 這個價格所能實現（的結果）。」 : 他還說：「但我們主要是很高興能繼續執行我們的研究藍圖，並認為要成功完成任務，現 : 在比以往都更重要的是更多運算。」（譯者：曾依璇/核稿：李佩珊）1140128 : 心得/評論： : https://imgur.com/iSz2Nr0 : OpenAI 執行長 Sam Altman : 今日也對近來興起的中國 DeepSeek 發表了回應 : 台股美股會繼續往下or往上回彈？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.21.72.78 (美國) ※ 文章網址: https://webptt.cc/bbs/Stock/M.1738049054.A.EBC.html =_= 你沒搞懂沒那些gpt4o存在(用高算力產生) 你v3訓練用的數據集可能都產不出 ※ 編輯: LDPC (76.21.72.78 美國), 01/28/2025 15:25:31 ※ 編輯: LDPC (76.21.72.78 美國), 01/28/2025 15:26:24

推文 (125)

推 nanako81240 鏟子很重要阿但人家用湯匙挖得跟你鏟子一樣多 01/28 15:25

→ nanako81240 美國被發現只會拼命買鏟子 01/28 15:26

→ losage 問題是湯匙也是老黃造的，這場暴跌他最冤好嗎 01/28 15:27

推 jise51103 蒜粒是啥 01/28 15:27

推 metallolly 我已經在研究職訓局水電班怎麼報名了 01/28 15:29

→ NCKUFatPork 基本上就是沒人挖石油你要怎麼精煉加工 01/28 15:29

推 colapola 老黃真的跌的莫名其妙 01/28 15:29

→ NCKUFatPork Deepseek只是精練而已底層還是大模型還是尻別人的 01/28 15:29

推 s213092921 你有算力，我有蒜粒 01/28 15:30

→ opticalman 中國學chatgpt成就DS，DS被分析完，還不是要靠算力 01/28 15:30

→ opticalman 成就另一個里程盃......總結：AI 更進化需演算法+ 01/28 15:30

→ opticalman 算力 01/28 15:30

推 create8 幹，我要去少林寺學料理了 01/28 15:31

推 x2159679 deepseek的底層大模型好像還是用openai的...... 01/28 15:31

推 opticalman 對阿，就演算法抄來，然后再進化 01/28 15:32

推 gk1329 自然界可以參考鴨 01/28 15:33

→ poru NV都開釋了!只是市場還在恐慌 01/28 15:33

→ gk1329 人腦不是自然界最大的但算法是最好的 01/28 15:33

→ gk1329 現代人類腦容量還比古代少的多 01/28 15:34

推 fakelie https://i.imgur.com/cvD4Rcb.jpeg 01/28 15:34

推 super0949 確實好的鏟子才能鏟出好的薯條 01/28 15:34

→ gk1329 光推算力大概就跟一個國家人口一直增加難道就會進 01/28 15:35

→ gk1329 步嗎 01/28 15:35

推 richaad https://i.imgur.com/qdJxe3T.jpeg 01/28 15:35

→ Hina 老黃暴跌冤 ?? 因為事實就證明不需要這麼高階的 01/28 15:36

推 anachronism 算力是後天努力 01/28 15:37

→ anachronism 模型是先天基因 01/28 15:37

→ Hina 你現在問老美幾大AI 看還會想買高階的嗎 01/28 15:37

→ Hina 生意人最重要的一件事成本這是永遠不變的 01/28 15:37

→ Hina 花越少的錢賺越多的錢這就是生意人 01/28 15:38

推 ejnfu 你等之後財報周看軟體巨頭有沒有下調資源支出就知道 01/28 15:38

→ ejnfu 了 01/28 15:38

推 x2159679 AI模型現在根本還沒到賺錢階段吧 01/28 15:38

→ x2159679 AI會被吹那麼大是因為還做一個夢，這個夢還沒實現 01/28 15:39

推 tom77588 工欲善其事必先利其器，硬體還是最重要 01/28 15:39

→ x2159679 AI現在這些東西都只是在做夢過程中的副產物而已 01/28 15:40

→ x2159679 倒不如說如果美國真的更重視和中國的軍備競賽反而會 01/28 15:41

→ x2159679 投入更多資源 01/28 15:41

→ LouisWOLF 把年菜退一退，吃泡麵了 01/28 15:43

→ s860703 晚上就漲回去了 01/28 15:46

→ deathoflove 會啊當然繼續買高階抄不出來是人的問題 01/28 15:46

推 strlen 這邊大概多數人沒做過生意吧？我做一個產品花了一年 01/28 15:51

推 HenryLin123 鏟子就是挖薯條啊 01/28 15:51

→ strlen 時間一百萬成本然後製造一個1000元推出後被對手拿 01/28 15:52

→ strlen 去研究改造他只花一個月十萬元做一個只要100元 01/28 15:52

→ strlen 拓荒者當然花比較多錢不是嗎？DS公佈的600萬訓練成 01/28 15:52

→ strlen 本也是單獨算V3 r1沒公佈前期研發試誤跟設備成本 01/28 15:53

→ strlen 也完全沒公佈大家可以思考一下這些通通都也是可以 01/28 15:53

→ strlen 公佈的為什麼DS只選擇公佈V3訓練成本 01/28 15:54

→ strlen 如果真的要證明我可以降本增效應該是全都公佈吧？ 01/28 15:54

→ strlen 然後呢中國政府還加碼一兆元投資AI 為何要加碼？ 01/28 15:55

推 ohlong 有人分析r1 是post training 這樣就合理了基礎結 01/28 15:55

→ ohlong 構一樣之下pre training 算力一樣得消耗那麼多講 01/28 15:55

→ ohlong 白就濃縮雞湯塊賣你比較便宜不是正常的事 01/28 15:55

→ strlen 照很多人說算力過剩現在不是應該減碼嗎.....？ 01/28 15:55

推 ohlong 看到現在覺得根本不足以影響長期需求反而是要看川 01/28 16:01

→ ohlong 普那個瘋子到底要搞啥毛 01/28 16:01

推 walelile NV B系列重點也擺在推論上，宣傳比上代快15x 01/28 16:01

推 LADKUO56 Deepseek八成是抄的吧怎麼看就華西街要出貨 01/28 16:02

推 NexusPrime 如果DS是拿現有的模型再加以改進訓練，那低成本是 01/28 16:03

→ NexusPrime 合理的，跟從無到有完全不能比 01/28 16:03

推 amazingwow 鏟子還是需要越堆越多就對了 01/28 16:05

→ finhisky 機構出貨會搭配新聞一邊崩一邊出嗎？ 01/28 16:08

推 JaccWu 搞不好也在跌阿川想要加關稅的事啊 01/28 16:11

→ JaccWu 加關稅成本or稅金增加晶片價格上升但毛利沒增加 01/28 16:12

推 deathoflove 大國博弈、巨頭間的賽局拿來跟巷口小吃攤類比ㄏ 01/28 16:19

推 a187 會翻漢堡了嗎 01/28 16:19

推 walelile 人類炸的薯條有比機器好吃嗎? 成本有比機器便宜嗎? 01/28 16:23

推 AirLee 那很好啊不用花錢買nv的卡 01/28 16:26

推 a0808996 OpenAI只想賣鼎泰豐但是ds只是賣幸福餐盒 01/28 16:27

→ a0808996 但是普羅大眾都偏向買幸福餐盒只能說客群不同ㄅ 01/28 16:28

→ a0808996 我覺得在探討的是變現率幸福餐盒能獲利 01/28 16:29

→ a0808996 但是鼎泰豐要賠錢經營 01/28 16:29

→ walelile OpenAI問題是o1訂價太高，4o mini比DS V3 API便宜 01/28 16:30

→ walelile o1定價高一方面可以減少擠壓到人類的工作 01/28 16:32

推 a0808996 ds能靠免費提高普及率再出一個高階版的給人訂閱 01/28 16:33

→ walelile 以DS免費放model+低價，中國會有一票人幹不過AI 01/28 16:33

→ walelile 低階碼農估計能砍一半以上，翻譯砍一半，美工砍一半 01/28 16:34

推 a0808996 成本夠便宜出一個免費的讓你看廣告也能獲利 01/28 16:35

→ a0808996 其他人還要打嗎 01/28 16:35

→ walelile 他都免費放出來了，別人可以直接拿來用 01/28 16:37

→ walelile OpenAI今天遇到的問題，就是明天DS的問題 01/28 16:37

→ walelile 中國還要處理接下來更嚴重的失業問題 01/28 16:37

→ walelile 今天DS省下前段model的成本，別人省整個model的成本 01/28 16:39

→ walelile 一樣開API, 別人可以在殺50%價格 01/28 16:40

推 a0808996 開源的好處就是大家一起優化阿 01/28 16:40

→ a0808996 不能說沒受益阿 01/28 16:40

→ walelile 我是不信有那麼多廠商要找人優化 01/28 16:41

→ walelile 光是他現在放出來的版本就夠強了, 買卡內捲一定發生 01/28 16:41

→ IBIZA 訓練數據集不是用其他AI產生 01/28 16:44

推 a0808996 你這樣說那ds幹嘛要開源真的佛心來做功德的嗎 01/28 16:46

→ IBIZA 訓練數據集主要是來自各種爬蟲專案, 還有各種專業 01/28 16:46

推 grayeric 薯條都沒了日子怎過 01/28 16:47

→ a0808996 就是有好處才會開源 01/28 16:47

→ IBIZA 或非專業的電子書庫、百科全書 01/28 16:47

→ IBIZA 之前V2版時公布的數據集概略資料是說60%程式碼10%數 01/28 16:49

→ IBIZA 學30%自然語言文本 01/28 16:49

→ IBIZA 程式碼的部分來自GitHub跟The Stack Flow 01/28 16:49

→ IBIZA 程式碼的部分來自GitHub跟The Stack Overflow 01/28 16:50

推 KISS1979 台灣又嬴麻了 01/28 16:50

→ invidia 先準備紙箱去公園佔位ㄅ 01/28 16:57

推 qweaaazzz 推推推 01/28 16:59

→ qweaaazzz 今天寒流來公園好冷 01/28 16:59

推 iMANIA https://i.imgur.com/dDAbXMr.jpeg 01/28 17:34

推 cablate 呆灣傻蛙還在臭人家只會賣鏟子，你知道多少應用因 01/28 18:07

→ cablate 為這些鏟子被開發出來改善生活嗎== 這就是AI的未來 01/28 18:07

→ cablate ，未來就是完全取代所有電子數據層面的應用，誰沒 01/28 18:07

→ cablate 有AI就輸 01/28 18:07

推 cablate ds才不是免費餐盒，他只是口糧餅乾，現在大廠免費 01/28 18:09

→ cablate 開放的模型才是免費餐盒的等級，ds成也成本，最終 01/28 18:09

→ cablate 很高機率也是敗在成本（算力） 01/28 18:09

推 cablate 算力過剩問題只是在於目前瘋狂堆疊算力看起來沒有 01/28 18:13

→ cablate 那麼劃世代的亮眼成績，對很多人來說4o甚至4omini 01/28 18:13

→ cablate 就足以解決生活或工作上多數問題，而各個專業領域 01/28 18:13

→ cablate 也有各種開源/便宜模型可以使用，相較之下狂堆算力 01/28 18:13

→ cablate 的o1或o3並沒有真正做到像gpt3與4的那種劇烈差異。 01/28 18:13

→ cablate 順帶一提，開源本來就是這個圈子的文化，開源是有 01/28 18:14

→ cablate 很多好處的，ds的問題很明顯，他們需要盡快豎立一 01/28 18:14

→ cablate 個有影響力的IP，開源就是一個很好的方式。 01/28 18:14

推 sean667cd 推 LD大，昨天瘋狂撿鑽石！ JoJo的不滅鑽石！ 01/28 18:23

→ sean667cd 喔拉喔拉喔拉喔拉喔拉喔拉！ 01/28 18:23

→ huabandd 算力永遠不會嫌多啦 01/28 19:38

→ huabandd 你可以用不到，但廠商不能給不起 01/28 19:39

推 stosto 你用nn不去堆node最好模型夠強…. 01/28 20:32

推 horb 本來就不嫌多了。現在Ai連比大小都不一定每次都對了 01/29 21:14