[新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預

作者Lushen (pttlushen)

標題[新聞] Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預

時間Fri Jan 24 19:13:02 2025

原文標題： Meta陷入恐慌？內部爆料：在瘋狂分析複製DeepSeek，高預算難以解釋原文連結：https://www.jiqizhixin.com/articles/2025-01-24-2 發布時間：2025/01/24 記者署名：機器之心原文內容：「工程師正在瘋狂地分析 DeepSeek，試圖從中複製任何可能的東西。」 DeepSeek 開源大模型的陽謀，切切實實震撼著美國 AI 公司。最先陷入恐慌的，似乎是同樣推崇開源的 Meta。最近，有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到，國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌，因為在前者的低成本高歌猛進下，後者無法解釋自己的超高預算的合理性。原文如下：這一切始於 DeepSeek-V3，它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。工程師們正在瘋狂地分析 DeepSeek，試圖從中複製任何可能的東西。這一點都不誇張。管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高，而我們有好幾十個這樣的「領導」時，他們要如何面對高層？ DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息，但這些很快就會公開。這本來應該是一個以工程為重點的小型組織，但是因為很多人想要參與進來分一杯羹，人為地膨脹了組織的招聘規模，結果每個人都成了輸家。 https://i.imgur.com/hKZ6h5W.png 貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。其中，DeepSeek-V3 在發佈時提到，該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型，並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。不過，更引人注目的是，這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說，它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours，再加上上下文擴展與後訓練的訓練，總共也只有 278.8 H800 GPU Hours。相比之下，Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。 https://i.imgur.com/mJn5POl.png 而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上，它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時，權重同步開源。很多人驚呼，原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為， DeepSeek 現在已經處於領先位置，美國公司可能需要迎頭趕上了。 https://i.imgur.com/NLhp4Nj.png 看到這裡，我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事，他們「開源之光」的地位岌岌可危。有人指出，其實該慌的不只 Meta，OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。「這是一件好事，我們可以即時看到公開競爭對創新的影響。」 https://i.imgur.com/gQ5fHDH.png 還有人擔心起了英偉達的股價，表示「如果 DeeSeek 的創新是真的，那麼 AI 公司是否真的需要那麼多顯示卡？」 https://i.imgur.com/HIFcTx6.png 不過，也有人質疑，DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝？有人回覆說，這可以從他們的發布的技術報告中找到答案。 https://i.imgur.com/HIFcTx6.png 目前，我們還無法確定貼文的真實性。不知道 Meta 後續會如何回應，即將到來的 Llama 4 又會達到怎樣的表現。心得/評論： Meta工程師在TeamBlind(一個匿名的職涯討論區，需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大 DeepSeek R1訓練成本550萬美元可能比一個Meta大頭的年薪還便宜 DeepSeek 這件事情也不光是中國自己在吹噓看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大 DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論 https://i.imgur.com/NLhp4Nj.png DeepSeek R1 開源+論文公開應該會推進一波AI界的發展 DeepSeek 後續發展值得關注一下 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Stock/M.1737717185.A.FD4.html DeepSeek 訓練成本低+跑起來的成本極低(硬體需求) 自己實際使用體感不覺得他贏 OpenAI 不過以成本場景來說真的是巨大的創新美國知名的 AI 分析機構 Artificial Analysis 對 DeepSeek 的成本分析 https://i.imgur.com/0GRkj6Q.png DeepSeek R1 程式碼、論文都開源+公開了 https://github.com/deepseek-ai/DeepSeek-R1 https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf ※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:25:15 網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器) Facebbok、eBay、HP 董事會成員風投 Marc Andreessen 幫你整理了重點 https://i.imgur.com/SmUbN8M.png Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world. DeepSeek 翻譯: https://i.imgur.com/5zX1uf2.png ※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:39:47 ※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:45:10 哥我沒有看到任何所謂Meta工程師沒辦法reproduce的資料來源@@ 可以請你提供一下嗎 AI製造供應鏈台灣應該還是掌握得牢牢的 AI模型目前看起來是真的沒料幾乎都是拿別人的成果fine-tune、扶不上牆這紅媒吧? ※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:32:09 https://i.imgur.com/mJn5POl.png 尷尬他在說Meta用LLAMA 3的訓練成本可以訓練DeepSeek-V3 15次 much better model 這大概國中英文要不是你語言能力有缺陷就是真的很純的中黑是你的英文能力有缺陷。我建議你別搞笑了這真的在扯中黑的腿連國中英文都不會還想在這邊大談還嗆我去讀英文原文中黑搞不好都不承認你是隊友如果你是中黑這會顯得除了無腦黑中國沒有什麽思辨能力=.= 那個英文能力在這邊大談強烈建議看看eriker的推文真的超好笑可以質疑的不過哥你的行為真的相當反智跟中國人民說祖國疫苗No1差不多只是顏色不一樣而已都是避著眼睛只相信自己相信的 ※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:49:43 你公司如果在做AI模型研究/工程的這幾天全公司上下應該都在研究這個 ※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 21:53:14

推文 (1185)

推 pmes9866 中又贏 01/24 19:14

→ agassi001 股價該跌了吧 01/24 19:15

推 wts4832 too good to be true 01/24 19:15

→ moom50302 贏了贏了都贏了 01/24 19:15

推 Plumpy 贏麻了 01/24 19:16

噓 s1612316 花大錢還輸別人是設備的問題還是人的問題 01/24 19:16

推 kenbbc12321 ai本來就可以減少運算，達到一樣的效果 01/24 19:18

推 lpmybig 真實性先打問號 01/24 19:18

→ appledick 美國484真的滿廢的 01/24 19:18

→ appledick 難怪只能靠制裁來贏人了 01/24 19:19

推 lc85301 美國的時代早就過去了 01/24 19:19

推 zhi5566 輸了就在砍人啊 01/24 19:19

推 kuosos520 deepseek有開源，也有offline，鬼故事來了 01/24 19:20

推 aegis43210 因為西台灣為了管制，一堆問題不能回答，自然也不算 01/24 19:20

→ aegis43210 錯誤 01/24 19:20

推 KrisNYC DS就開源的輸了就算了裁部門丟模型 01/24 19:22

→ furbyyeh 硬體需求果然是吹的 01/24 19:22

→ KrisNYC 拿DS去從頭開始而已 01/24 19:22

推 stlinman 降本增效遙遙領先中國人可以贏兩次 01/24 19:22

推 rrazer 中又贏，遙遙領先 01/24 19:22

推 momochacha 沒空阿祖現在忙著舔川普 01/24 19:22

→ KrisNYC 你就當作花錢蓋了個蚊子館又拆掉 GDP增加了就這樣 01/24 19:22

→ KrisNYC 寫一大篇不知道想幹嘛 01/24 19:22

推 Lowpapa 美國早就輸慘了 01/24 19:23

推 godog 看到某族群崩潰狂酸的樣子就覺的好笑哈哈哈 01/24 19:23

推 aegis43210 只要慶豐帝仍在位，美國就不會輸 01/24 19:24

推 iamsosmart 中國贏了，台積電嚇哭了，輝達沒有用了，美國七大 01/24 19:24

→ iamsosmart 科技股都淚奔了 01/24 19:24

推 huabandd 整理重點好嗎 01/24 19:25

推 ImHoluCan 亞洲專門搞詐騙的 01/24 19:26

推 poeoe 中國本來在軟體就算強的還能加班加到爆 01/24 19:26

推 strlen 不就魔改技術很猛？不然當年GPT3怎麼不是中國開發 01/24 19:27

推 winsonpz 看智障聳動標題就知道是中吹假新聞 01/24 19:27

推 zpeople0116 歐美日常，幹輸人翻桌 01/24 19:28

→ winsonpz 然後又一堆壯世代在那瞎講胡吹 01/24 19:29

推 ImHoluCan 美國人很天真，很容易被詐騙，看看小米保時捷，那 01/24 19:29

→ ImHoluCan 真的是保時捷嗎 01/24 19:29

推 spa41260 算力過剩，丸子 01/24 19:29

噓 pagenotfound 上次在那邊吹中國突破5奈米的公司已經屍骨無存了 01/24 19:29

推 matlab1106 又要像電車一樣輸了就翻桌嗎？ 01/24 19:29

噓 ck326 中吹日常，吹了半天強國還在通縮 01/24 19:30

→ ImHoluCan 對岸要是真的，早就大吹特吹 01/24 19:30

→ asjh612 沒有外媒新聞？怎麼只有中國跟twitter來源 01/24 19:30

→ mic73528 遙遙領先雙贏就是中國贏兩次 01/24 19:31

推 Blastodern 彎道超車吹了三十年還在超，這個彎道到底有多長啦 01/24 19:31

→ Blastodern ，笑爛 01/24 19:31

→ idernest https://i.imgur.com/gH3UxJB.jpeg 01/24 19:32

→ ImHoluCan 小米蘇7=美國老邏輯=保時捷怕拉沒拉，但真的擺上台 01/24 19:32

→ ImHoluCan 面真的是保時捷嗎 01/24 19:32

推 Dix123 已經都開源了怎麼還有人反智阿... 01/24 19:33

推 jacktypetlan 完蛋算力過剩 overbooking 台G NV攔腰斬都不夠 01/24 19:33

→ jacktypetlan NV至少1/4膝蓋斬歐印放空台股一萬二見 01/24 19:33

推 kotorichan 美國再挖角或制裁就好 01/24 19:34

推 bella1815 看到某族群自嗨的樣子就覺得好笑 01/24 19:34

推 INIKS 美國創意，中國實作，中美如果真正合作，早就登陸火 01/24 19:34

→ INIKS 星了，可惜國家這個沒用的概念依然存在，地球村遙遙 01/24 19:34

→ INIKS 無期 01/24 19:34

→ ImHoluCan 當初嘴台積電，也大力挖台積電的大將，對啊晶圓廠 01/24 19:34

→ ImHoluCan 可以生產啊，但真的能ㄧ直突破？ 01/24 19:34

推 ck326 開源又怎樣？笑死 01/24 19:35

推 poeoe 開源就是全世界的人都能直接驗證這也不是中國自己 01/24 19:35

→ poeoe 在吹啦 01/24 19:35

推 z23061542 OK收到以放空美台股大力ALL IN鹿谷 01/24 19:35

→ asjh612 開源又怎樣原po也沒覺得他贏openai啊 01/24 19:35

→ ImHoluCan 詐騙集團，當然不能犯低接錯誤，你能看到的當然要 01/24 19:36

→ ImHoluCan 給你看你想看的 01/24 19:36

推 kotorichan 沒三小路用中國直接武統是最有用的 01/24 19:36

→ asjh612 自爽又贏跟開源哪門子關係? 01/24 19:37

→ ImHoluCan 笑死中國要是真的能搞出來，當初中芯肯定能搞出來 01/24 19:37

→ asjh612 每個llm都在吹自己很強實際體驗就是那死樣子 01/24 19:37

→ a12838910 中國軟體很強啊抖音小紅書台灣？ 01/24 19:38

推 andy810306 台灣給那狗屎薪資想要找誰寫軟體？笑死 01/24 19:38

→ aloness 這本來就是在等待程式架構進化，縮減算力 01/24 19:39

推 jasonfun44 老早都去AWSGCP租就好，做LLM跟本不會賺錢 01/24 19:39

→ aloness 舊的程式架構自然需要突破天際的算力 01/24 19:39

推 ImHoluCan 對岸是小米蘇7保時捷，然後吹說你開保時捷嗎？ 01/24 19:39

推 ck326 台灣軟體很爛啊，應該說台灣沒有軟體，所以呢？ 01/24 19:40

推 Dix123 簡單來說 AI的這個嶄新的領域配上開源本來就很容易 01/24 19:40

→ Dix123 做出超強的突破了不一定是中國美國隨時也會趕上 01/24 19:40

→ jasonfun44 馬斯克也是吹 01/24 19:40

推 poeoe 這其實也是好事如果能讓需要的算力降低那能省很多 01/24 19:40

→ poeoe 電 01/24 19:40

→ Dix123 你遙想個人電腦和網路剛開始的時候駭客橫行的時候 01/24 19:40

推 bj45566 股板無腦中黑：不管啦，中國只會抄襲而已而已啦，一 01/24 19:40

→ bj45566 定是偷美國的！原始碼都公開在網上了？不可能！看得 01/24 19:40

→ bj45566 到的人一定是眼睛孽障太重，我什麼都看不到！(嘶喊) 01/24 19:40

→ aloness 中國軟體工程師戰力本來就不差 01/24 19:40

→ Dix123 當你還在用數據機玩天堂的時候可能想過幾年後馬上 01/24 19:41

→ ImHoluCan 對岸很多都是抄美國，卡卡西董嗎？小米蘇7吹成保 01/24 19:41

→ ImHoluCan 時捷 01/24 19:41

→ Dix123 變月租吃到飽? 01/24 19:41

推 ixiuxiudan 別急 01/24 19:41

→ asjh612 怎會熱血親中的人在高潮啊 01/24 19:42

→ ImHoluCan 對岸只會卡卡西，但真的有那個創意與技術？接下來 01/24 19:42

→ ImHoluCan 真的能持續？ 01/24 19:42

推 s90002442 完蛋今天股價砍爛 01/24 19:42

→ kevinmeng2 拿meta這垃圾比較就好像拿intel跟台積電比 01/24 19:42

→ peter98 META再裁個15%工程師吧 01/24 19:44

推 jinx5566 突破AI臨界點了？ 01/24 19:44

噓 raymonde ai 是不是關門放狗 01/24 19:45

→ aaa95308 樓上把軟體跟半導體製造放在一起比較的...好喔 01/24 19:48

推 bj45566 說 Meta 是廢物的好像完全不知道 Meta 在 AI 開源碼 01/24 19:48

→ bj45566 界是抗霸子 wwww 而且 DS 贏的也不只是 Meta Llama 01/24 19:48

推 t0314796 報告所以會影響到什麼？想抄答案！ 01/24 19:48

推 jiansu 這個成果是中國其他公司都震驚吧開源很好科技不 01/24 19:49

→ jiansu 應該分國界競爭也不分你我生死看淡不服就幹 01/24 19:49

噓 ken123321987 美國狗下棋輸人就翻桌等中國強起來一定算帳 01/24 19:49

推 BIGETC 一個專案五千萬能弄五百萬常常也可以科科 01/24 19:50

→ asjh612 不過仔細想想這篇股點是什麼? meta利空? 01/24 19:50

→ BIGETC 不過五千萬弄大家都會很舒服何必真的編五百 01/24 19:50

推 djbell 繼續裁員 01/24 19:51

推 boy1031 鋼鐵家電手機電車都能卷翻，美歐日，憑什麼AI不能 01/24 19:51

→ boy1031 卷，至少也要分走3成市場 01/24 19:51

推 amethystboy 便宜治百病 01/24 19:54

→ asjh612 還是這篇是台積nv利空大家不需要那麼多運算資源? 01/24 19:55

推 super0949 Meta股價毫無反應 01/24 19:55

→ keyneslan 這樣如何對股東與投資機構交代 01/24 19:55

→ CYL009 用低階顯卡AI性能就能和用高階的比了反正美國錢很 01/24 19:55

→ CYL009 多嘻嘻 01/24 19:55

→ pieceioriX 為何高低成本的方案不能共存? 01/24 19:56

推 oldEn15 產能過剩要來了啾咪 01/24 19:56

推 s1612316 五千億鎂有多少會進口袋 01/24 19:56

推 bj45566 DeepSeek 最大的影響就是證明中國能用不到 1/10 的 01/24 19:56

→ bj45566 預算和更少、更便宜低階的 AI 晶片達成甚至超越美 01/24 19:56

→ bj45566 國頂尖 AI 公司(s)狂開資源做出的大語言模型效能 01/24 19:56

推 ggbi4zzz 中國黑開始胡言亂語 01/24 19:56

→ CYL009 現在深度探索全部開源給你誰還要用高價裝備操作AI 01/24 19:57

→ CYL009 嘻嘻 01/24 19:57

→ CYL009 最近這幾天美國科技業真的瘋了一直再找出為什麼可 01/24 19:58

→ CYL009 以這麼便宜成本弄出來ww 01/24 19:58

推 eriker 我怎麼看起來再說deepseek造假 01/24 19:58

推 uller 中國黑科技猛了 01/24 19:58

→ eriker meta試著用h100訓練了15個開源的deepseek結果數據都 01/24 19:59

→ eriker 不如paper宣稱的 01/24 19:59

→ shorty5566 既然都開源了接下來就看能不能照刻出來啊現在吹這 01/24 20:01

→ shorty5566 麼早都不怕跟之前超導體一樣翻車嗎？ 01/24 20:01

→ eriker 這根本就是沒辦法reproduce吧 meta工程師拿你程式碼 01/24 20:01

→ eriker 訓練這麼多次都拿不到你的結果 01/24 20:01

噓 qazwsx0128 笑死，就算成本降低需求只會更多，直到人手一個客 01/24 20:01

→ qazwsx0128 製ai 01/24 20:01

推 dongdong0405 哈哈哈中國進來卷 01/24 20:02

→ eriker 那正常人用更爛的gpu或是deepseek宣稱的h800不是也 01/24 20:03

→ eriker 不辦法訓練出來嗎 01/24 20:03

推 bj45566 拿 AI 比高階晶圓製造的真的笑死！中國在 AI 領域一 01/24 20:03

→ bj45566 直都能和美國爭霸，中國在 AI 頂尖會議的論文發表和 01/24 20:03

推 ck326 看起來是 nvda ,tsm 股價準備崩潰，什麼你說市場沒 01/24 20:03

→ ck326 反應？怎麼會？ 01/24 20:03

→ bj45566 美國一直都是互有領先(之前中國 AI 強在 CV, PR， 01/24 20:03

→ bj45566 美國強在 LLM, NLP -- 但現在看起來美國的強項不太 01/24 20:03

→ bj45566 妙) 01/24 20:03

→ eriker 中國不意外只能騙騙外行人 01/24 20:03

推 kingofsdtw 果然演算法是最重要的 01/24 20:04

推 shorty5566 而且看不懂為啥對nv是利空如果是真的那那些csp用 01/24 20:04

→ shorty5566 現在已有的算力不是更猛需求只會更多吧發展越快 01/24 20:04

→ shorty5566 越好 01/24 20:04

→ eriker 之前就懶得認真看deepseek 結果一看根本在騙白癡 01/24 20:05

→ appledick 這讓我想到智慧型手機android平台一開始的硬體不 01/24 20:06

→ appledick 夠強真的是要靠各家用軟體調效來拼順暢度 01/24 20:06

噓 squeakywheel 就是美國抄襲中國啦某族群最愛嘴的 01/24 20:06

→ appledick 後來硬體強到靠北軟體就不用調效了硬體隨便淦都爆 01/24 20:06

→ appledick 淦順 01/24 20:06

推 bj45566 無腦中黑已經進入催眠自己的最高境界了 wwww wwww 01/24 20:06

推 eriker 中國人應該沒想到這次翻船 meta真的拿他的h100檢查d 01/24 20:08

→ eriker eepseek造假 01/24 20:08

推 ilGroundhog 搜尋一了一下DS在寫作編碼不如GPT但是推理媲美 01/24 20:08

→ asjh612 超越美國製造的llm言之過早吧每個新的出來都說贏 01/24 20:09

推 bj45566 最近 AI 界最大的醜聞反而是 OpenAI o3 涉嫌在數學 01/24 20:09

→ bj45566 能力測驗上作弊喔，嘻嘻 01/24 20:09

→ ilGroundhog 重點是訓練便宜如果大規模訓練確實可能會顛覆AI市場 01/24 20:09

→ eriker 通常中國人ai論文喜歡造假說超越sota 但畢竟沒人會 01/24 20:10

→ eriker 這樣會浪費一堆算力證明造假 01/24 20:10

→ ilGroundhog 如果可以便宜泛用的話對NV就不是好消息 01/24 20:10

→ asjh612 然後講中國ai paper 之前就聽過中國的有些是吹的 01/24 20:10

推 joygo 正在用只能說好用 01/24 20:11

推 koll 那麼厲害何必害怕晶片制裁狂拉貨?用爛晶片就好 01/24 20:11

→ asjh612 講別人無腦黑中自己才無腦親中笑死 01/24 20:11

推 mcgrady12336 未來AI就中美有量能切入啊 01/24 20:11

→ eriker 但這次被meta抓到deepseek造假好慘 01/24 20:12

→ joygo 最近剛好在玩google 的和這隻互相 01/24 20:12

推 andy810306 某樓是不是在酸所有IC設計啊，應該用7奈米就好啊， 01/24 20:12

→ andy810306 一直想推先進製程幹嘛XDDD 01/24 20:12

→ JoeyChen 歸結是成本的問題對吧? 01/24 20:13

→ andy810306 是不是廢到只能靠製程來掩蓋廢物設計能力啊 01/24 20:13

→ eriker 不過我猜之後這種文會繼續洗反正普通人也不懂ai 01/24 20:13

→ b9513227 你們慢慢吵哥買tsm nv等看戲 01/24 20:13

推 bj45566 科技界名人包括 UC Berkeley 的 AI 教授都幫 DeepSe 01/24 20:13

→ bj45566 ek 背書說它是 AI 的 "breakthrough" 了，股板鍵盤 01/24 20:13

→ bj45566 俠覺得自己比那些專家還懂 wwww wwww 01/24 20:13

推 s213092921 Deepseek用閹割版H800就能做到， 01/24 20:13

推 shiowshay 真的超強，只是不知道為什麼他無法回答我1989年6月4 01/24 20:14

→ shiowshay 日有什麼歷史事件 01/24 20:14

→ asjh612 nlp更好吹sota 反正自製dataset 別人亂做自己認真 01/24 20:14

推 asdf70114 終於要遙遙領先了 01/24 20:14

→ appledick 中黑病發作 01/24 20:14

推 SunRoy 英偉達的股價下跌我就信 01/24 20:14

推 joygo 谷歌的很爛問股票問題不敢回答 chatgpt比較大膽 01/24 20:14

→ appledick 哥布林不要只會網上酸拿出東西比較有意義 01/24 20:15

→ eriker 怎麼不敢回答meta訓練15次開源的deepseek結果數據 01/24 20:15

→ eriker 不如paper宣稱的？ 01/24 20:15

推 sid3 有競爭是好事今年韓媒也有新聞 01/24 20:15

→ asjh612 教授也會被騙啊笑死以為教授多懂早就沒在做實驗 01/24 20:16

→ b9513227 我快笑死問中國最新jdk版本是啥跟我說17 01/24 20:16

→ eriker 這不是造假不然是什麼 01/24 20:16

→ asjh612 是不是沒讀過研究所阿還吹教授 01/24 20:17

推 Gipmydanger 中國贏麻了，只好加大禁令了 01/24 20:17

推 s213092921 http://i.imgur.com/CYexcbJ.jpg 01/24 20:17

推 ilGroundhog 對台積應該沒很大的影響就算少了輝達的訂單還有其他 01/24 20:18

推 bj45566 是啦，中國發表在 AI 論文都是吹的、假的！要隨論 01/24 20:18

→ bj45566 文附上的原始碼也都是假的！那些全世界 AI 專家組 01/24 20:18

→ bj45566 成的審稿 TPC 都是一群白癡廢物，怎麼可能比股板鍵 01/24 20:18

→ bj45566 盤俠更懂 AI 是吧？ wwww 01/24 20:18

→ eriker 還是meta工程師都廢物有一堆h100 還訓練不好deepse 01/24 20:18

→ eriker ek 01/24 20:18

推 andy810306 某樓自己能力差讀水貨研究所找廢物教授，以為美國 01/24 20:19

→ andy810306 教授跟你教授一樣廢，●●比雞腿，真的笑死 01/24 20:19

推 tomatobus 教授審論文不會去嘗試reproduce吧，除非他叫底下的 01/24 20:20

→ tomatobus 博士生去試 01/24 20:20

推 sa87a16 12億人口免費的運算怎麼輸 01/24 20:20

推 ilGroundhog DS的初始模型是META的模型只是變得更有效率 01/24 20:20

推 bj45566 反正股板的無腦中黑覺得自己比所有業界、學界的知名 01/24 20:21

→ bj45566 專家都還要懂 AI wwww wwww 01/24 20:21

推 eriker 更好笑的是pytorch就meta的開源還要比三小 01/24 20:21

→ tomatobus 如果meta工程師無法reproduce，那可能真的有什麼貓 01/24 20:21

→ tomatobus 膩。企業一定是最緊張的 01/24 20:21

→ asjh612 笑死開始嘴別人教授喔實際上就是這樣啦國外也是 01/24 20:21

→ asjh612 AI paper一堆真的沒人有空一篇一篇跟你對 01/24 20:22

推 s213092921 https://news.cnyes.com/news/id/5816770 人家早就 01/24 20:23

→ s213092921 預言了 01/24 20:23

推 bj45566 頂尖會議那些學界業界最知名的專家的審稿委員當然會 01/24 20:24

→ bj45566 試跑隨論文附上的原始碼啊 -- 萬一原始碼有錯只有你 01/24 20:24

→ bj45566 抓不出來，你直接名聲掃地好嗎 01/24 20:24

推 ilGroundhog 如果成功還是需要訓練模型只是算力降低很多 01/24 20:24

→ s213092921 2千多塊閹割版的H800只要訓練兩個月就超越Meta chat 01/24 20:24

→ s213092921 GPT，美國可憐啊 01/24 20:24

推 eriker 中國在paper也喜歡造假硬體明明用h100還說自己用h8 01/24 20:25

→ eriker 00或是3080 01/24 20:25

推 bj45566 美國一流大學教授就算是五六十歲都還在自己做研究、 01/24 20:26

→ bj45566 寫程式，井底之蛙覺得自己比 UC Berkeley 教授還厲 01/24 20:26

→ bj45566 害，哈哈哈哈 01/24 20:26

推 lepidoptera 便宜很好啊大家股價修正一下重新開始 01/24 20:27

推 ntr203 nv有什麼好怕的，越強的晶片不就代表可能做出越強 01/24 20:27

→ ntr203 的ai 01/24 20:27

→ appledick 反觀台灣在AI運算這一塊484完全沒了 01/24 20:28

→ appledick NV沒啥好怕啊軟體寫的好跟硬體強又不抵觸 01/24 20:28

→ shorty5566 真的看不太懂對nv利空在哪用現在最強的nv去算不 01/24 20:29

→ shorty5566 是更好更令人興奮嗎而且入門門檻降低對整個ai發展 01/24 20:29

→ shorty5566 都是好事集中在幾個大型csp才不好 01/24 20:29

推 s213092921 https://reurl.cc/G5O0Nd 內文提到Deepseek使用閹割 01/24 20:29

→ s213092921 版的H800顯卡，中黑趕快面對現實吧 01/24 20:29

→ s213092921 http://i.imgur.com/u8wpYYZ.jpg 01/24 20:30

推 lon0623 台灣人力有限，與其發展AI運算，倒不如找應用端 01/24 20:30

推 bj45566 無腦中黑已經無所不用其極在催眠自己一切都是假的 w 01/24 20:30

→ bj45566 www pathetic SORE losers !!! 01/24 20:30

→ appledick 中國一堆都是去拿Mac mini來跑meta的模型便宜又可 01/24 20:31

→ appledick 以玩 01/24 20:31

推 h0103661 這完全開源，是假的早就被抓了吧 01/24 20:31

→ s213092921 中國用2048張閹割版H800顯卡訓練兩個月就能超車Meta 01/24 20:31

→ s213092921 及GPT，誰要花大錢買一堆NV最新顯卡？ 01/24 20:31

→ lon0623 不覺得台灣的做法有什麼錯誤，又不是有上億人口 01/24 20:31

→ h0103661 還是要先跟研究生解釋什麼叫開源 01/24 20:31

推 eriker 你這篇的Lisan al …他說的就是這個意思 01/24 20:32

→ shorty5566 反過來說你用nv最強的顯卡去跑不是能進步得更快嗎 01/24 20:32

→ shorty5566 ？還是你覺得ai的發展已經到盡頭了？ 01/24 20:32

→ eriker 他不是說meta訓練了15次deepseek v3結果還是比他們 01/24 20:33

→ eriker 宣稱的差嗎 01/24 20:33

噓 ggian123 Don’t look up 大陸人還生活在水深火熱 01/24 20:33

→ shorty5566 挫勒蛋的絕對是那些開發模型的公司吧 01/24 20:33

推 lon0623 你覺得你想得到的NV想不到嗎? 01/24 20:33

→ lon0623 NV有他厲害的地方，不是只有算力 01/24 20:34

推 chanceiam 連繁體中文都不能回答的模型 01/24 20:34

→ eriker 所以meta驗證了deepseek放出來的程式碼跟模型發現 01/24 20:34

→ eriker 他們造假 01/24 20:34

→ eriker …. 建議你看英文 01/24 20:34

→ jjjj222 高鐵, 六代機, 核融合, LLM, 每天吹, 吹完就沒了 01/24 20:35

推 scitamehtam deepseek我有用，真的蠻好用的 01/24 20:35

→ shorty5566 開發模型的公司即將進入紅海倒是nv只怕大家都改用 01/24 20:35

→ shorty5566 asic，但是門檻降低以後小型玩家可以進場，那些小 01/24 20:35

→ shorty5566 型玩家也沒能力調教asic 還是要跟nv買通用gpu 01/24 20:35

→ jjjj222 功能也就是騙騙白痴.. 特別是中國白痴 01/24 20:36

推 ilw4e 就跟當初阿法狗一樣啊，deepmind搞出來後面一堆圍 01/24 20:36

→ ilw4e 棋AI小模型一下全出來了。純軟體你只是靠暴力解算力 01/24 20:36

→ ilw4e 堆，人家自然有優化後的更好解法，沒看openai也在回 01/24 20:36

→ ilw4e 頭做優化跟即時的深度運算 01/24 20:36

→ scitamehtam 我兩種都下載，都有用，後來都用deepseek 01/24 20:36

推 eriker 開始抹中黑了？ 01/24 20:38

推 kotorichan 他能改用中芯晶片訓練更好 01/24 20:38

推 tsubasawolfy 不然老黃幹嘛賣那台掌中型的AI機 01/24 20:39

→ CLinna 國人捲出來的AI要打倒喝下午茶的工程師了嗎 01/24 20:39

推 poeoe 那個英文很明顯在說15倍啦…… 01/24 20:39

推 s0920151048 這不能說中國好話 01/24 20:39

推 s213092921 http://i.imgur.com/4XDm3xB.jpg 01/24 20:39

推 eriker 造假就造假還在那護航 01/24 20:40

推 ilw4e 好像很多人誤以為AI是哪家先搞出AGI就贏了，現實是 01/24 20:40

→ ilw4e 就算搞出以後所有人知道該怎麼做很快就會用自己的 01/24 20:40

→ ilw4e 方法一樣能跟上，效率更好成本更低 01/24 20:40

→ tsubasawolfy 另外推特翻譯那個GOOGLE翻得沒錯 01/24 20:40

→ shorty5566 他訓練還是要基於nv的gpu 用中芯的怎麼訓練 01/24 20:40

推 tomatobus 笑了，原來尼的出處是那，還以為尼有什麼meta內部的 01/24 20:40

→ tomatobus 消息 01/24 20:40

→ tsubasawolfy 我覺得這比較像吹很久的edge AI踏出第一步 01/24 20:41

→ s213092921 http://i.imgur.com/1rLNqD2.jpg 01/24 20:41

→ eriker 那你抹中黑是怎麼回事？ 01/24 20:41

→ appledick 好啦假的啦造假啦中黑贏了可以吧 01/24 20:41

→ eriker 這樣是ok的我都在講deepseek 01/24 20:42

推 bj45566 無腦中黑在眾人面前證實了自己連簡單的英文都看不 01/24 20:42

→ bj45566 懂胡扯亂翻譯，嘻嘻 wwww wwww 01/24 20:42

推 poeoe Meta訓練的預算拿來訓練Deepseek 都至少能訓練15次 01/24 20:42

→ poeoe 了 01/24 20:42

→ tonyshan 簡體的可以SKIP了 01/24 20:42

推 good5755 關鍵字:開源程式碼 01/24 20:42

→ appledick meta 484太多冗員了啊 01/24 20:43

推 Fegnzi 那些反智的人看不懂開源是什麼沒辦法，逢中就反真的 01/24 20:43

→ Fegnzi 沒救 01/24 20:43

→ eriker 所以質疑deepseek造假就是中黑？ 01/24 20:43

噓 distantblc 急了 01/24 20:44

→ eriker 只會做人身攻擊 01/24 20:44

推 scitamehtam 質疑？不是不行吧，要合邏輯… 01/24 20:44

→ eriker 你在繼續 01/24 20:44

→ scitamehtam 不然不就變成抹屎？ 01/24 20:45

推 littenVenus 這次中國真的會贏2次喔 01/24 20:45

→ appledick deepseek如果不是中國研究我覺得你應該就不會質疑了 01/24 20:45

→ VicLien 中國的天賦點在紅海化厲害了 01/24 20:45

推 bj45566 胡扯亂翻譯人家公開的英文說明(而且是用很簡單的英 01/24 20:46

→ bj45566 文)說是無腦都還太客氣了好嗎？ wwww wwww 01/24 20:46

→ appledick 中國某些地方真的就是強啊當然某些地方是不敢恭維 01/24 20:46

→ scitamehtam 先玩過再說..，我兩套都玩過，deepseek真的不錯 01/24 20:46

→ eriker 如果deepseek不是中國的還會這樣罵人嗎？ 01/24 20:46

→ scitamehtam 小心釣魚，看他自己表演就好，建議啦 01/24 20:47

→ scitamehtam 沒邏輯的講話最大聲 01/24 20:47

→ eriker 我沒差反正我不會罵人我只評論deepseek 01/24 20:48

→ scitamehtam 最近這版衛兵執勤很認真，桶了幾波了，自己小心 01/24 20:48

推 epephanylo (看戲 01/24 20:48

→ eriker 反倒是某些人小心 01/24 20:48

推 bj45566 評論？胡亂翻譯人家的英文也敢叫做評論？笑死人有 01/24 20:49

→ bj45566 夠好笑 wwwww 01/24 20:49

噓 Kazetachinu 一堆ai大老都中國人哪天超車都不意外軟體這種東西 01/24 20:50

→ Kazetachinu 限制沒有硬體這麼多 01/24 20:50

→ asjh612 不過這篇推文這麼火熱沒半個人貼實例對話XDD 01/24 20:50

→ brella 垃圾新聞 01/24 20:50

→ asjh612 之前gpt在紅的時候還有gpt幫忙回應的截圖 01/24 20:50

→ asjh612 覺得好的可不可以務實點去玩幾個例子貼來看看 01/24 20:51

推 yueayase 大驚小怪，這種前沿的技術，本來就是湖鄉合作，及互 01/24 20:51

→ yueayase 相競爭的 01/24 20:51

→ asjh612 讓我見識見識哪些是你們覺得好哪些是回應差的 01/24 20:51

推 scitamehtam https://i.imgur.com/22NxkZC.png 01/24 20:51

推 duriamon deepseek有手機app啊！自己下載來用用看不就知道了 01/24 20:52

→ duriamon ？用email就可以註冊了。 01/24 20:52

→ yueayase 湖鄉=>互相 01/24 20:52

→ scitamehtam 剛好今天才在用.. 01/24 20:52

→ scitamehtam 反倒是批評的？…. 01/24 20:52

→ holebro 中國軟體強度上下限差很大遇過一堆中國客戶連用AI 01/24 20:53

→ holebro 幫忙寫sql寫shell script寫yaml都不會= = 01/24 20:53

→ scitamehtam 我兩套都常用啦，我自己112csie，也有研究ai主題 01/24 20:53

推 kakiandkaka 笑翻，被反向 01/24 20:53

→ duriamon 樓上可以要他用正體中文回答。 01/24 20:53

推 s213092921 http://i.imgur.com/wsl43l7.jpg 01/24 20:53

→ s213092921 http://i.imgur.com/DUAvbcI.jpg 01/24 20:53

→ scitamehtam 倒是爬蟲後，發現一堆嘴的頭頭是道，結果背景令人 01/24 20:53

→ scitamehtam 驚訝XDDD 01/24 20:53

推 ezreal1315 這就是第一個開頭的和跟班的差距啊第一個一定要砸 01/24 20:54

→ ezreal1315 大錢開發後面的當然可以降低成本 01/24 20:54

→ asjh612 就是不想註冊阿... 試想會黑的怎會想用 01/24 20:54

→ scitamehtam 沒用過說的好像很熟一樣XDD 實事求是XDD 01/24 20:55

→ ezreal1315 哪個行業不是這樣開拓者都是要付出最多的 01/24 20:55

推 s213092921 問題是開拓者能否一直保持領先優勢，看看Nokia跟Mot 01/24 20:56

→ scitamehtam 所以我說，爬蟲後的心得，就是推文自己小心，最近審 01/24 20:56

→ scitamehtam 查異己言論很勤勞的 01/24 20:56

→ s213092921 o蘿拉的下場 01/24 20:56

→ asjh612 http://i.imgur.com/LdGLuCI.jpg 看起來也有回答到? 01/24 20:56

推 NCUking DeepSeek是猛在CP值超級高 01/24 20:56

推 TIPPK 台灣軟體公司好少 01/24 20:56

推 bj45566 連註冊都沒有就拼命在黑？ wwww 人家台大資工親自 01/24 20:57

→ bj45566 試用還截圖給你耶 01/24 20:57

→ NCUking OpenAI 目前還是領頭羊沒問題 01/24 20:57

噓 zebra101 笑死，人家明明在說META用了15倍的預算，更好的GPU 01/24 20:57

推 guanting886 我覺得一般用戶蠻鼓勵開發團隊都跳進甕被練蠱 01/24 20:57

→ zebra101 ，卻訓練出了比DS更差的模型，英文到底怎麼讀的，co 01/24 20:57

→ zebra101 uld have看不懂嗎？ 01/24 20:57

→ NCUking 台灣搞LLM只能玩微調套皮 01/24 20:57

推 ezreal1315 所以說買大盤真安心啊 20年前市值前10公司跟現在 01/24 20:57

→ ezreal1315 比已經大洗盤 01/24 20:57

→ deangogi 所以上面eriker說的meta復現準確度有原文嗎? 01/24 20:58

推 scitamehtam 我平常兩個都在玩啊，我沒說chatgpt不好吧？ 01/24 20:58

推 duriamon AI領域大陸那邊跟美國的差距本來就不大，有在關心AI 01/24 20:58

→ duriamon 相關研究的大概都知道在說什麼，尤其中文大語言模型 01/24 20:58

→ duriamon 就唯一只有大陸那邊的能打，反觀台灣研發的真的很爛 01/24 20:58

→ duriamon ，呵呵！ 01/24 20:58

推 eriker 沒有嘻嘻 01/24 20:58

推 symeng 暫時觀望 01/24 20:59

→ asjh612 你問他llm吹很厲害的有多少在搞啊誰有空每個都試 01/24 20:59

推 ezreal1315 我覺得不用太緊張啦人家用H800真的能超越openai 01/24 20:59

→ deangogi 你說的如果是原po貼的那段翻譯應該是你翻譯的問題 01/24 20:59

→ ezreal1315 我相信股價早就被灌下來灌爛了那些大戶一定第一 01/24 20:59

→ ezreal1315 個跑的 01/24 20:59

噓 zebra101 那個eriker連最基本的英文都讀不懂 01/24 20:59

推 aac219oo 我看有很多人都不知道自己用的網站是用vue3寫的 01/24 20:59

推 w300204 costdown誰的比得過華人 01/24 21:00

推 NCUking 中國軟體實力本來就是天下第二了 01/24 21:00

推 abc21086999 https://i.imgur.com/fo3jbRR.png 01/24 21:00

→ abc21086999 中國特色社會主義式的AI 01/24 21:00

→ ezreal1315 或者是就算如此巨頭也不會降低支出怕被同行超越 01/24 21:01

推 Samurai 先不說是不是真的，但逢中必反那個鳥樣，酸別人砸 01/24 21:01

→ Samurai 錢研發有夠莫名其妙 01/24 21:01

→ asjh612 copilot claude gemini gpt llmam 每個新出的都sota 01/24 21:01

推 duriamon 還有人以為是costdown啊？不虧是台灣代工老舊代工思 01/24 21:01

→ duriamon 維，那些發展AI的人才經費花費成本真算下來哪裡cost 01/24 21:01

→ duriamon down了？ 01/24 21:01

→ abc21086999 Gemini thinking 答的就沒問題 01/24 21:02

→ abc21086999 https://i.imgur.com/bQT9dQz.png 01/24 21:02

噓 gstym 中國晶片都可以去買別人的晶片來磨改名字了== 01/24 21:02

推 scitamehtam 說真的chatgpt也能回答這題XDD 01/24 21:02

→ asjh612 搞不懂別人的問題點還在以為我在黑中國 01/24 21:03

→ duriamon 台灣的老問題上次已經講過了，目前全世界先進的未來 01/24 21:03

→ duriamon 科技領域除了「我們有台積電」之外每一個能打的。 01/24 21:03

→ scitamehtam 但好笑的是，拿這題當評斷AI的標準XDD 01/24 21:03

→ asjh612 問題是現在每個llm都吹自己最強當我是llm測試員哦 01/24 21:03

→ scitamehtam 很顯然不是理工人吧XD 01/24 21:03

→ Mytsb2421 美國變成copy cat 01/24 21:04

推 iaminnocent deepseek不採用預標數據集（也就是先由人類標記數 01/24 21:04

→ iaminnocent 據再給模型訓練）而是直接採用強化學習，自己訓練 01/24 21:04

→ iaminnocent 自己，並且透過他們的局部Token啟動機制，可以減少 01/24 21:04

→ iaminnocent 使用量，這也是為什麼Deepseek能夠大幅降低訓練成 01/24 21:04

→ iaminnocent 本的原因，不確定OpenAi 或是其他AI模型，為什麼沒 01/24 21:04

→ iaminnocent 有進行強化學習 01/24 21:04

→ scitamehtam 所以才說，爬蟲後，再看一次推文會很有趣啊XD 另， 01/24 21:04

→ scitamehtam 你知道ptt主機放哪？XD 01/24 21:04

推 Samurai 意識形態死腦筋沒救，拿六四事件當評斷AI標準XD 01/24 21:04

推 bella1815 https://i.imgur.com/0e69P5N.jpeg 01/24 21:05

推 s213092921 因為美國只相信大力出奇蹟那套，砸錢砸算力 01/24 21:05

推 Lenney33 成本更低美國科技巨頭情何以堪 01/24 21:05

→ iaminnocent 但是這確實是對AI界投下震撼彈吧，不過OpenAI改用 01/24 21:05

→ iaminnocent 自主強化學習，不知道是否可以 01/24 21:05

噓 abc21086999 理工人又在打手槍自慰啊 01/24 21:06

→ abc21086999 會審查訊息的AI就算在某方面超越其他人也是不可能 01/24 21:06

→ abc21086999 普吉的 01/24 21:06

→ abc21086999 *普及 01/24 21:06

推 tw77769 阿姨的機會來了 01/24 21:06

→ iaminnocent DEEPSEEK 的數據集也許確實有部份來自ChatGPT，但 01/24 21:07

→ iaminnocent 這並不影響他確實是一個蠻厲害的模型 01/24 21:07

推 bj45566 又有人硬要扯到晶片了。公開的論文告訴你實驗環境、 01/24 21:07

→ bj45566 算法流程、效能評比；原始碼放在大家都可以下載的 G 01/24 21:07

→ bj45566 itHub 上，這要怎麼作弊？？？ 01/24 21:07

推 scitamehtam 就事論事，如果你說會不會普及，那就另外一題了， 01/24 21:07

→ scitamehtam 請另闢蹊徑吧 01/24 21:07

推 a558815 Deepseek 是真的有些東西啊 01/24 21:07

推 tsubasawolfy OPENAI的O3就是RL壓聖誕節前的13天倒數也有RL出現 01/24 21:08

→ tsubasawolfy O3就是O1 RL來的省去訓練成本 01/24 21:08

推 ggbi4zzz 美國人都害怕被中國ai超越，還有中國黑認為是在吹 01/24 21:09

→ ggbi4zzz 牛逼而已 01/24 21:09

推 minazukimaya 還好它開源同樣的演算法創新讓資源更多的美國科技 01/24 21:09

→ minazukimaya 巨頭來用以他們握有的訓練資源能產出更驚人的結果 01/24 21:09

推 s213092921 http://i.imgur.com/vaz7qmE.jpg 誰抄誰啊嘻嘻 01/24 21:10

→ eett811025 碼農996用肝跟你拼了 01/24 21:10

推 bread1110 這鯨魚真的邪門花少少的預算幹大事 meta最好撐住啊 01/24 21:11

推 minazukimaya 但感覺AGI和技術奇點的時間又被提前了....... 01/24 21:11

→ s213092921 中國AI公司因為算力受限，只好動腦另闢蹊徑，走出一 01/24 21:11

→ s213092921 片天，高階晶片也是一樣的道理 01/24 21:11

噓 qazwsx0128 夠便宜我就自己訓練一個 01/24 21:11

→ minazukimaya 這才是最恐怖的吧感覺2030年前就要奇點了 01/24 21:11

推 iaminnocent 那就對啦O3開始用RL的話，大概又會反超吧 01/24 21:12

→ fywei 真的好恐慌 zzz 嚇死人只好再睡一下 01/24 21:12

推 nfsong 開源的只能導入 01/24 21:12

噓 ishdtt598 跟文組講那麼多幹嘛笑死 01/24 21:12

→ nfsong 論文都出了 01/24 21:12

推 eliteark 繼續吹起來我要看到血流成河 01/24 21:13

推 LBJshit 傻鳥真的很傻很北七一直那邊說DS造假我還以為是真 01/24 21:13

→ LBJshit 的有什麼內幕勒。結果他媽的是英文太爛根本自己完全 01/24 21:13

→ nfsong 跟股票一樣有錢人不會輸 01/24 21:13

→ LBJshit 搞錯連下面有中文的正確翻譯也不看 01/24 21:13

→ nfsong 導入以後 3000e 的就更猛 01/24 21:13

推 cay86714 AI究極鬼故事！ 01/24 21:14

→ nfsong 550萬就這麼猛 3000e的 6倍猛 01/24 21:14

推 iaminnocent 那個貼文確實是說Meta的訓練費用都可以訓練15次Dee 01/24 21:14

→ iaminnocent pseek了 01/24 21:14

→ shorty5566 傻鳥真的北七前幾天還看到黃仁勳去中國就瘋狂崩潰 01/24 21:14

→ shorty5566 的 01/24 21:14

推 duriamon OpenAI的問題是核心科學家走了 01/24 21:14

→ gn7722 就跟現在的預算一樣 01/24 21:15

→ iaminnocent O3我記得之前altman有貼出他的比較，好像比O1強不 01/24 21:15

→ iaminnocent 少，但是當然費用很貴，如果OpenAi把這個開源的機 01/24 21:15

→ iaminnocent 制拿來用不知道行不行 01/24 21:15

→ cay86714 如果這是真的那麼那些CSP之後的資本支出根本不用那 01/24 21:16

→ cay86714 麼高嘻嘻 01/24 21:16

推 g27834618 訓練費降低是利多啊趕緊出殺手級應用才是正軌 01/24 21:16

推 littenVenus 老黃484蛋雕惹QQ 01/24 21:17

推 duriamon 訓練費代表所需的時間成本、算力跟電費等，自己想想 01/24 21:17

→ duriamon 看囉！ 01/24 21:17

→ littenVenus 電力需求應該也不用那麼多吧 01/24 21:17

→ cay86714 不過這件事沒多久前國內投資圈就有一些人知道了， 01/24 21:18

→ cay86714 就看市場什麼時候反應了嘻嘻 01/24 21:18

→ iaminnocent OpenAI比較像是他有很多資訊，當你詢問他時，他會 01/24 21:18

→ iaminnocent 依據他的知識庫中去找尋資料，並且給你。DEEPSEEK 01/24 21:18

→ iaminnocent 則是有很多專門的朋友，會依據問的問題，分配給適 01/24 21:18

→ iaminnocent 合的專門朋友去找資料回答（也就是不會全部Token調 01/24 21:18

→ iaminnocent 動，可以減少Token使用量） 01/24 21:18

推 beesee 訓練方式很華人 01/24 21:19

→ littenVenus 窩是上禮拜看節目聽一個物理學博士在分析 01/24 21:20

推 Samurai 老黃沒差吧，算力永遠不夠，相同算力能做的事情更 01/24 21:20

→ Samurai 多了，加速科技發展，是軟體公司要頭痛了，拼肝拼 01/24 21:20

→ Samurai 軟體效率拼不過華人 01/24 21:20

推 s213092921 國外有大神用兩台M3晶片的蘋果電腦搭載運行Deepseek 01/24 21:20

→ s213092921 邏輯模型XDD 01/24 21:20

推 usereminem 一堆人仇中仇到腦子壞掉了可悲 01/24 21:20

推 yusanhu 厲害 01/24 21:21

→ littenVenus DS是分區塊各領域專門訓練 01/24 21:21

推 duriamon 沒錯，deepseek是MoA架構。 01/24 21:22

推 minazukimaya 演算法創新會反過來創造出新的算力需求啊因為對智 01/24 21:22

→ minazukimaya 能的追求沒有上限更高效的演算法=更快到奇點 01/24 21:23

噓 tw19930419 一堆低能中黑看了就好笑 01/24 21:23

推 ilw4e 哈哈黑黑不知道一堆模型都會說他是chatgpt，因為監 01/24 21:24

→ ilw4e 督學習步驟最多人用的就是拿chatgpt當那個監督模型 01/24 21:24

推 s213092921 https://b23.tv/R7tEm3q 01/24 21:24

噓 cosmite 剛問了美國地47屆總統是誰，連這個都答不出來，資 01/24 21:24

→ cosmite 料庫還停在2023（模型為DeepSeekV3） 01/24 21:24

→ cosmite https://i.imgur.com/XXmbi1v.jpeg 01/24 21:24

推 bj45566 OpenAI o3 是非開源碼啊，而且最近被揭露它表現最 01/24 21:24

→ bj45566 驚人的 FrontierMath 指標有作弊的嫌疑！相關的英 01/24 21:24

→ bj45566 文報導和討論不少，這裏給一個實例！ 01/24 21:24

→ bj45566 https://tinyurl.com/yw55fcwk 01/24 21:24

→ cosmite ChatGPT-4則沒有問題 01/24 21:25

→ cosmite https://i.imgur.com/oGA0Blp.jpeg 01/24 21:25

推 fattyeddie 連ai都能卷了不起我的國 01/24 21:26

→ bj45566 P.S. 那隻看不懂國中等級英文的中黑歡迎繼續跳出來 01/24 21:26

→ bj45566 吶喊丟人現世 wwww wwww 01/24 21:26

→ duriamon 因為deepseek不用運轉那麼多參數來產生回答，而Open 01/24 21:26

→ duriamon AI的必須要，所以以電力消耗、算力消耗跟微型化來說 01/24 21:26

→ duriamon 都不利，但也不是代表這樣不好。我是覺得OpenAI自從 01/24 21:26

→ duriamon 變成Altman的玩物之後，進步幅度有限，反而吹噓成分 01/24 21:26

→ duriamon 增加了，呵呵！ 01/24 21:26

推 minazukimaya DeepSeek有價值的地方不是它自身模型有多強.. 01/24 21:26

→ minazukimaya 而是他提出的創新可以被其他有更大訓練集和更多算力 01/24 21:27

推 KOKEY 差別在喝的茶葉或咖啡比較貴啦 01/24 21:27

→ minazukimaya 的公司複用 01/24 21:27

→ duriamon 強的是訓練的方式，裡面的秘密我相信應該沒有開源， 01/24 21:27

→ duriamon 呵呵！ 01/24 21:27

推 bj45566 現在面臨作弊醜聞的反而是美國 & 世界最強的非開源 01/24 21:28

→ bj45566 碼 OpenAI o3 01/24 21:28

推 DCapple 又贏了又贏了，中国贏兩次 01/24 21:28

推 tw19930419 那叫做他沒有使用網路不是他不會問這種沒鑑別度的 01/24 21:28

→ tw19930419 蠢問題要證明什麼 01/24 21:28

推 Samurai 不要再搞笑了，他的資料庫到2023年根本就不是什麼 01/24 21:29

→ Samurai 缺陷，只差在有沒有網路搜尋最新資訊而已 01/24 21:29

推 minazukimaya DeepSeek很公開啊演算法和工程改進都寫在論文裡 01/24 21:29

推 littenVenus 那個博士認為因為成本優勢注定美國以外地區會傾 01/24 21:29

→ littenVenus 向DS 所以DS將是最後贏家 01/24 21:29

→ minazukimaya 真的是還好它夠公開 01/24 21:30

推 raygod 加大制裁 01/24 21:30

→ minazukimaya 不過它也是站在一堆前輩肩上現在給人站肩膀這就是 01/24 21:30

推 Samurai 意外的是DS竟然這麼大方公開研究方法 01/24 21:30

→ minazukimaya 科學研究啊 01/24 21:30

推 runacat 論文都出來了 01/24 21:31

推 QuuEgg 哇啊，削價競爭欸 01/24 21:32

推 bj45566 DeepSeek 如果在演算流程上沒有開創性的突破，美國 01/24 21:33

→ bj45566 業界大老絕對不會用 "breakthrough" 來形容啦，這 01/24 21:33

→ bj45566 個字義和 "cost down" 或 "內卷" 相差十萬八千里 - 01/24 21:33

→ bj45566 - 而且 " cost down" 是標準的台式英文 01/24 21:33

推 wchang 好到不可思議的好，就是假的 01/24 21:33

→ wchang 跟運動員吃禁藥一樣，不是apple 對apple 01/24 21:33

推 Mosskappa Buy the rumor 01/24 21:34

推 tpkgo 讓子彈飛一會兒~~~~ 01/24 21:34

推 minazukimaya 令人恐懼的反而是模型的效率一日千里對齊的研究牛 01/24 21:35

→ minazukimaya 步慢行... 01/24 21:35

→ minazukimaya 根本是直通文明毀滅的最短路線XD 01/24 21:36

→ tonyshan 看起來就改進一個東西就吹到天上去 01/24 21:36

→ minazukimaya DeepSeek把人類文明的毀滅倒數時鐘又撥快了一格 01/24 21:36

推 tompi DS API的費用是 o1 的1/30 01/24 21:37

→ minazukimaya DeepSeek可不止改進一個東西論文都有白話技術文也 01/24 21:37

推 tsubasawolfy 不用擔心OPENAI 那個瘋子一心只想要真的AGI 就跟馬 01/24 21:37

推 bj45566 樓上是在說 OpenAI 的 FrontierMath benchmark 嗎？ 01/24 21:38

→ bj45566 好到不可思議結果... 01/24 21:38

推 duriamon 沒辦法，讓AI對齊人類的道德沒辦法賺錢，呵呵！ 01/24 21:38

推 mamorui 這個應該不怎樣吧去年看太多篇宣稱更頂驗證一下 01/24 21:38

推 tpkgo 中國很會利用別人的研究偷雞先聽聽就好 01/24 21:38

→ mamorui 就沒戲了 @@ 01/24 21:38

→ tsubasawolfy 斯克一心想上火星一樣賽道不同 01/24 21:38

→ minazukimaya 有至少在大膽創新+高效工程這兩方面是非常優秀的 01/24 21:38

推 wsung 已經玩了一整天的R1，真的不差 01/24 21:38

→ mamorui 去年一堆現在不是很愛看中國出的論文拿到長官面 01/24 21:38

→ mamorui 前介紹都容易被罵 01/24 21:38

推 bj45566 人家原始碼、論文跟效能測試結果都公佈了啊，請問 01/24 21:41

→ bj45566 樓上舉例一下哪個說自己更頂的有公開這些？好酸的 01/24 21:41

→ bj45566 葡萄 wwww 01/24 21:41

推 minazukimaya 中國一堆騙錢公司是事實但DeepSeek和他們不一樣也 01/24 21:41

→ minazukimaya 是事實這兩個事實又不衝突... 01/24 21:41

推 mamorui 不是啊論文就是有新方法數據更漂亮但實驗效果 01/24 21:42

→ mamorui 跑了不佳真的有啊 01/24 21:42

推 NTUCS 藍白糞高潮 01/24 21:43

推 bj45566 樓上中黑請解釋一下人家論文、原始碼都公開的情況下 01/24 21:43

→ bj45566 要怎麼「利用別人的研究偷雞」？只會無腦黑嗎？ 01/24 21:43

噓 naushtogo 最近炒作很大，讓我們繼續看下去 01/24 21:43

→ mamorui 我找一下我有標記過 01/24 21:43

推 s800525 說減少算力能達到一樣效能，那一樣算力不是能達到更 01/24 21:43

→ s800525 高效能？為何要以減少算力為前提？ 01/24 21:43

→ NTUCS 論文公布了但能 repro 嗎 01/24 21:43

→ bj45566 請問有哪個可信消息來源說「實驗結果不佳」？又在 01/24 21:44

→ bj45566 自己腦補嗎？ 01/24 21:44

推 tpkgo 原始碼公開又不代表什麼你是沒看過原始碼公開喔!! 01/24 21:44

→ NTUCS 你不是藍白糞幹嘛入座 01/24 21:44

推 mamorui 啊像那個LLaMA-omni就是同事報告時直接露餡 01/24 21:45

→ s800525 說能事半功倍，那不能事倍功四倍嗎？ 01/24 21:45

→ mamorui 開源就可以去repro 01/24 21:45

推 vtgc161 論文出來了，所以有人可以說明一下，他到底是不是拿 01/24 21:47

→ vtgc161 現有Ai模型為底去訓練的嗎 01/24 21:47

推 mamorui 要跑過才知道 01/24 21:47

推 bj45566 原始碼公開多久了？美國頂級業界學界大老也高度評 01/24 21:48

→ bj45566 價讚賞，台大資工板友也早就註冊測試覺得表現很好了 01/24 21:48

→ bj45566 -- 請問中黑還要怎麼樣才願意承認人家做出一個好東 01/24 21:48

→ bj45566 西？？？ 01/24 21:48

→ mamorui 等哪天這個技術在公司一堆人講才是真的我現在沒聽 01/24 21:48

→ mamorui 到就是了 01/24 21:48

推 duriamon 簡單來說就是最近有一個新的AI能力測驗，找了好幾位 01/24 21:49

→ duriamon 費爾茲數學獎得主來出超高難度題目，幾乎所有AI模型 01/24 21:49

→ duriamon 都回答得跟屎一樣，只有o3脫穎而出，大家正震驚Open 01/24 21:49

→ duriamon AI的技術力時，被爆料出來因為這個AI能力測驗OpenAI 01/24 21:49

→ duriamon 有贊助能事先拿到題目作弊，Altaman的作為我是不意 01/24 21:49

→ duriamon 外啦！呵呵！ 01/24 21:49

推 minazukimaya 你現在沒聽到要啟MoE項目只是表示你公司不在最前沿 01/24 21:49

→ cclemon1231 對岸弱點還是0到1，但改造能力真的很強 01/24 21:49

推 bj45566 看來你待的公司比 Meta AI 還強 wwww wwww 01/24 21:49

推 sleepinggod 成本低，跟使用者收費就可以便宜 01/24 21:50

推 mamorui 因為老馬的之前也拿過高分。就看囉 01/24 21:50

噓 yunf 機器之心是誰？ 01/24 21:51

→ minazukimaya 現在最前沿的美國公司一定會啟新項目投入MoE方向了 01/24 21:51

推 good5755 分領域導出答案假如問題是跨領域不就GG了 01/24 21:51

→ mamorui 沒有啊大家也是會謹慎看結果 OpenAi在很多篇論文 01/24 21:51

→ mamorui 數據都平均佳所以謹慎看待每一版表現囉 01/24 21:51

推 davis5566 說個事實某些人就開始藍白粉壯世代的這些爛貨 01/24 21:52

→ davis5566 還是早點被時代淘汰吧 01/24 21:52

→ mokipu 拉板凳看戲 01/24 21:52

推 dwood123 這說明小公司也可作出好的模型，那大家就會躍躍欲 01/24 21:52

→ dwood123 試，Al伺服器需求也會增加啊！ 01/24 21:52

推 duriamon 其實MoA架構比較符合人類的思考方式，人類大腦功耗 01/24 21:52

→ duriamon 才30W參數量才4GB，演化的威能不是蓋的。 01/24 21:52

推 sleepinggod 台灣不應該發展中文語言模型，教授都嘛拿國家錢產出 01/24 21:53

→ sleepinggod 沒用的東西。直接全民學英文比較有效率 01/24 21:53

推 bj45566 duriamon 板友講的 OpenAI o3 在高難度數學測驗的涉 01/24 21:53

→ bj45566 弊醜聞我在樓上就貼了一個應為報導短網址了，現在 A 01/24 21:53

→ bj45566 I 圈內最被懷疑的反而是這個 01/24 21:53

→ good5755 而且重點是資料庫吧目前以資料庫取得難易程度 01/24 21:53

→ duriamon 有Altman亂搞，OpenAI遲早會完蛋，我先預言在這邊， 01/24 21:54

→ good5755 對岸的13億免費資料庫真的比歐美簡單多了 01/24 21:54

→ duriamon 呵呵！ 01/24 21:54

推 mamorui 我記得OpenAI數學不好吧 01/24 21:54

→ bj45566 *英文報導 01/24 21:54

推 tpkgo Meta AI不錯但現在使用者標竿是OpenAI 01/24 21:54

推 akwa 一堆井蛙還是不信呵呵 01/24 21:54

→ bj45566 難怪你待的公司沒人在討論 DeepSeek，都 2025 年了 01/24 21:55

→ bj45566 還在講 OpenAI 數學不好，嘻嘻 wwww wwww 01/24 21:55

推 mamorui 對 OpenAI是標竿因為大多比較數據出在別人的論文 01/24 21:55

→ mamorui 裡 GPT都平均拿到最佳但數學是真的爛 01/24 21:55

→ bj45566 OpenAI 涉嫌作弊的是普通人一輩子都碰不到邊的 Fron 01/24 21:56

→ bj45566 tierMath benchmark !!! 01/24 21:56

→ duriamon 現在由於用於訓練AI模型所使用的開源資料已經幾乎耗 01/24 21:56

→ duriamon 盡，現在流行的是新型AI架構的研發以及超參數的蒸餾 01/24 21:56

→ duriamon 和分析，如何從已經有的超參數產生更好的產品才是顯 01/24 21:56

→ duriamon 學。 01/24 21:56

→ mamorui 我是沒有很常使用數學相關的沒錯。記憶停在數學爛 01/24 21:56

→ mamorui 沒錯 01/24 21:56

推 sweetantt o3應該不久後就會出來了吧而且免費用戶也有o3 mini 01/24 21:56

→ sweetantt 到時候就知道openAI有沒有吹牛了 01/24 21:56

→ duriamon 看那個整天吹噓的Sora我是不期待啦！呵呵！ 01/24 21:57

→ bj45566 還在繼續幻想說 OpenAI o3 數學爛 wwww 人家輕鬆碾 01/24 21:57

→ bj45566 壓你好嗎！ 01/24 21:57

噓 cityhunter04 叫美國時代過去之前，他科技還是屌打世界2-30年… 01/24 21:58

→ duriamon 新的架構我覺得會是比較有趣的發展，傳統的transfor 01/24 21:59

→ duriamon mer已經差不多了。 01/24 21:59

→ duriamon 說是傳統不過也才2-3年的事，AI發展就是這麼競爭， 01/24 21:59

→ duriamon 呵呵！ 01/24 21:59

推 mamorui 等很多paper報告看到比較時DS贏再說吧最近兩個月 01/24 22:00

→ mamorui 沒時間看paper 小組報告都延期了趕年末案子要GM 01/24 22:00

推 bj45566 OpenAI o3 的 AIME 2024 benchmark 分數是 96.7% 好 01/24 22:05

→ bj45566 嗎？ 01/24 22:05

推 mamorui o3不是12月才推出嗎我剛好沒用哈以前很爛是真 01/24 22:07

→ mamorui 的 01/24 22:07

推 Tsukasa0320 很好啊有威脅度才有理由打死 01/24 22:07

→ mamorui 那我就期待一下2025的各大paper囉 01/24 22:07

推 bj45566 OpenAI o3 現在被質疑的 FrontierMath benchmark 是 01/24 22:07

→ bj45566 絕大多數人一輩子都碰不到的高等數學 01/24 22:07

噓 k798976869 meta就是故意開源AI不給微軟賺的還在演啥 01/24 22:08

推 bj45566 又在講笑話了，嘻嘻。OpenAI 在 AIME benchmark 早 01/24 22:09

→ bj45566 就超過大部分人的數學水準了 wwww 01/24 22:09

推 popo123456 丸子,台積和美股7巨頭都要暴跌 01/24 22:10

→ bj45566 難怪你的公司沒聽過 DerpSeek，嘻嘻 wwww 01/24 22:10

推 mamorui 教科書的數學是可以邏輯陷阱還是會踩 01/24 22:10

→ mamorui 聖誕節才發布不要急哇 01/24 22:12

推 DA3921999 只要中國的開發者還開源就不可能贏美國啦，美國穩的 01/24 22:12

→ lon0623 暴跌就想太多了，尤其台積本益比才二十幾 01/24 22:12

推 bj45566 開源的遠不只 Meta 一家，DeepSeek 是用少得嚇人的 01/24 22:12

→ bj45566 成本打平、打敗檯面上所有的開源大語言模型 01/24 22:12

推 shorty5566 NV盤前大跌-0.5% 蒸的丸子 01/24 22:13

→ abc21086999 為什麼有人要為了中國的AI很厲害感到自豪？ 01/24 22:13

→ lon0623 你問中國用的晶片是不是台積做的 01/24 22:14

推 mamorui 我也不知道而且我習慣謹慎多看幾版 01/24 22:14

→ lon0623 而且AI只是台積的一部分而已 01/24 22:14

推 MumiPyonPyon Deepseek不是open的嗎@@ 01/24 22:15

推 bj45566 因為 DS 狠狠打臉股板數不清的無腦中黑啊，嘻嘻 www 01/24 22:16

→ bj45566 w 01/24 22:16

→ bj45566 連 OpenAI 數學早就很強都完全不知道的人說自己「 01/24 22:17

→ bj45566 謹慎」 wwww wwww 01/24 22:17

推 bj45566 看到無腦的____ 被狠狠打臉就覺得爽快是人之常情吧 01/24 22:18

→ bj45566 wwww 01/24 22:18

推 loveyou9527 兄弟聽我說這個ds 有料 01/24 22:21

→ yunf 真的沒什麼好爭的就看你能拿它來做什麼有真的帶來 01/24 22:21

→ yunf 創造性的價值那就是對你有利的 01/24 22:21

推 lon0623 料敵從寬也不是壞事阿，多多想台灣有什麼能介入的 01/24 22:22

→ yunf 黑貓白貓會抓老鼠的就是好貓 01/24 22:22

→ yunf 如果他再厲害不能為你所用也是沒用 01/24 22:23

噓 verydolungbe 支那XDXDXD 聽聽就好 01/24 22:23

→ yunf 謝遜拿了屠龍刀雙眼失明頂多拿來砍樹 01/24 22:24

推 lon0623 中國景氣不好有時對科研反而有好處，逼人去研究 01/24 22:24

推 s800525 有更好的算法能產生更快投入市場，就會有更多廠商願 01/24 22:24

→ s800525 意堆更多硬體來搶佔市場，永遠沒人在嫌硬體效能過剩 01/24 22:24

→ s800525 的 01/24 22:24

噓 heart9677 想想半導體造假，先觀望一下好了 01/24 22:24

→ yunf 沒有不好好嗎每天那麼多人張口就是要吃飯 01/24 22:25

→ yunf 吃的用的沒少過只是沒有以前這樣亂花 01/24 22:25

推 k91011022 資料都被分析完那就有可能走向預測了 01/24 22:25

推 mamorui 很快的。論文1、2個月內會有一堆去證明。 01/24 22:26

→ lon0623 連他們自己一堆人都在說景氣下行了，不用否認 01/24 22:26

推 s800525 這個方法好，那當所有人都用這方法，那最後不是還是 01/24 22:26

→ s800525 拚誰堆的硬體多？ 01/24 22:26

推 knml 自己去用用看不就得了，免費 01/24 22:26

→ lon0623 要推廣給更多人用，還是要硬體阿 01/24 22:27

→ lon0623 甚至能普及的話，硬體需求更多 01/24 22:28

推 mamorui 是要看驗證數據不同篇會用不同場景要解決的問題去 01/24 22:28

→ mamorui 驗證我不可能自己去弄那個資料 01/24 22:28

推 s800525 現在反而怕應用普及不了到一般消費者，硬體需求反而 01/24 22:28

→ s800525 曇花一現，真能更快達到普及至消費端，硬體需求才真 01/24 22:28

→ s800525 的會井噴 01/24 22:28

推 ab4daa $$$$$$$$$$$$$$$ 01/24 22:29

→ Rickyyy 裁員滾滾，股價又可以噴噴 01/24 22:29

→ lon0623 這就跟省油車出來，汽車反而賣更好的道理依樣 01/24 22:29

推 js52666 小金庫被拆了 01/24 22:30

推 goal56 中國人比較卷贏美國早晚的 01/24 22:30

推 lon0623 H800 GPU不也是NV的嗎? 01/24 22:31

→ yunf 半年整個指數漲了快¼你說經濟很差？ 01/24 22:32

推 s800525 H800效果就很好，那用GB200不就飛天了？ 01/24 22:33

推 minazukimaya 模型是科研應用是商業其實這兩件事關連不大~~ 01/24 22:33

→ minazukimaya 商業上還是擁有直接面對消費者布署能力和通路的巨 01/24 22:34

→ minazukimaya 頭們優勢最大 01/24 22:34

→ yunf 1990年到現在漲了10倍 01/24 22:36

→ thigefe 左等台積腰斬 01/24 22:36

推 s800525 港股一年來漲了26.20%，但5年來跌了28.21%，所以說 01/24 22:37

→ s800525 經濟不好沒問題吧？而且比疫情時期還低就更慘了... 01/24 22:37

→ yunf 那只是一個相對的概念 01/24 22:38

推 lon0623 中國政府都在催促國家隊進場買股了，這樣叫好? 01/24 22:38

→ yunf 一個人如果有10億然後他現在剩下七億每天跟你說他 01/24 22:38

→ yunf 很窮你要同情他嗎？ 01/24 22:38

→ lon0623 他們本來就不是正常股市了，做空還會被政府抓 01/24 22:39

→ yunf 你可能沒有看過1990的大陸 01/24 22:40

→ lon0623 1990的人忍耐力一定比現在高很多好嗎 01/24 22:40

推 Paulsic 百萬輸出 tokens 16 元，輸出 API 價格只有 OpenAI 01/24 22:40

→ Paulsic o1 的 3%。熟悉的味道 01/24 22:40

→ yunf 那時候他們就已經過得不錯了只是沒有現在好而已 01/24 22:40

→ lon0623 1990過得不錯是平行時空嗎? 01/24 22:41

→ lon0623 現在一定比35年前好啦，但人民的需求也會上升 01/24 22:42

推 WD640G 好啦中吹先給你高潮 01/24 22:42

→ lon0623 之前一直吹的解封行情，現在也沒了 01/24 22:43

→ yunf 有吃有喝有得住還要怎樣？就是交通不發達醫療技 01/24 22:43

推 jamesjklin 爛爆，deepseek錯誤百出 01/24 22:43

→ yunf 術不發達 01/24 22:43

推 mamorui 中國有些團隊paper提供無限量用很佛是真的尤其gen 01/24 22:45

→ mamorui 多媒體同事分享過覺得挖paper最大好處 01/24 22:45

推 bj45566 1. 中國現在經濟差景氣不好；2. 中國中下層百姓過得 01/24 22:45

→ bj45566 比疫情前還苦；這些都沒錯，但是：3. 中國投入科研 01/24 22:45

→ bj45566 的經費持續增加；4. 中國 2024 年在頂尖科學和、工 01/24 22:45

→ bj45566 程期刊和頂尖 CS 會議的論文發表數持續突破新高 esp 01/24 22:45

→ bj45566 . Nature, Science 01/24 22:45

推 xkso 中國東西先打3折 01/24 22:46

推 JWJerryyy 剛剛meta ath 看來不影響？ 01/24 22:46

推 lon0623 景氣不好，會讓一些人才寧願去科研阿 01/24 22:46

推 mamorui 真得先打3折 QQ 01/24 22:46

→ shorty5566 蠢鳥也很笨這東西明明對台灣也好 01/24 22:48

推 holysong 中國人很卷終獲勝？1990日本也過得不錯啊 01/24 22:48

→ yunf 這都他們自己控制的 01/24 22:48

→ shorty5566 要是解法一直是堆GPU 你堆得贏那些CSP大廠嗎 01/24 22:48

推 lon0623 中國民企要存活，基本上就是要走出海外 01/24 22:49

→ yunf 過度信用擴張的人才會有問題 01/24 22:49

→ shorty5566 有deepseek的發表至少讓台灣還有入場券 01/24 22:50

→ lon0623 不然國內越捲就越不敢請人，繼續惡性循環 01/24 22:50

推 newyorker54 我只說一句如果真的那麼好，中國人完全不可能開源， 01/24 22:50

→ newyorker54 對標open AI就只是滿足自卑感自己吹吹。完全沒有原 01/24 22:50

→ newyorker54 創性的產品 01/24 22:50

噓 jasterlin 唬爛，沒底層光靠蒸餾要趕英超美 01/24 22:50

推 MrCool5566 怎麽一堆人看到中國就黑 01/24 22:51

推 lon0623 美國最大優勢其實還是強大的內需 01/24 22:52

→ lon0623 那些中國公司產出在好，不進歐美會被自己人卷死 01/24 22:53

推 narotic 都是中共同路人啦 01/24 22:54

→ newyorker54 大家還不夠瞭解中國人嗎？又狠又卷又不要臉，文革大 01/24 22:54

→ newyorker54 躍進死的人比二戰還多，把錯都推給毛澤東，那根本是 01/24 22:54

→ newyorker54 一個全體人民劣根性的完全展現結果，只怪一個人？？ 01/24 22:54

→ newyorker54 ？ 01/24 22:54

→ yunf 中國會沒有內需嗎？而且四倍的人口 01/24 22:54

推 lon0623 問題是他們的對手也是中國公司啊自己人卷死 01/24 22:55

→ newyorker54 有人還抹我是中國同路人，笑死！中國六代戰機有開源 01/24 22:57

→ newyorker54 嗎？但是中國人也不要偷著樂，六代機和老美十幾年前 01/24 22:57

→ newyorker54 就有的F22也不會有優勢，看有沒有五五波就偷笑了 01/24 22:57

推 bj45566 都被美國業界學界大頭稱讚是 "breakthrough" 了還在 01/24 22:58

→ bj45566 「完全沒有原創性」，笑死 wwww 講這句話的人根本 01/24 22:58

→ bj45566 不懂什麼什麼叫作原創性 01/24 22:58

→ yunf 原本就太肥了 nv的算力可能撐不起他們那種演算法 01/24 22:58

→ yunf 沒差就看誰先算出有用的東西 01/24 22:59

→ newyorker54 中國是變強了，是世界第二強國，但是民族劣根性永遠 01/24 22:59

→ newyorker54 去除不掉 01/24 22:59

→ bj45566 而且中國領先的 AI 公司的語言模型幾乎都是開源讓大 01/24 22:59

→ bj45566 家下載，遠不只 DS，一點常識都沒有 wwww wwww 01/24 22:59

推 Paulsic 看效能和背後的財務模式不覺得恐怖嗎 01/24 23:00

推 iaminnocent Deepseek的模型有借鑒之處，美國人也不是白癡，學 01/24 23:00

→ iaminnocent 過來調整一下，馬上模型就降本增效了 01/24 23:00

→ bj45566 美國、歐洲大部分做 AI 研究的也是開源，OpenAI 反 01/24 23:00

→ bj45566 而是世界的少數例外 01/24 23:00

→ iaminnocent 真的OpenAI 真的反而是例外 01/24 23:01

→ newyorker54 老黃還稱讚華為手機不可思議，中國人不要那麼自卑好 01/24 23:01

→ newyorker54 不好？？等到學界公認再來說吧 01/24 23:01

推 lon0623 說不定是美國人過太爽了，人事費用太高 01/24 23:02

推 lusifa2007 如果deepseek可以搞到gb200 不是更強 AI永遠需要N 01/24 23:02

→ lusifa2007 V 01/24 23:02

推 bj45566 現在 AI 還是離起跑點不遠的階段，當然最後美中誰 01/24 23:02

→ bj45566 贏不知道，更有可能是互有擅場 01/24 23:02

→ yunf 你看你能不能算出一個比馬斯克更棒的火箭系統 01/24 23:02

→ lon0623 看一堆影片還說美國科技業過多爽 01/24 23:03

推 Paulsic 付費打不過open還有人要付錢 01/24 23:04

推 capser 推開源 01/24 23:04

推 minazukimaya 組織文化的問題 DeepSeek作得到但是華為騰訊百度沒 01/24 23:04

→ minazukimaya 作到就說明了這不是中美差異而是組織文化差異 01/24 23:04

→ yunf https://tinyurl.com/283v9oe3 01/24 23:04

推 iaminnocent Deepseek的強化學習模式，也是O3的訓練模式，所以 01/24 23:05

→ iaminnocent 等O3公布以後，大家應該又會來比拼 01/24 23:05

→ newyorker54 open AI算力爆棚錢又多，窮人用窮人演算法自己自嗨 01/24 23:05

→ newyorker54 ！笑死。大腕花幾十萬玩明星一次，窮人打手槍打到扁 01/24 23:05

→ newyorker54 掉，還很得意說不花錢還射比較爽，哈哈 01/24 23:05

→ minazukimaya 要論軟工高手和996的強度中國大公司比DeepSeek強多 01/24 23:05

→ yunf 的確是很爽但是壓力也很大而且整個人的思路都不一 01/24 23:05

→ yunf 樣了 01/24 23:05

→ minazukimaya 了這幾年騙錢的中國AI公司也沒少過 DeepSeek能成功 01/24 23:06

→ minazukimaya 自然有其公司文化的獨特之處 01/24 23:06

推 epicurious 重點是沒有要比美國好啊，差一點點但便宜5倍，美國c 01/24 23:08

→ epicurious sp廠capex砍下來供應鏈就崩了 01/24 23:08

推 bj45566 看某位美國一流名校女博士天天拍 YouTube 就知道美 01/24 23:08

→ bj45566 國高科技業一堆爽缺閒缺... 01/24 23:08

推 newyorker54 真正開源的是meta，DS也是拿人家的來改根據開源條款 01/24 23:10

→ newyorker54 本來就要跟著開源，中國人有那麼好死，講一個自己完 01/24 23:10

→ newyorker54 全無到有的原創產品開源的再來說自己人格很崇高，不 01/24 23:10

→ newyorker54 然看你中國人德行就是垃圾 01/24 23:10

推 lon0623 女博士薪水說不定比台積很多主管高了 01/24 23:10

推 bj45566 真的不用拿文革和大躍進來嘴什麼民族性，要不然美 01/24 23:11

→ bj45566 國的民族性是不是崇尚內鬥和蓄奴(-- 當時全歐洲由英 01/24 23:11

→ bj45566 國帶頭都禁止蓄奴了)？？？ 01/24 23:11

→ shorty5566 砍capex幹嘛好的模型算法+算力不是更飛天= = 01/24 23:11

→ shorty5566 除非你覺得AI已經發展到盡頭了不然算力永遠都不夠 01/24 23:12

推 lon0623 美國有些人事成本真的太高了，還有搞啥DEI 01/24 23:12

推 minazukimaya 對啊算法改進了效率變好第一直覺當然是再放大模型 01/24 23:12

→ shorty5566 好的算法+更強的算力那才是事半功倍買越多省越多 01/24 23:13

→ minazukimaya 或是再加訓練集吧對BigTech來說... 01/24 23:13

→ shorty5566 更何況新的ai server功耗算力那些都是屌打前帶 01/24 23:13

→ lon0623 其實美國有對手才是好事，不然DEI一定繼續囂張下去 01/24 23:13

→ shorty5566 而且直覺是 DS讓入門門檻降低反而很多小公司能進來 01/24 23:14

→ shorty5566 這樣整個生態系才能蓬勃發展 01/24 23:14

噓 jonnysun 咦，AI本來就只有國人最顯發明的 01/24 23:14

→ shorty5566 多點開花絕對比集中在那些大CSP好啦 01/24 23:15

→ lon0623 小公司進來也是要努力的目標，而且他們更仰賴NV 01/24 23:15

→ shorty5566 不然以後只有中美能玩那對供應鏈風險才大 01/24 23:15

推 bj45566 廿年前的中國和現在的中國就已經是兩個世界，那時 01/24 23:16

→ bj45566 候中國在頂尖科學、工程期刊的論文發表甚至還輸台灣 01/24 23:16

→ bj45566 (現在贏幾百倍)，工廠只能做些紡織業、鞋襪雨傘、小 01/24 23:16

→ bj45566 燈泡 vs. 2024 年的中國連商用的 MRI, PET-CT 都會 01/24 23:16

→ bj45566 做了，成本是歐美產品的 1/10 01/24 23:16

推 minazukimaya 嗯...但說真的模型只是科研還是很燒錢的科研 01/24 23:16

→ lon0623 NV打造的客製化模型是可以讓更多小公司入場 01/24 23:17

→ minazukimaya 說不定笑到最後的還是像Apple這種掌握了通路的 01/24 23:17

→ yunf 所以你說他們經濟不好嗎？ 01/24 23:17

→ minazukimaya 畢竟你科研再強沒有接觸消費者的通路還是沒錢賺 01/24 23:17

→ lon0623 人家都說中國景氣不好了就你在堅持 01/24 23:18

推 bj45566 果然無知就是力量 wwww LLM 最先開源的是 Google 好 01/24 23:18

→ bj45566 嗎 -- 那時候的 Meta 重心還放在元宇宙呢！ 01/24 23:18

→ yunf 很可惜的就是他不是真的掌握通路通路是會變的錢是長 01/24 23:18

→ yunf 腳的 01/24 23:18

推 geniusw 中國人牛逼 01/24 23:19

→ yunf 就跟你說這就是一個話術看你從哪一個時間點去看這 01/24 23:19

→ yunf 件事 01/24 23:19

→ lon0623 那跟景氣是兩回事，現在中國經濟問題是不敢僱人 01/24 23:20

→ lon0623 工作還要花錢去買的 01/24 23:20

→ yunf 甚至以後用分析人的語言或者是新聞這都是一個關鍵點 01/24 23:20

→ yunf 他只要使用的是比較詞就可以直接略過 01/24 23:20

→ yunf 就是一個試圖混淆含糊不清的概念 01/24 23:21

→ lon0623 你只看生產端，但景氣是要看市場的 01/24 23:21

推 bj45566 中國現在經濟不景氣、老百姓日子普遍變差和中國政 01/24 23:22

→ bj45566 府持續增加科研經費，中國在科技領域越來越強是可以 01/24 23:22

→ bj45566 並存的事實好嗎 01/24 23:22

推 lon0623 是可以並存沒錯啊，不過這些產出還是要出口才行 01/24 23:23

→ yunf 叫他們想想1990年的自己就不會覺得現在有多差 01/24 23:23

→ lon0623 世界上很多產出很好的國家，但找不到出海口，結果就 01/24 23:24

→ yunf 你看他A股指數 1990/12/31 才127.610 01/24 23:24

推 bj45566 中國要變成工業大國、科技大國是遠從江澤民時代就開 01/24 23:24

→ bj45566 始一直持續的規劃目標，小學生皇帝雖然在很多地方 01/24 23:24

→ bj45566 很蠢，在這個目標上仍然是蕭規曹隨 01/24 23:24

→ lon0623 是動用武力打市場，但現在不可行了 01/24 23:24

→ lon0623 所以這是美國的優勢，因為美國有大市場 01/24 23:25

→ yunf 到2025/01/24 3409.010 01/24 23:25

→ lon0623 不可能有人想再去過1990的生活啦，那會造反了 01/24 23:26

→ lon0623 叫你去我看你會不會鬧 01/24 23:26

→ yunf 打七折而已 01/24 23:26

→ yunf 那時候也能活現在的人就是貪婪不知足 01/24 23:27

→ TaiwanUp github.com/deepseek-ai/DeepSeek-V3/issues/12 01/24 23:27

→ lon0623 尤其是中國的1990，那時候返鄉探親的人說根本噩夢 01/24 23:27

→ lon0623 你罵不知足那怎麼不乾脆停止發展就好了 01/24 23:28

→ TaiwanUp GitHub上的DeepSeek Issue12有提到根本不是開源模型 01/24 23:28

→ yunf 所以你看中國經濟是不是又有不一樣的深度 01/24 23:28

→ lon0623 同事有人爸爸是外省老兵，返鄉說那是什麼鬼環境 01/24 23:29

→ yunf 從你一開始說的經濟不好是不是又多了一個時空維度 01/24 23:29

推 hedonist https://i.imgur.com/X4NPImz.jpeg 01/24 23:29

→ TaiwanUp 只是開放使用而已 01/24 23:30

→ yunf 這就是我說的他使用比較詞的時候讓你產生了一個腦 01/24 23:30

→ yunf 補的概念 01/24 23:30

推 mamorui DS的測試數據有非數學、邏輯、代碼的數據集嗎看到 01/24 23:32

→ mamorui 幾個分享的都只有針對這類想看點別數據集的實驗數 01/24 23:32

→ mamorui 據 01/24 23:32

→ yunf https://tinyurl.com/23s52r6l 剛好看到這一篇水軍 01/24 23:34

推 lponnn 希望是真的幹趴好美 01/24 23:35

→ yunf 以後你在看新聞的時候看到他使用比較詞這種模糊的概 01/24 23:37

→ yunf 念的時候就可以立刻有所反應！多練習幾次就知道很 01/24 23:37

→ yunf 好用甚至你還可以建立詞庫什麼%呀都是一個可以被動 01/24 23:37

→ yunf 手腳的魔術數字 01/24 23:37

→ yunf 板上不是有一個計算機大師嗎他就很喜歡提出一些他 01/24 23:38

→ yunf 自己都沒有驗證過的數據 01/24 23:38

→ yunf 你只要比他清楚就不會被他唬爛或者是你的基礎觀念 01/24 23:39

→ yunf 很好也不容易被唬爛 01/24 23:39

推 greattower 真正被挑戰的是特斯拉，上述這些公司都還不是很接 01/24 23:41

→ greattower 近 01/24 23:41

→ yunf 這就是為什麼三歲小孩子好騙因為他們不具備這些基 01/24 23:42

→ yunf 礎辨識能力甚至要到鑑識能力 01/24 23:42

→ TaiwanUp 其實還是不建議貼這個網站的東西宣傳度比較高 01/24 23:43

→ yunf 看記者署名就知道 01/24 23:45

→ yunf 就當笑話看看就好沒有任何機構背書 01/24 23:45

推 ipadpro2 很像台灣的迂腐體制一群大頭只會出張嘴領高薪難怪 01/24 23:46

→ ipadpro2 沒效率 01/24 23:46

→ EDFR 遙遙領先 wwwwwwwwwwwwwww 01/24 23:48

推 skyyo 會不會deepseek裡面真的是工人智慧真人線上選擇AI 01/24 23:49

→ skyyo 生成的幾個選項 01/24 23:49

→ yunf 等你老了就知道什麼叫做心有餘而力不足再也不是那 01/24 23:49

→ yunf 個可以一天工作17～18小時的超人但那種戰鬥力所留下 01/24 23:49

→ yunf 來的成就感你還會記得這個時候你可能會找新鮮的肝來 01/24 23:49

→ yunf 補足那種感覺可惜你發現你找來了一堆天線寶寶 01/24 23:49

推 a123274 中國可以用美國的模型去訓練，當然成本低 01/24 23:50

→ yunf 他就跟你講說他是deepsick了 01/24 23:50

→ TaiwanUp Meta本來就該緊張也不用緊張本來就沒賺魔改又如何 01/24 23:51

→ yunf 所有的人工智慧到最後都是為了等待救世主的出現而做 01/24 23:52

→ yunf 的準備 01/24 23:52

推 tchialen 背後是人體計算機 (誤) 01/24 23:54

推 aaronpwyu 這代表不只元團隊是小倫 AI團隊也是？ 01/24 23:54

→ yunf https://tinyurl.com/2y8tmcnt 01/24 23:54

噓 WillTheWise 重點不是怎麼train的，是用什麼資料train的 01/24 23:58

→ yunf https://tinyurl.com/225wxbdt 01/24 23:59

→ yunf https://tinyurl.com/2993eypv 簡單有用的知識 01/25 00:01

→ yunf https://tinyurl.com/2cqn9qtv 希望大家是自己的大 01/25 00:07

→ yunf 腦成長不是機器的大腦成長 01/25 00:07

推 skyyo 我也不太信deepseek 目前試用觀察中但必須要說連英 01/25 00:09

→ skyyo 文都看不懂還能堅持罵的一定是中黑 01/25 00:09

推 aria0520 meta的主力路線本來就不在LLM上是lecun的世界模型 01/25 00:11

→ aria0520 deepseek這些都還是LLM LLM就是條死路 01/25 00:12

→ aria0520 文字接龍不可能接出AGI 01/25 00:13

推 lponnn 用了多少印度人哈哈 01/25 00:13

推 aria0520 現在業界都在LLM耗費鉅資窮兵黷武願意像meta這樣 01/25 00:16

推 s1527 怎麼一堆人都是用硬體類比軟體錯誤的類比會讓自己 01/25 00:16

→ s1527 顯得是愚人 01/25 00:16

推 bella1815 Meta股價又創新高了，還真是恐慌呢 01/25 00:17

→ aria0520 分可觀資源給全新路線的幾乎沒有 01/25 00:17

→ aria0520 lecun一旦成功那就會像當年OAI在GPT一樣拿到先發 01/25 00:18

→ aria0520 chatgpt出來之前全都在搞bert 但oai堅持信念才走出 01/25 00:18

→ aria0520 LLM和scaling law的新路追隨者們現在又歷史重演 01/25 00:19

→ aria0520 oai自身有能力的RD又都跑光只剩一堆sales和PM 01/25 00:19

→ aria0520 整天在X上false hype, 所以我反而很看好meta 01/25 00:20

→ aria0520 zuck只要肯繼續放權放資源讓lecun探索world model 01/25 00:21

→ aria0520 那可真的會是有AGI潛力的理論模型 01/25 00:21

→ aria0520 meta的llm team的確是可能慌因為本來他們就在和 01/25 00:23

→ aria0520 lecun的FAIR爭資源爭算力這對lecun應該是好事 01/25 00:23

推 c41231717 來試試 01/25 00:27

推 spen2005 Eriker到底在供三小 01/25 00:29

推 lovepork aria到底在講什麼？你直接回一篇吧？ 01/25 00:30

推 wen880225 中國取得科技領先有可能，但中國科技領先不可能 01/25 00:31

→ yunf https://tinyurl.com/272jwcrp 製造更多的問題 01/25 00:31

→ aria0520 講得太業內了嗎?XD 01/25 00:32

→ aria0520 隨手抒發一下而已沒打算回一篇 01/25 00:34

推 godevilyu 不得不說中國軟體真的強..要不是硬體被制裁.. 01/25 00:35

→ yunf 他就算有AGI要怎麼用還是個問題他到底是個瘋狂科學 01/25 00:36

→ yunf 家還是任性的小女孩？ 01/25 00:36

推 coolmark01 中國的現況應該都只能想辦法彎道超車，尤其在硬體被 01/25 00:37

→ coolmark01 限制的情況之下 01/25 00:37

→ yunf 就跟老鼠一樣一直站在牛的頭上然後快到終點的時候 01/25 00:38

→ yunf 再跳下來說他是第一 01/25 00:38

推 lovepork 我好奇，印度的軟體業不是很強？ 01/25 00:38

→ lovepork 怎麼AI好像沒搞出什麼行頭？ 01/25 00:39

→ yunf 所以你就要知道其實他們一直都在佈一個大局 01/25 00:39

推 ochyi 有人跟我一樣想到人礦嗎？ 01/25 00:39

→ yunf 你想得到的別人都想過了你想不到的別人都在默默進 01/25 00:40

→ aria0520 軟體跟AI不是同個概念軟體有前後端有系統整合 01/25 00:40

→ yunf 行中 01/25 00:40

→ yunf 你看全球領導人物有多少人是印度人 01/25 00:41

→ lovepork 反而是軟體業不出色的中國人在AI竄出 01/25 00:41

→ aria0520 但本質上都是碼農頂多演算法很強優化建構能力強 01/25 00:41

→ aria0520 AI需要的人本質上是研究員看paper發paper 01/25 00:41

→ yunf 你再偷也沒有用最後也只是別人故意給你偷的就好像 01/25 00:42

→ aria0520 中美的AI論文量本來就不相上下在這波浪潮前也是 01/25 00:42

→ c41231717 小玩了一下自己玩起來的感覺是資料庫的限制比幾個 01/25 00:42

→ yunf 作業系統一樣故意讓盜版沒關係 01/25 00:42

→ c41231717 大頭AI的限制少其實美國人有發現問題啦不然阿川 01/25 00:43

→ yunf 別人只利用你的人力和資源來完成這些東西 01/25 00:43

→ c41231717 怎會簽署鬆綁AI限制的法案 deepseek的品質還不錯 01/25 00:43

→ aria0520 說實在在LLM這條死路上誰衝的快不怎麼關乎大局就是 01/25 00:43

推 bj45566 印度軟體強？他們接的主要是中低階代工單(來自美國 01/25 00:44

→ aria0520 頂尖labs教授不要再讓學生去蹭LLM養出一堆產廢才是 01/25 00:44

推 Page122 真的屌技術帝的勝利 01/25 00:44

→ bj45566 、日本) -- 你會覺得幫政府機構架網站的人軟體強嗎 01/25 00:44

→ bj45566 ？印度的理工強者大部分都去美國英國了... 01/25 00:45

→ aria0520 真的過去一年來這個弊端開始顯現了 new grad清一色 01/25 00:45

→ c41231717 輔助吧 AI雙面刃如果拿來產虛假數據的話基本上就 01/25 00:45

→ aria0520 都在搞LLM 研究主題不如過去十年的多樣 01/25 00:46

→ c41231717 變成毒藥了但拿來分析實打實的研究數據是很有用的 01/25 00:46

→ bj45566 不過隨著印度慢慢崛起，未來很有可能看到改變 -- 印 01/25 00:46

→ c41231717 工具 01/25 00:46

→ bj45566 度的 Nature Index 成長的很快，目前已經遠勝台灣世 01/25 00:46

→ bj45566 界第九 01/25 00:46

→ aria0520 等所有公司都在這條死路封頂後我看這群何去何從 01/25 00:46

推 fukku100 DeepSeek r1 14b 的效果真的不錯 01/25 00:47

→ bj45566 「AI需要的人本質上是研究員看paper發paper」 +1 01/25 00:47

噓 L1ON 機翻嗎？文章看得很痛苦還好有原文 01/25 00:48

推 bj45566 aria0520 板友絕對是 AI 巷子內的 01/25 00:49

推 WWIII 空爆臉書 01/25 00:50

推 bj45566 現在 EE/CS 即使是難度最巔峰的 ACM STOC 都可以看 01/25 00:53

→ aria0520 是有感而發XD 01/25 00:53

→ bj45566 見來自印度的論文了，在五六年前簡直不可思議... 印 01/25 00:53

→ bj45566 度在科研方面的投入明顯增加許多，成果也慢慢展現出 01/25 00:53

→ bj45566 來了... 01/25 00:53

推 bj45566 CS 之前從來沒有一個子領域論文研究和實戰能力像 AI 01/25 00:55

→ c41231717 印度仔這幾年很多有錢人啦旅遊碰到都有感小費都 01/25 00:55

→ bj45566 那麼緊密相連過 01/25 00:55

→ c41231717 給一百鎂的嚇死人 01/25 00:55

→ yunf 印度種姓制度你可能遇到他第二等的那種 01/25 00:57

推 bj45566 (EE 則是一直都有，例如最明顯的 Info. Theory 領 01/25 00:58

→ bj45566 域論文研究 <-> 人類通訊編碼、影音壓縮的實戰技術) 01/25 00:58

→ yunf 暴發戶也是很多你看委內瑞拉30年前和現在 01/25 00:58

推 li11223344 中國就Cost down專業啊..半價買到8成效能還是很吸 01/25 00:59

→ li11223344 引人吧 01/25 01:00

推 ypc1994 綠蟾蜍：台灣技術先進 AI沒發展只是沒錢 01/25 01:00

→ yunf 現在他們就是要你一直用A I一直要電然後你就自己去 01/25 01:03

→ yunf 找電弄碳權自己拔樹破壞生態系最終就是一堆人生病 01/25 01:03

→ yunf 新型態的病菌正在悄悄地進入你的生活圈 01/25 01:04

推 bj45566 又再把 "breakthrough" 轉移概念到 "cost down" 了 01/25 01:05

→ bj45566 wwww wwww 01/25 01:06

→ yunf https://tinyurl.com/29l9n6vp 01/25 01:06

→ Royalweger 那麼重要的是多空蛙，分別有哪幾支標的能參考的呢 01/25 01:06

→ yunf https://tinyurl.com/257hnlzh 01/25 01:09

→ yunf 這裡絕大部分的人都不討論估值問題 01/25 01:11

→ yunf 這個東西有沒有發展對於企業或者是產業到底能增加多 01/25 01:12

→ yunf 少估值？ 01/25 01:12

→ yunf 現在的A I也都還沒有開放這一塊 01/25 01:13

→ yunf https://tinyurl.com/2b5ah7gq 終於看到有人分享這 01/25 01:15

→ yunf 個畫面 01/25 01:15

→ yunf 照理來說他結果怎麼形成的這個過程應該都是被嚴格控 01/25 01:16

→ yunf 管的 01/25 01:16

推 Aquarius126 台灣搞AI的都跑出國了吧 01/25 01:18

→ newwu ㄜ有人的英語閱讀能力... 01/25 01:21

推 iamdemonic 集體耍廢被發現了我要笑死 01/25 01:34

推 event1408472 不用那麼多顯示卡了台積電G 01/25 01:44

推 st950127st 贏麻了先存著論文明天看 01/25 01:55

推 pleasepo 人家程式都開源也可以接受國際驗證，這樣也叫吹？ 01/25 01:55

→ pleasepo 當初韓國吹常溫超導體，結果沒有一間實驗室可以驗證 01/25 01:56

→ pleasepo ，這就是造假。 01/25 01:57

→ pleasepo 印度軟體強沒錯，但是都是受雇西方國家，加上沒有資 01/25 01:58

→ pleasepo 金，無法發展。 01/25 01:58

推 a731977 笑死，有人英文看不懂，哈哈 01/25 02:16

→ yunf https://tinyurl.com/27wvjavq 沒關係有人幫你簡報 01/25 02:23

→ yunf https://tinyurl.com/2yo2b54d 他跟你說什麼是原創 01/25 02:38

噓 ilycychien 快跌好不好最看不懂在漲什麼的東西 01/25 02:58

→ yunf https://tinyurl.com/268m4lq5 看起來好像是在教你 01/25 03:13

→ yunf 開飛機可是重點是你又不是教練你怎麼知道這個細節 01/25 03:13

→ yunf 和步驟有沒有問題這個就事實查核有趣的地方 01/25 03:13

推 hyperyoujo 大家這麼震驚幹嘛，這不就中國日常，這新聞只是說 01/25 03:27

→ hyperyoujo 明AI技術成熟的比較快而已，一個製成（包含軟體） 01/25 03:27

→ hyperyoujo 一向都是只要成熟了就沒有其他國家能卷贏中國了， 01/25 03:27

→ hyperyoujo 就這麼單純而已 01/25 03:27

→ yunf https://tinyurl.com/24l8nboy 中國日常是這個 01/25 03:38

推 ezezpz 請大家快跑讓我撿便宜 01/25 05:02

推 vindiesl2000 美國ai本就是華西街炒股工具 01/25 05:46

噓 darktasi 中國或成最大贏家 01/25 06:12

推 lanszul 科技越發達，工業越全面，通縮才正常，只有沙雕才會 01/25 06:16

→ lanszul 信美國通膨那套理論，美國人現在都打兩份工才能生存 01/25 06:16

→ lanszul ，誰比較慘還看不出來嗎？ 01/25 06:16

推 JT0624 不然美國為什麼要限制中國AI晶片因為早就輸了 01/25 06:42

推 PttWaHaha 臺灣負責賣鏟子發大財，其他國家自己去捲AI…贏痲了 01/25 07:12

→ PttWaHaha …… 01/25 07:12

推 justin200428 白人怕輸到時發核彈 01/25 07:26

→ justin200428 老黃太聰明了 01/25 07:27

推 Aixtron AI幻覺 01/25 07:40

推 NgJovi AI泡泡@@ 01/25 07:43

推 supisces 利好meta，發現人力可以少一半，而且效能多好幾倍。 01/25 07:43

推 Lhmstu meta 爽太久吧，冗員多 01/25 07:51

→ howardyeh 我認為只是臉書自己的問題，之前搞元宇宙就覺得他們 01/25 07:59

→ howardyeh 研發審核毫無章法，一堆普普的東西居然也敢拿出來大 01/25 07:59

→ howardyeh 吹特吹 01/25 07:59

推 k1k1832002 其實最大衝擊大概是原本認為落後五年甚至超過的人 01/25 08:01

推 k798976869 meta現金多啊根本不急靠賣詐騙廣告補血 01/25 08:01

噓 deepdish 幫翻譯：請給我黃金 01/25 08:04

推 Lhmstu 記憶中meta不是要裁員了嗎，考核後10%打算全砍 01/25 08:04

推 s213092921 一堆仇中酸民不願面對現實，你們得趕快習慣，今年中 01/25 08:19

→ s213092921 國科技會一堆井噴爆發^^ 01/25 08:19

推 losage 冗員：幹幹幹，要被發現了 01/25 08:44

推 peter6666712 牢美白豬不行很久了只能靠祖國人跟阿三撐著 01/25 08:54

→ peter6666712 現在老川還卡移民我看五年內牢美要完 01/25 08:54

→ newwu 成本是不是那麼低還很難說，他們看起來沒有公開詳 01/25 09:02

→ newwu 細訓練細節 01/25 09:03

噓 jamesho8743 開源就不是抄? 01/25 09:05

噓 atlaswhz 每天都在贏 01/25 09:11

→ mamorui 幾何數學沒對 https://imgur.com/1EERwjX 01/25 09:22

推 a6976933 笑死到時候發現根本不用這麼多鏟子直接崩盤 01/25 09:23

→ FatFatQQ https://i.imgur.com/wMkV5yP.jpeg 01/25 09:31

→ FatFatQQ 美國科研早落後了還領先30年 01/25 09:31

推 topfree ..上面那位一直吵的英文能力真的有問題 01/25 09:36

推 hololive45P 不用大量顯卡+低硬體，怎麼辦到的，有點神奇 01/25 09:54

→ lineak 我覺得對各家是利多，裁員人數上升。導入的門檻 01/25 09:55

→ lineak 降低 01/25 09:55

推 mamorui 邏輯也錯 https://imgur.com/Ya72IbV 01/25 10:22

→ mamorui 等都會對了再說 01/25 10:23

推 clou 先保留吧有沒有懂的鄉民可以說明低成本怎麼做到的 01/25 10:26

推 TaiwanUp 中國偽論文產量多而已根本不堪檢驗 01/25 10:28

推 mamorui 他就是只做後訓練燒錢的是預訓練 01/25 10:32

推 mamorui 借用李鴻毅老師的課程分類簡單讓一般人理解 01/25 10:36

→ mamorui https://imgur.com/daj8Khb 01/25 10:37

→ mamorui 應該說是DeepSeek r1, 我不是說v3 01/25 10:41

推 scccc 沒事。美國會禁的 01/25 10:49

推 mamorui 然後測試gpt不是用4o、要用o3, 譬如DS v3可以對gpt 01/25 10:51

→ mamorui 4o， DS r系列是對標ChatGPT o系列 01/25 10:52

推 kotorichan 主打便宜上百倍,堪用啊 01/25 11:04

→ kotorichan 先求有就好看能不能帶動中產晶片 01/25 11:05

推 TaiwanUp 八卦有篇論文被撤稿率中國被撤幾乎是2-18名加總 01/25 11:17

推 mamorui 中國真的不少就是論文模型上HF不限次免費佛心給用 01/25 11:23

→ mamorui ，不過標竿還是gpt，所以再說吧 01/25 11:23

→ FatFatQQ 數據都是驗證過的還再產量多快笑死文組是標案領 01/25 11:39

→ FatFatQQ 太多還在睡嗎 01/25 11:39

→ FatFatQQ 數據還是要現實世界驗證過的才能使用你一直靠AI搞 01/25 11:41

→ FatFatQQ 不一定會跑出真的東西 AI+實用數據互相支持 01/25 11:41

→ FatFatQQ 才能一直快速迭代 01/25 11:41

噓 reasonal 中國人力成本可以各種壓低，國外怎麼可能複製 01/25 11:54

推 iansrc 讓子彈飛一會美國科技業又不是紙糊的很需要這種 01/25 12:04

→ iansrc 當頭棒喝 01/25 12:04

推 david54001 中國的肝也不蓋的 01/25 13:37

→ Tatsuya72 自掘墳墓，嘻嘻 01/25 13:39

推 Brioni 可以確定的是AI這塊中國領先整個亞洲 01/25 13:41

→ zer0319 所以是軟硬體商一起在洗估值嗎 01/25 13:48

推 kdh 分別問DS和GPT,中國適合民主嗎？DS會吹噓中國，GPT 01/25 15:15

→ kdh 回答較中性 01/25 15:15

→ yunf 便利商店是怎麼戰勝雜貨店的？ 01/25 15:29

→ yunf 你們要知道量變後帶來的值變早就在估值裡 01/25 15:30

→ yunf 這就是為什麼他們吹牛不犯法 01/25 15:31

→ yunf 但東西卻差很多 01/25 15:33

→ yunf 時代就這樣轉換了老店就這樣被捲死了 01/25 15:35

噓 kougousei 這種陷入恐慌文就別鬧了之前google也陷入恐慌 01/25 16:15

推 toulio81 沒啥可信度，中國很多產品賣的都比成本還低 01/25 16:23

推 live1002 不過有沒有比較好，這串最好笑的是有人英文很爛 01/25 17:49

→ Jeff1989 阿祖：？ 01/25 18:41

→ louis925 會不會 training 的時候，把各個 benchmark 答案也 01/25 19:29

→ louis925 一起 train 了？ 01/25 19:29

→ ActionII 他們恐慌的原因不是被趕上吧，是發現對岸開始捲起 01/25 21:09

→ ActionII 來，他們的好日子要到頭了 01/25 21:09

噓 Brusolo 又來吹，這麼屌怎麼Meta昨天又創新高，中吹唬爛洨 01/25 22:27

→ gk1329 中國卷成世界贏家 01/25 22:34

推 bella1815 一堆狂喊美國輸了完了，做空了沒？ 01/25 22:47

→ yunf 美股是沒有漲跌幅限制的 01/26 00:58

→ yunf 你根本不知道什麼時候會灌下來 01/26 00:58

→ yunf 亞馬遜直接清掉魁北克分部 01/26 00:59

→ wantsleep 低成本只要接近大公司的效果就夠了 01/26 02:11

推 ksjr 我問chatgpt他會不會被deepseek取代掉結果他給我 01/26 02:58

→ ksjr 答非所問開始說廢話 chatgpt是不是急了? 01/26 02:59

推 DREE 軟體可以複製可以抄當然進步快啊!!人力不值錢 01/26 07:20

→ TaiwanUp 太低級的問題ChatGPT會幫你潤飾掉這才是大眾產品 01/26 11:36

推 lain2002 中國又贏了 01/26 15:38

推 penolove5566 做的事情不一樣吧，先做出來跟cost down 01/27 02:23

→ yunf https://tinyurl.com/2c6upj4s 01/27 07:25

→ yunf https://tinyurl.com/2y7qgafh 01/27 07:29

推 sg1987 一個月內翻船 01/27 14:59

→ skyyo 笑死以上中黑ID完全講錯方向是不是應該開集中下跪 01/27 17:27

→ skyyo 道歉討論串 01/27 17:28

推 tw19930419 回頭來看這篇真爽有人沒讀書，就喜歡嘴硬 01/27 22:58

推 s213092921 朝聖經典，中黑哭暈在廁所 02/09 23:43

噓 dodoro1 in 05/03 16:59