Re: [新聞] DeepSeek顛覆AI產業模式！曝中國2大發展

作者dansy (Eye Taiwan)

標題Re: [新聞] DeepSeek顛覆AI產業模式！曝中國2大發展

時間Sun Feb 2 22:35:43 2025

※ 引述《KIMBEOM (HYYY)》之銘言： : 原文標題：DeepSeek顛覆AI產業模式！曝中國2大發展方向　ASIC成關鍵 : 原文連結：https://reurl.cc/qn2x9n : 發布時間：2025/02/02 12:40 : 記者署名：壹蘋新聞網 / 呂承哲 : 原文內容： : 【記者呂承哲／台北報導】中國AI新創公司DeepSeek近期在科技界掀起熱議，根據調研機 : 構TrendForce集邦科技的最新研究，DeepSeek近期接連發表DeepSeek-V3、DeepSeek-R1等 : AI模型，將影響終端客戶對AI基礎設施的投資決策。未來，業者可能更注重軟體運算模型 : 的效率，以減少對GPU等昂貴硬體的依賴。同時，雲端服務供應商（CSP）可能擴大使用自 : 家ASIC（特殊應用積體電路）基礎設施，以降低建置成本。這使得2025年後，市場對GPU : AI晶片及相關半導體的需求可能產生變化。 : 心得/評論： : 看來ASIC就是未來趨勢 IC設計準備噴噴 : 明天加碼世芯創意 M31 LLM經過這三年發展已展現其潛力，但也陷入(公開)知識枯竭造成的瓶頸網路爬蟲能抓的都已訓練完 AI模型如還需增加功力，只能望向各家機構(公司)的商業祕密比如DS團隊使用低階語言PTX來增加GPU計算效率此部分的知識儲備，據說來自母公司幻化量方過往最佳化量化交易模型的經驗拿 Python/C/組語/機器語言來比喻就更明瞭過往程式語言往高階發展，是因為有著訓練人才普及的需求畢竟組語難學，機器語言就別提了所以在一個python程式滿天飛的時代，能用C重寫效率優勢就驚人，更不用說使用組語 GPU這塊也是，現在很少有CUDA的使用者會去寫PTX 所以關於"PTX最佳化"公開的知識並不多但很可能DS團隊已經成功將幻化量方PTX經驗轉換為大模型然後用在設計下一代大模型的架構上簡單說就是掌握獨家的低階語言知識，教給AI，然後再"手動迭代" 不斷產生更高效率的低階AI碼農當然OpenAI內部也有可能擁有類似知識，但效率較低所以基本可以推論，未來誰越能掌握壓榨硬體的知識，就能持續拉開效率差距 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.41.64.92 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Stock/M.1738506945.A.C3E.html 簡單程式可能效率相當，但稍微複雜點，人力就很難分析驗證整個流程加上組語/機器語言可以控制更底層的元件，特定情況下會存在更高效率方法拿Windows來比太誇張，或許再過30年有機會吧事實上現有LLM的架構很單純，一張圖就能表示清楚只是運算的數量級巨大無比，所以特別適合追求極端的最佳化 ※ 編輯: dansy (114.41.64.92 臺灣), 02/02/2025 22:59:53

推文 (76)

推 arthur52 可以避開使用CUDA，NV就不再獨大 02/02 22:39

推 Rattlesnake 快買a股 02/02 22:44

推 bj45566 現今的 compiler 最佳化技術太強大，在很多系統上寫 02/02 22:44

→ bj45566 C 語言執行效率未必會輸給寫組合語言 02/02 22:44

推 jacknavarra 推 02/02 22:44

推 psee PTX是CUDA到機械碼之間的中介碼不可能繞開 02/02 22:45

→ goodjop 真的快笑死都是NV的東西要怎麼避? PTT水準的是... 02/02 22:47

推 hpk89 存疑，低階語言很有效率沒錯，但系統大到一定程度 02/02 22:47

→ hpk89 後很難維護/除錯，你用機器語言寫的出windows 11? 02/02 22:47

→ hpk89 我個人覺得不可能，ds若真的效率比其他model好， 02/02 22:47

→ hpk89 應該是算法有進化，不會是用低階語言寫導致的 02/02 22:47

推 duriamon 架構才是重點 02/02 22:49

推 haunt11 專業推 02/02 22:49

推 AudiA4Avant 我記得是用ptx繞過nvlink的限制,但換不同型號就要 02/02 22:52

→ AudiA4Avant 重寫 02/02 22:52

推 jiansu 最佳化不是全部底層優化是瓶頸用底層加速會用pt 02/02 22:52

→ jiansu x 表示掌握底層換別的硬體架構也只是需要時間而已 02/02 22:52

→ jiansu cuda ptx不是重點了是他有離開nv生態圈的能力另 02/02 22:52

→ jiansu 外不要只關注DeepSeek 模型OpenAI 新模型出來了用 02/02 22:52

→ jiansu 戶使用成本也變低了整個ai用戶成本降價時代來臨 02/02 22:52

推 AdamHuangNew 不懂裝懂 02/02 22:53

推 jacknavarra 並不是說DS已完全脫離CUDA 但有機會突破護城河 02/02 22:53

→ jacknavarra 他開源給大家摸索, 未來會怎麼發展起來都不好說 02/02 22:54

→ goodjop 等有辦法不用NV的產品做出一樣的東西再說 02/02 22:55

推 bj45566 (純討論程式語言)回樓上：其實在桌電、筆電這種或以 02/02 22:57

→ bj45566 上複雜的環境，人們投入很多精力在改良 C/C++ compi 02/02 22:57

→ bj45566 ler，所以用 C/C++ 就很夠了(Windows 11 是用 C++ 02/02 22:57

→ bj45566 寫的, Linux 是用 C 寫的) -- 最多就是在少數特定 02/02 22:57

→ bj45566 地方夾進一段組合語言 02/02 22:57

→ kensmile 使用中階GPU，就能產出高效 02/02 22:58

→ kensmile 這點就是優勢 02/02 22:58

→ goodjop 我知道你的意思連AMD都沒辦法克服效能衰退問題 02/02 22:59

→ goodjop 中國能? AMD還有微軟出錢出人 02/02 23:00

推 bj45566 有人應該蠻誤解原 po 的意思 wwww 02/02 23:01

→ goodjop 用NV低階程式語言做出較不穩定的ANI要怎麼繞過NV? 02/02 23:04

→ goodjop 你解釋看看我哪裡誤解? 02/02 23:04

→ kensmile 架構的極致優化和算力需求的精簡，就是Ai的精髓 02/02 23:04

→ kensmile DS做到了 02/02 23:04

→ kensmile 讓業界廣泛使用 02/02 23:06

→ b9513227 門外漢以為寫程式是電影敲鍵盤亂按喔 02/02 23:06

→ kensmile 事實上也是爭相採用 02/02 23:06

推 bj45566 AMD 在做的事和 DS 在做的事情又不一樣 =.= 02/02 23:07

→ kensmile 台灣軟體界的看法，褒貶不一，但台灣自己搞不出來 02/02 23:07

→ goodjop 我只是舉例AMD+微軟都無法取代NV的意思 02/02 23:09

→ goodjop 除非 AMD+微軟做出自己的平台 02/02 23:10

→ kensmile openAi準確率也不是100%，DS準確率較低，只要繼續優 02/02 23:11

→ kensmile 化 02/02 23:11

推 bj45566 微軟在做的事和 DS 在做的事又不一樣 =.= 02/02 23:12

→ kensmile 拉高準確率，小而美就是市場主流 02/02 23:12

→ bj45566 微軟自己沒什麼在搞 LLM 02/02 23:13

→ goodjop 你自己去找資料吧 02/02 23:15

推 bj45566 微軟主要合作的 LLM 公司都是用 NV 的硬體架構，含 02/02 23:16

→ bj45566 NVLink 和 NV 認證的 HBM 02/02 23:16

→ bj45566 微軟和 NV 根本不是競爭對手的關係 02/02 23:16

推 neo5277 樓上正解微軟大概只能算算力掮客 02/02 23:21

→ bnn PTX優化是其中一項但DS還做了其他事情兩件以上 02/02 23:22

推 Virness 一樓完全誤解 PTX只是自己寫cuda 02/02 23:23

推 slothman 不是都是NV架構嗎要拿什麼繞你當撐竿跳喔 02/02 23:48

→ followwar 傻眼..PTX是NV跨架構的膠水語言哪有啥繞過NV== 02/02 23:53

推 ilovebig99 難怪open AI會說自己站錯邊，開源真的很猛 02/03 00:31

推 Brioni 不是繞過，而是研究NV架構比其他家透徹 02/03 01:11

→ Brioni 從開發框架到主要架構都有一定掌握 02/03 01:12

推 ndilavril 現在怕的是萬一用低階GPU就可以達到OPEN AI 02/03 03:04

→ ndilavril 高階顯卡會有賣不掉的疑慮 02/03 03:04

噓 bhmagic 疊帶習大大你字打錯了 02/03 06:06

噓 mdkn35 迭代吧？樓上是習大大的秘書？ 02/03 07:43

推 guanting886 這個就跟某些廠商拼時間魔改java把某些拿掉執行速 02/03 08:27

→ guanting886 度一樣但後面新的語言足以做到ex: Rust 公司團隊 02/03 08:27

→ guanting886 就重新改寫切過去了不可能再折磨自己用魔改版本維 02/03 08:27

→ guanting886 護系統 02/03 08:27

→ guanting886 用PTX寫這些東西不要CUDA自己干涉由自己決定所有 02/03 08:29

→ guanting886 事這個要考慮團隊經營跟當時時空的環境有什麼條件 02/03 08:29

→ guanting886 你往更低階的寫所有條件會更難維護或非常考驗的開 02/03 08:31

→ guanting886 發團隊的經驗但真的會變得更窄 02/03 08:31

→ guanting886 團隊成員拿翹你就知道問題會變成什麼樣 02/03 08:31

→ guanting886 我相信r1能如此成 PTX不會是最大功勞 02/03 08:33