[新聞] OpenAI內部人士：有證據顯示DeepSeek盜

作者ng101281 ()

標題[新聞] OpenAI內部人士：有證據顯示DeepSeek盜

時間Wed Jan 29 21:03:16 2025

原文標題： OpenAI內部人士：有證據顯示DeepSeek盜用我們的模型原文連結： https://reurl.cc/WAgO0e 發布時間： 2025-01-29 15:10 / 作者陳家齊原文內容：中國新創企業的DeepSeek AI引擎，對美國矽谷造成大震撼，因為號稱用幾十分之一的成本、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導，OpenAI內部人士指出，他們有證據顯示DeepSeek使用「蒸餾」（distillation）的技巧，盜用OpenAI的成果。「蒸餾」這個技法是AI開發者常用的技術，這是利用其他更大AI模型所計算輸出的結果，訓練自己開發中的較小AI模型。如果《金融時報》的報導獲得證實，則DeepSeek可以用極低算力、極低成本達成媲美OpenAI等級的成果，就不再是個謎：DeepSeek等於是寄生在OpenAI身上，自然不必自己投入大成本建構算力。 OpenAI的服務條款規定，使用者不得「複製」其任何服務，或「使用OpenAI的輸出結果來開發與OpenAI 競爭的模型」。DeepSeek若利用了OpenAI開發出DeepSeek-R1這個震驚各界、和 OpenAI競爭的模型，就違反了使用條款。據另一名知情人士透露，OpenAI 及其合作夥伴微軟去年秋天調查了據信屬於DeepSeek的帳戶，這些帳戶使用了OpenAI的API（應用程式介面），以違反服務條款的方式進行蒸餾，遭到封鎖。這些調查最早由彭博新聞報導。 DeepSeek表示，其V3 AI模型僅使用2048張輝達H800顯示卡，只花費560萬美元進行訓練，擁有6710億個參數，成本僅為OpenAI和Google類似規模模型的幾十分之一。部分專家指出，DeepSeek模型的輸出結果，顯示其可能接受過OpenAI GPT-4輸出的內容訓練，這違反OpenAI的服務條款。業界人士指出，在中國和美國的AI實驗室中，使用來自OpenAI 等大型AI企業的輸出進行訓練是常見做法，較小型的企業往往藉此「搭便車」。對於OpenAI這些最前線的AI模型開發公司而言，他們必須耗費金錢與心力搭建龐大的算力中心，接受人工輸入的反饋，以訓練出更好的AI模型。這個過程耗時而且非常昂貴。加州柏克萊大學（UC Berkeley）AI博士生古普塔（Ritwik Gupta）表示：「新創公司和學術界普遍會使用商業化的大型語言模型（LLM），像是ChatGPT的輸出，來訓練自己的模型。這樣一來，他們便能免費獲得人類回饋訓練的結果。我不會驚訝DeepSeek採用了相同方法。如果確實如此，要完全杜絕這種做法可能相當困難。心得/評論：幾天之內一下捧上天一下又人人攻擊還好台股過年可以停看聽一下不然差點 DeepSeek引力抓不住你 ---- Sent from BePTT on my Google Pixel 6 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.215.56.15 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Stock/M.1738155800.A.7A9.html ※ 編輯: ng101281 (49.215.56.15 臺灣), 01/29/2025 21:08:11

推文 (202)

噓 ggian123 Close Ai輸不起就別玩 01/29 21:04

推 etset 中又贏遙遙領先遙遙領先 01/29 21:04

推 cosmite 穩了 01/29 21:04

推 loopdiuretic 抗議他學我？ 01/29 21:04

推 gino0717 這又是哪家野雞雜誌 01/29 21:05

推 KISS1979 有一群人崩潰精神錯亂了 01/29 21:05

噓 s1612316 等等盜用？要不要先定義什麼是盜用 01/29 21:05

噓 liscp 等等這串所有的中國id 通通水桶 01/29 21:07

推 alau 人家有明文規定不能拿API來訓練模型吧？ 01/29 21:08

→ tradeent 蒸餾不等於盜用 01/29 21:08

→ tradeent 然後蒸餾不代表成績就會好 01/29 21:09

→ tradeent 最後是蒸餾在現行法律不違法 01/29 21:09

推 fool5566 http://i.imgur.com/Wgh1BHF.jpg 01/29 21:09

推 gbman google表示以後搜尋引擎自己開發不要用我的CC 01/29 21:09

→ fool5566 http://i.imgur.com/3c1frTP.jpg 01/29 21:09

推 hihi29 美國輸不起好扯== 01/29 21:09

→ ethan0419 只有我覺得結果是如何根本不重要嗎 01/29 21:10

推 ketter 兩天就翻車，比黑悟空還快～ 01/29 21:11

→ bobokeke 大紀元還是新唐人？ 01/29 21:12

→ amd3dnow '蒸餾'又是哪個文組發明的詞?? 01/29 21:12

噓 set852064 急了.jpg 01/29 21:12

推 tonyparker18 牆倒眾人推 01/29 21:13

推 gsc0478 買空賣空所以只能算是一支介面程式 01/29 21:13

→ gbman 這樣玩就能贏!那OPENAI真的爛CC 01/29 21:14

推 Homeparty 原本就打算美國1個人可以寫10個人程式，中國再會99 01/29 21:15

→ Homeparty 6也贏不了。 01/29 21:15

→ acake 蒸溜是專業術語好嗎 01/29 21:17

→ fashsboy 把證據拿出來阿= = 01/29 21:18

→ linzero 可能也知道也可能告不贏或者告了也不能怎樣，但也算 01/29 21:19

→ linzero 一種表態、證明 01/29 21:19

→ Jeff1989 等等支那賤畜韭菜們會出來洗地XD 01/29 21:19

推 bobogei81123 我也覺得distill直接翻蒸餾很搞笑 01/29 21:21

推 paericsson 中國玩得真溜～～ 01/29 21:21

推 bighouse 不意外 01/29 21:22

→ linzero 以前好像就有人翻譯用蒸餾了 01/29 21:22

→ liu1030 distill學術界很常用阿 01/29 21:22

→ Leo4891 不論有沒有盜用肯定的是 ds也是得靠前人研究成果 01/29 21:22

→ Leo4891 才能再進步 01/29 21:22

推 repast 垃圾支那不意外還一堆低能兒在吹 01/29 21:23

→ easonli000 聽起來像是稱讚DS的自我監督技巧有效 01/29 21:24

→ bobogei81123 OpenAI的TOS是真的有說不能用ChatGPT的結果來訓練別 01/29 21:25

→ bobogei81123 的AI 但之前有判例完全由AI產的東西沒有Copyright 01/29 21:25

→ bobogei81123 應該是告不太成 01/29 21:25

噓 sspider0829 笑死 01/29 21:26

→ set852064 所以證據要公佈了嗎？還是苦無？ 01/29 21:26

推 square 美國輸不起笑死 01/29 21:26

推 gbman 要告google就告拉CC 01/29 21:26

推 Wand 「DS是站在巨人的肩膀上」「證據呢」呵呵 01/29 21:26

推 tonyparker18 拉回就是跟你買的很多人搞不清楚還在泡沫 01/29 21:27

推 c1951 程式碼完全開源找一下就可以知道哪條程式碼在搞鬼 01/29 21:27

推 finly1023 輸不起翻桌 01/29 21:27

推 horseorange 笑死有人看不懂就說人文組 01/29 21:28

推 s213092921 開始抹黑了，熟悉的套路XDD 01/29 21:28

推 gbman DS自己有講有用開源AI訓練!不只OPENAI 01/29 21:28

推 eric112 那如果是這樣頂尖AI公司也沒有技術護城河，隨便都 01/29 21:28

→ eric112 可以被蒸餾也沒辦法禁止這樣誰還要花大錢去訓練， 01/29 21:28

→ eric112 而且在中國根本無法可管 01/29 21:28

噓 basslife 北七一堆AI都馬盜用你的東西怎不說 01/29 21:28

→ brain9453 你們的人要不要打一架風向很亂 01/29 21:28

推 firemothra 蛤？是不是真的怕了？ 01/29 21:29

→ s213092921 https://i.imgur.com/zu8RQAC.jpg 01/29 21:29

推 sellgd 你自己生成式AI沒盜用網路上圖文創作內容? 01/29 21:30

推 strlen 其實這一直是有問題的地方到底AI公司隨便抓資料訓 01/29 21:30

→ strlen 練版權問題到底該怎麼算？ 01/29 21:31

推 eric112 那openAI乾脆開放給大家既然沒辦法防止 01/29 21:31

推 KTFGU 這樣就可以名正言順的美國封鎖中國軟體了 01/29 21:31

推 gbman 管你的!當然爽爽免費用最好阿XD 01/29 21:31

推 Acce0912 急了 01/29 21:33

噓 matlab1106 這不就鄉民常用的跟我想的一樣？ 01/29 21:33

推 uniz DS承認是用Chtgpt的http://i.imgur.com/A0TL3C8.jpg 01/29 21:33

推 bobogei81123 可以看這篇 https://tinyurl.com/yda2aten 01/29 21:33

→ linzero 使用蒸餾的情況跟AI未經授權抓資料來訓練不一樣吧？ 01/29 21:33

→ gbman 美國就閉源啊!開源還怕人家用!就關門自己玩CC 01/29 21:34

→ bobogei81123 作者有提到 distillation 讓先出的 model 頗吃虧 01/29 21:34

→ strlen 只要你資料是來自於其它地方就是會有問題 01/29 21:34

→ strlen 除非你有一個一個的去跟資料擁有者拿版權 01/29 21:34

推 xzcb2008 說越多越慘歐資本已經動搖了 01/29 21:35

→ strlen 但這幾乎沒有一間AI公司做到版權到底怎麼算 01/29 21:35

→ xzcb2008 看今晚就知道了 01/29 21:35

→ strlen OpenAI Meta Google xAI一眾都有問題 01/29 21:35

推 joke3547 所以證明是真的但是是抄你們的？ 01/29 21:36

推 eric112 所以這種東西就是沒有技術護城河，你砸錢也沒辦法 01/29 21:36

→ eric112 防止被偷，而且那些東西本來就來自普羅大眾 01/29 21:36

→ bobogei81123 我猜以後 OpenAI 再出更強的 model 可能就不放出來 01/29 21:36

→ bobogei81123 給每個人用了變成要用的公司分別來簽約了 01/29 21:36

→ strlen 拿他們的東西作訓練也有問題 01/29 21:36

推 ian01050 蒸餾是深度學習的技巧不懂的文組不要亂叫可以嗎… 01/29 21:36

→ strlen 但我看大概也沒人管沒辦法管吧 01/29 21:36

推 gm3252 中國不意外 01/29 21:36

噓 squelch 內部人士是誰啊要放話就公司公開宣告啊 01/29 21:37

→ linzero 證明是蒸餾的話，可以說這種模式本就會省時省力，就 01/29 21:37

推 set852064 感覺說愈多愈顯得... 01/29 21:37

推 jcwang 理組申請蒸餾專利了？ 01/29 21:37

→ linzero 可以跟金主跟美國政府表示我們不是在浪費錢砸算力 01/29 21:38

推 Nighty7222 上次騰訊才把別人的程式碼整個copy回來用被抓包。算 01/29 21:38

→ Nighty7222 了吧 01/29 21:38

噓 stanleyplus 中又贏麻 01/29 21:38

推 xzcb2008 如果他不開放那怎麼繼續圈資本這棋很難下了 01/29 21:39

推 a0913 蒸餾不是支語 01/29 21:39

推 a0808996 ai公司網路上一直撈資料也沒問過人阿~ 01/29 21:39

→ xzcb2008 對岸就是要你為畏縮縮玩不是嗎 01/29 21:41

推 rayisgreat 要回噴了！！！ 01/29 21:41

→ ra88872 這是做空嗎？盜用還是內賊差很多，盜用的話open ai 01/29 21:41

→ ra88872 麻煩可大了。 01/29 21:41

→ linzero 撈資料跟蒸餾雖然都可以說是未經允許，但本質上不同 01/29 21:42

推 joke3547 Transformer 開發團隊表示：那我是不是...欸？！ 01/29 21:42

推 qxpbyd 很難證明吧這史無前例 01/29 21:42

推 gbman 不是有人說次DS是開源的勝利!有點意思CC 01/29 21:42

推 a0808996 ds開源道德上已經占盡優勢了 01/29 21:43

→ linzero 有點不洽當比方，撈資料是撈食材，蒸餾是學烹飪技巧 01/29 21:43

→ a0808996 我沒私藏大家一起成長 01/29 21:43

→ liscp Ds 幫openai 開源潮到出水 01/29 21:44

→ c00jsw00 那個內部人士不敢具名 87 01/29 21:44

推 dosiris OpenAI也挖了不少中國網頁的資料吧 01/29 21:44

→ a0808996 歡迎COPY 01/29 21:44

推 SYMS 輸不起，翻桌了 01/29 21:45

推 ohlong 急了 01/29 21:45

→ qxpbyd https://i.imgur.com/gBzps4A.png DS員工的解釋看 01/29 21:45

噓 aa00788 中吹崩潰了 01/29 21:45

→ qxpbyd 你信誰囉 01/29 21:45

噓 laogiby 白豬又要耍賴了哭R 01/29 21:47

推 tw12321 呵。那人家成本低是事實也是青出於藍 01/29 21:47

推 a0808996 對岸也沒再管版權的 01/29 21:47

推 Aliensoul 這是做新聞給股市看的吧 01/29 21:48

→ a0808996 偷了魔改你能怎樣 01/29 21:48

推 joke3547 確實也管不到對岸，嘻嘻 01/29 21:48

推 tim855042 支那要人要崩潰了吹2天的泡泡就破了 01/29 21:49

→ linzero 當初鴻蒙不是就replace不夠乾淨嗎？ 01/29 21:49

推 DrowningPool Jordan表示：first time？ 01/29 21:50

推 jhihheng 早說了詐騙垃圾 01/29 21:51

→ fywei ds就是垃圾 01/29 21:52

→ pikaaco 就算是也沒辦法怎樣吧中國有在怕的嗎 01/29 21:54

推 luten 我比較喜歡翻成「雙修」 01/29 21:54

→ iamfreefrog 這應該會是川普決心玩死中國的最後一根稻草 01/29 21:56

推 kdh 開源程式直接拿來驗證就知道了 01/29 21:57

推 Sashaaaa 中國人不意外 01/29 21:58

→ lmc66 中國哪個東西不是偷來的學術界本來就特別寬容中國 01/29 21:58

→ lmc66 的盜竊行為 01/29 21:58

→ s0920151048 駐版台吹興奮了 01/29 22:01

推 low1219 Open AI 沒有Open ，太陽餅裡面沒有太陽。 01/29 22:01

噓 stanleyplus 誰玩誰還不知道XDD 01/29 22:02

推 tcypost 看人解釋DS，本來裡面就公開說是用蒸餾的啊 01/29 22:04

推 lmc66 蒸餾就是違反OpenAI使用守則啊就是偷啊就不是他 01/29 22:07

→ lmc66 們在吹的”從零開始” 01/29 22:07

推 tonylolz 等下就告訴你誰崩潰囉 01/29 22:08

推 phoenixtwo 不意外中國那次遙遙領先不是這樣 01/29 22:08

→ flipflap 遙遙領先中或贏雙贏就是中國贏兩次 01/29 22:12

→ ev331 OPENAI的金主爸爸微軟不缺錢吧 01/29 22:12

推 rex03187 蒸餾代表你省去從海量垃圾資料去判斷的過程 01/29 22:16

推 polaroidd 又要抽稅了嗎 01/29 22:16

推 rickyhoney 還沒上車啊，別那麼快恢複 01/29 22:18

推 strlen 呃...DS員工那對話...是在證實他的AI輸出都幻覺嗎 01/29 22:19

→ strlen 哪個內鬼截這白癡圖啊？應該是假的 01/29 22:19

噓 mangle 輿論一條龍來了可憐啊 01/29 22:20

噓 lovepork 重新定義盜用? 01/29 22:21

噓 zombiepigman 滯台支那人急著洗地中 01/29 22:21

推 qxpbyd 現在哪個AI沒有幻覺推薦一下 01/29 22:23

→ a134 1500excel 即時感 01/29 22:24

→ qxpbyd OpenAI的轉錄語音的都有Whisper了 01/29 22:24

→ qxpbyd whisper模型幻覺 01/29 22:25

→ alphish 中國人用英文寫程式怎樣都是抄襲英美 01/29 22:25

→ qxpbyd 那是TG公開頻道 01/29 22:26

推 eelse 用你的連結套個皮就是新的AI了，中國式創新 01/29 22:28

推 milandi 中國豬: 輸不起啦 ~~~ 01/29 22:34

→ FatFatQQ 美國也開始維穩了嗎真滑稽 01/29 22:35

→ FatFatQQ https://i.imgur.com/wMkV5yP.jpeg 01/29 22:35

推 Lhmstu 美國公司怕了XD，不過中國應該不屌才對 01/29 22:35

推 s10112 笑死那CLOSEAI不就盜用全網民資料真是畜生一隻 01/29 22:37

→ NEWinx 中國不偷才是新聞吧 01/29 22:41

噓 Bachack000 中國意外嗎？騙、偷、搶樣樣來 01/29 22:47

噓 pttouch 不知道要說啥，我是覺得不用一直洗一直洗一直洗一 01/29 22:49

→ pttouch 直洗一直洗一直洗一直洗一直洗一直洗一直洗一直洗 01/29 22:49

→ pttouch 一直洗一直洗一直洗一直洗一直洗一直洗一直洗一直 01/29 22:49

→ pttouch 洗一直洗一直洗一直洗一直洗一直洗 01/29 22:49

推 copybrown 哪個內部人士？笑死 01/29 22:49

推 black205 說一直洗的搞笑人士不如趕快把ChatDPP弄回來啊 01/29 22:51

→ black205 不知道要說啥改說說廢物唐部長拿兩百億做什麼垃圾 01/29 22:51

噓 bitcch 一堆無腦言論一堆公開paper都在做連Google都在玩 01/29 22:54

→ bitcch 蒸餾本來就是正常的模型壓縮技術只是這次ds做的特 01/29 22:55

→ bitcch 好 01/29 22:55

推 pttouch 看不懂這是在炒股的搞笑人士請不要又泛政治化…這 01/29 23:23

→ pttouch 就是在話題炒股，韭菜不要在那邊什麼都要滑坡好嗎 01/29 23:23

→ pttouch == 01/29 23:23

→ Chien996 綠蝇精神勝利法很在意台灣輸慘XD 01/29 23:24

推 takeda3234 如果繼續蒸餾下去硬體成本是不是會變越低就能達成 01/29 23:26

推 pttouch 哇靠我還左轉出去看吧我是不是在股版，奇怪了明明 01/29 23:27

→ pttouch 是在討論股票的事情，係咧== 01/29 23:27

推 jason613 那明天劇本是 deepsuck 01/29 23:59

推 noseng 這次……兩天?……果然還是無視就好 01/30 00:09

→ stanleyplus 多蛙丸子 01/30 00:18

噓 sanos168 哈哈哈.果然是畝產萬斤糧的翻版，什麼最節省成本.. 01/30 00:48

→ logitech2004 大家都是這樣做的好嗎？ 01/30 00:53

→ solarem 嘻嘻就說你是抄的有美國可以抄襲中國要懂的感激 01/30 00:54

推 ljh109 中吹又要森七七了 01/30 02:08

→ Brioni 現在最燒屁股的是星門專案吧，投資機構一個閃現就變 01/30 03:12

→ Brioni 閉門專案 01/30 03:12

推 mdkn35 結果還真的被說對了？柵欄仔又翻了？ 01/30 06:53

→ NexusPrime 學術研究的paper用蒸餾沒問題啊，但是你DS是商業化 01/30 09:31

→ NexusPrime 的app 01/30 09:31

推 SRNOB 開源免費的什麼商業化zz 01/30 10:36

推 sid3 他抄襲我的髮型 01/30 15:32

推 adamyang2000 打炮也是抄襲A片學來的 01/30 20:31