原文標題:
OpenAI內部人士:有證據顯示DeepSeek盜用我們的模型
原文連結:
https://reurl.cc/WAgO0e
發布時間:
2025-01-29 15:10 / 作者 陳家齊
原文內容:
中國新創企業的DeepSeek AI引擎,對美國矽谷造成大震撼,因為號稱用幾十分之一的成本
、很少的算力就能達到與業界龍頭OpenAI同等級的成果。《金融時報》報導,OpenAI內部人
士指出,他們有證據顯示DeepSeek使用「蒸餾」(distillation)的技巧,盜用OpenAI的成
果。
「蒸餾」這個技法是AI開發者常用的技術,這是利用其他更大AI模型所計算輸出的結果,訓
練自己開發中的較小AI模型。如果《金融時報》的報導獲得證實,則DeepSeek可以用極低算
力、極低成本達成媲美OpenAI等級的成果,就不再是個謎:DeepSeek等於是寄生在OpenAI身
上,自然不必自己投入大成本建構算力。
OpenAI的服務條款規定,使用者不得「複製」其任何服務,或「使用OpenAI的輸出結果來開
發與OpenAI 競爭的模型」。DeepSeek若利用了OpenAI開發出DeepSeek-R1這個震驚各界、和
OpenAI競爭的模型,就違反了使用條款。
據另一名知情人士透露,OpenAI 及其合作夥伴微軟去年秋天調查了據信屬於DeepSeek的帳
戶,這些帳戶使用了OpenAI的API(應用程式介面),以違反服務條款的方式進行蒸餾,遭
到封鎖。這些調查最早由彭博新聞報導。
DeepSeek表示,其V3 AI模型僅使用2048張輝達H800顯示卡,只花費560萬美元進行訓練,擁
有6710億個參數,成本僅為OpenAI和Google類似規模模型的幾十分之一。
部分專家指出,DeepSeek模型的輸出結果,顯示其可能接受過OpenAI GPT-4輸出的內容訓練
,這違反OpenAI的服務條款。業界人士指出,在中國和美國的AI實驗室中,使用來自OpenAI
等大型AI企業的輸出進行訓練是常見做法,較小型的企業往往藉此「搭便車」。
對於OpenAI這些最前線的AI模型開發公司而言,他們必須耗費金錢與心力搭建龐大的算力中
心,接受人工輸入的反饋,以訓練出更好的AI模型。這個過程耗時而且非常昂貴。
加州柏克萊大學(UC Berkeley)AI博士生古普塔(Ritwik Gupta)表示:「新創公司和學
術界普遍會使用商業化的大型語言模型(LLM),像是ChatGPT的輸出,來訓練自己的模型。
這樣一來,他們便能免費獲得人類回饋訓練的結果。我不會驚訝DeepSeek採用了相同方法。
如果確實如此,要完全杜絕這種做法可能相當困難。
心得/評論:
幾天之內 一下捧上天 一下又人人攻擊
還好台股過年可以停看聽一下
不然差點 DeepSeek引力抓不住你
----
Sent from BePTT on my Google Pixel 6
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.215.56.15 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1738155800.A.7A9.html
※ 編輯: ng101281 (49.215.56.15 臺灣), 01/29/2025 21:08:11
推文 (202)
噓
ggian123
Close Ai輸不起就別玩
01/29 21:04
推
etset
中又贏 遙遙領先 遙遙領先
01/29 21:04
推
cosmite
穩了
01/29 21:04
推
loopdiuretic
抗議 他學我?
01/29 21:04
推
gino0717
這又是哪家野雞雜誌
01/29 21:05
推
KISS1979
有一群人崩潰精神錯亂了
01/29 21:05
噓
s1612316
等等 盜用?要不要先定義什麼是盜用
01/29 21:05
噓
liscp
等等這串所有的中國id 通通水桶
01/29 21:07
推
alau
人家有明文規定不能拿API來訓練模型吧?
01/29 21:08
→
tradeent
蒸餾不等於盜用
01/29 21:08
→
tradeent
然後蒸餾不代表成績就會好
01/29 21:09
→
tradeent
最後是蒸餾在現行法律不違法
01/29 21:09
推
fool5566
http://i.imgur.com/Wgh1BHF.jpg
01/29 21:09
推
gbman
google表示以後搜尋引擎自己開發不要用我的CC
01/29 21:09
→
fool5566
http://i.imgur.com/3c1frTP.jpg
01/29 21:09
推
hihi29
美國輸不起 好扯==
01/29 21:09
→
ethan0419
只有我覺得結果是如何根本不重要嗎
01/29 21:10
推
ketter
兩天就翻車,比黑悟空還快~
01/29 21:11
→
bobokeke
大紀元還是新唐人?
01/29 21:12
→
amd3dnow
'蒸餾'又是哪個文組發明的詞??
01/29 21:12
噓
set852064
急了.jpg
01/29 21:12
推
tonyparker18
牆倒眾人推
01/29 21:13
推
gsc0478
買空賣空 所以只能算是一支介面程式
01/29 21:13
→
gbman
這樣玩就能贏!那OPENAI真的爛CC
01/29 21:14
推
Homeparty
原本就打算美國1個人可以寫10個人程式,中國再會99
01/29 21:15
→
Homeparty
6也贏不了。
01/29 21:15
→
acake
蒸溜是專業術語好嗎
01/29 21:17
→
fashsboy
把證據拿出來阿= =
01/29 21:18
→
linzero
可能也知道也可能告不贏或者告了也不能怎樣,但也算
01/29 21:19
→
linzero
一種表態、證明
01/29 21:19
→
Jeff1989
等等支那賤畜韭菜們會出來洗地XD
01/29 21:19
推
bobogei81123
我也覺得distill直接翻蒸餾很搞笑
01/29 21:21
推
paericsson
中國玩得真溜~~
01/29 21:21
推
bighouse
不意外
01/29 21:22
→
linzero
以前好像就有人翻譯用蒸餾了
01/29 21:22
→
liu1030
distill學術界很常用阿
01/29 21:22
→
Leo4891
不論有沒有盜用 肯定的是 ds也是得靠前人研究成果
01/29 21:22
→
Leo4891
才能再進步
01/29 21:22
推
repast
垃圾支那不意外 還一堆低能兒在吹
01/29 21:23
→
easonli000
聽起來像是稱讚DS的自我監督技巧有效
01/29 21:24
→
bobogei81123
OpenAI的TOS是真的有說不能用ChatGPT的結果來訓練別
01/29 21:25
→
bobogei81123
的AI 但之前有判例完全由AI產的東西沒有Copyright
01/29 21:25
→
bobogei81123
應該是告不太成
01/29 21:25
噓
sspider0829
笑死
01/29 21:26
→
set852064
所以證據要公佈了嗎?還是苦無?
01/29 21:26
推
square
美國輸不起 笑死
01/29 21:26
推
gbman
要告google就告拉CC
01/29 21:26
推
Wand
「DS是站在巨人的肩膀上」「證據呢」呵呵
01/29 21:26
推
tonyparker18
拉回就是跟你買的 很多人搞不清楚 還在泡沫
01/29 21:27
推
c1951
程式碼完全開源 找一下就可以知道哪條程式碼在搞鬼
01/29 21:27
推
finly1023
輸不起翻桌
01/29 21:27
推
horseorange
笑死 有人看不懂就說人文組
01/29 21:28
推
s213092921
開始抹黑了,熟悉的套路XDD
01/29 21:28
推
gbman
DS自己有講有用開源AI訓練!不只OPENAI
01/29 21:28
推
eric112
那如果是這樣頂尖AI公司也沒有技術護城河,隨便都
01/29 21:28
→
eric112
可以被蒸餾也沒辦法禁止這樣誰還要花大錢去訓練,
01/29 21:28
→
eric112
而且在中國根本無法可管
01/29 21:28
噓
basslife
北七 一堆AI都馬盜用你的東西怎不說
01/29 21:28
→
brain9453
你們的人 要不要打一架 風向很亂
01/29 21:28
推
firemothra
蛤?是不是真的怕了?
01/29 21:29
→
s213092921
https://i.imgur.com/zu8RQAC.jpg
01/29 21:29
推
sellgd
你自己生成式AI沒盜用網路上圖文創作內容?
01/29 21:30
推
strlen
其實這一直是有問題的地方 到底AI公司隨便抓資料訓
01/29 21:30
→
strlen
練版權問題到底該怎麼算?
01/29 21:31
推
eric112
那openAI乾脆開放給大家既然沒辦法防止
01/29 21:31
推
KTFGU
這樣就可以名正言順的 美國封鎖中國軟體了
01/29 21:31
推
gbman
管你的!當然爽爽免費用最好阿XD
01/29 21:31
推
Acce0912
急了
01/29 21:33
噓
matlab1106
這不就鄉民常用的跟我想的一樣?
01/29 21:33
推
uniz
DS承認是用Chtgpt的http://i.imgur.com/A0TL3C8.jpg
01/29 21:33
推
bobogei81123
可以看這篇 https://tinyurl.com/yda2aten
01/29 21:33
→
linzero
使用蒸餾的情況跟AI未經授權抓資料來訓練不一樣吧?
01/29 21:33
→
gbman
美國就閉源啊!開源還怕人家用!就關門自己玩CC
01/29 21:34
→
bobogei81123
作者有提到 distillation 讓先出的 model 頗吃虧
01/29 21:34
→
strlen
只要你資料是來自於其它地方 就是會有問題
01/29 21:34
→
strlen
除非你有一個一個的去跟資料擁有者拿版權
01/29 21:34
推
xzcb2008
說越多越慘歐 資本已經動搖了
01/29 21:35
→
strlen
但這幾乎沒有一間AI公司做到 版權到底怎麼算
01/29 21:35
→
xzcb2008
看今晚就知道了
01/29 21:35
→
strlen
OpenAI Meta Google xAI一眾都有問題
01/29 21:35
推
joke3547
所以證明是真的但是是抄你們的?
01/29 21:36
推
eric112
所以這種東西就是沒有技術護城河,你砸錢也沒辦法
01/29 21:36
→
eric112
防止被偷,而且那些東西本來就來自普羅大眾
01/29 21:36
→
bobogei81123
我猜以後 OpenAI 再出更強的 model 可能就不放出來
01/29 21:36
→
bobogei81123
給每個人用了 變成要用的公司分別來簽約了
01/29 21:36
→
strlen
拿他們的東西作訓練 也有問題
01/29 21:36
推
ian01050
蒸餾是深度學習的技巧 不懂的文組不要亂叫可以嗎…
01/29 21:36
→
strlen
但我看大概也沒人管 沒辦法管吧
01/29 21:36
推
gm3252
中國不意外
01/29 21:36
噓
squelch
內部人士是誰啊 要放話就公司公開宣告啊
01/29 21:37
→
linzero
證明是蒸餾的話,可以說這種模式本就會省時省力,就
01/29 21:37
推
set852064
感覺說愈多愈顯得...
01/29 21:37
推
jcwang
理組申請蒸餾專利了?
01/29 21:37
→
linzero
可以跟金主跟美國政府表示我們不是在浪費錢砸算力
01/29 21:38
推
Nighty7222
上次騰訊才把別人的程式碼整個copy回來用被抓包。算
01/29 21:38
→
Nighty7222
了吧
01/29 21:38
噓
stanleyplus
中又贏麻
01/29 21:38
推
xzcb2008
如果他不開放 那怎麼繼續圈資本 這棋很難下了
01/29 21:39
推
a0913
蒸餾不是支語
01/29 21:39
推
a0808996
ai公司 網路上一直撈資料 也沒問過人阿~
01/29 21:39
→
xzcb2008
對岸就是要你為畏縮縮玩不是嗎
01/29 21:41
推
rayisgreat
要回噴了!!!
01/29 21:41
→
ra88872
這是做空嗎?盜用還是內賊差很多,盜用的話open ai
01/29 21:41
→
ra88872
麻煩可大了。
01/29 21:41
→
linzero
撈資料跟蒸餾雖然都可以說是未經允許,但本質上不同
01/29 21:42
推
joke3547
Transformer 開發團隊表示:那我是不是...欸?!
01/29 21:42
推
qxpbyd
很難證明吧 這史無前例
01/29 21:42
推
gbman
不是有人說次DS是開源的勝利!有點意思CC
01/29 21:42
推
a0808996
ds開源 道德上已經占盡優勢了
01/29 21:43
→
linzero
有點不洽當比方,撈資料是撈食材,蒸餾是學烹飪技巧
01/29 21:43
→
a0808996
我沒私藏 大家一起成長
01/29 21:43
→
liscp
Ds 幫openai 開源 潮到出水
01/29 21:44
→
c00jsw00
那個內部人士 不敢具名 87
01/29 21:44
推
dosiris
OpenAI也挖了不少中國網頁的資料吧
01/29 21:44
→
a0808996
歡迎COPY
01/29 21:44
推
SYMS
輸不起,翻桌了
01/29 21:45
推
ohlong
急了
01/29 21:45
→
qxpbyd
https://i.imgur.com/gBzps4A.png DS員工的解釋 看
01/29 21:45
噓
aa00788
中吹崩潰了
01/29 21:45
→
qxpbyd
你信誰囉
01/29 21:45
噓
laogiby
白豬又要耍賴了 哭R
01/29 21:47
推
tw12321
呵。那人家成本低是事實也是青出於藍
01/29 21:47
推
a0808996
對岸也沒再管版權的
01/29 21:47
推
Aliensoul
這是做新聞給股市看的吧
01/29 21:48
→
a0808996
偷了魔改 你能怎樣
01/29 21:48
推
joke3547
確實也管不到對岸,嘻嘻
01/29 21:48
推
tim855042
支那要人要崩潰了 吹2天的泡泡就破了
01/29 21:49
→
linzero
當初鴻蒙不是就replace不夠乾淨嗎?
01/29 21:49
推
DrowningPool
Jordan表示:first time?
01/29 21:50
推
jhihheng
早說了 詐騙垃圾
01/29 21:51
→
fywei
ds就是垃圾
01/29 21:52
→
pikaaco
就算是也沒辦法怎樣吧 中國有在怕的嗎
01/29 21:54
推
luten
我比較喜歡翻成「雙修」
01/29 21:54
→
iamfreefrog
這應該會是川普決心玩死中國的最後一根稻草
01/29 21:56
推
kdh
開源程式直接拿來驗證就知道了
01/29 21:57
推
Sashaaaa
中國人不意外
01/29 21:58
→
lmc66
中國哪個東西不是偷來的 學術界本來就特別寬容中國
01/29 21:58
→
lmc66
的盜竊行為
01/29 21:58
→
s0920151048
駐版台吹興奮了
01/29 22:01
推
low1219
Open AI 沒有Open ,太陽餅裡面沒有太陽。
01/29 22:01
噓
stanleyplus
誰玩誰還不知道XDD
01/29 22:02
推
tcypost
看人解釋DS,本來裡面就公開說是用蒸餾的啊
01/29 22:04
推
lmc66
蒸餾就是違反OpenAI使用守則啊 就是偷啊 就不是他
01/29 22:07
→
lmc66
們在吹的”從零開始”
01/29 22:07
推
tonylolz
等下就告訴你誰崩潰囉
01/29 22:08
推
phoenixtwo
不意外 中國那次遙遙領先不是這樣
01/29 22:08
→
flipflap
遙遙領先 中或贏 雙贏就是中國贏兩次
01/29 22:12
→
ev331
OPENAI的金主爸爸微軟不缺錢吧
01/29 22:12
推
rex03187
蒸餾代表你省去從海量垃圾資料去判斷的過程
01/29 22:16
推
polaroidd
又要抽稅了嗎
01/29 22:16
推
rickyhoney
還沒上車啊,別那麼快恢複
01/29 22:18
推
strlen
呃...DS員工那對話...是在證實他的AI輸出都幻覺嗎
01/29 22:19
→
strlen
哪個內鬼截這白癡圖啊?應該是假的
01/29 22:19
噓
mangle
輿論一條龍來了 可憐啊
01/29 22:20
噓
lovepork
重新定義盜用?
01/29 22:21
噓
zombiepigman
滯台支那人急著洗地中
01/29 22:21
推
qxpbyd
現在哪個AI沒有幻覺 推薦一下
01/29 22:23
→
a134
1500excel 即時感
01/29 22:24
→
qxpbyd
OpenAI的轉錄語音的都有Whisper了
01/29 22:24
→
qxpbyd
whisper模型 幻覺
01/29 22:25
→
alphish
中國人用英文寫程式 怎樣都是抄襲英美
01/29 22:25
→
qxpbyd
那是TG公開頻道
01/29 22:26
推
eelse
用你的連結套個皮就是新的AI了,中國式創新
01/29 22:28
推
milandi
中國豬: 輸不起啦 ~~~
01/29 22:34
→
FatFatQQ
美國也開始維穩了嗎 真滑稽
01/29 22:35
→
FatFatQQ
https://i.imgur.com/wMkV5yP.jpeg
01/29 22:35
推
Lhmstu
美國公司怕了XD,不過中國應該不屌才對
01/29 22:35
推
s10112
笑死 那CLOSEAI不就盜用全網民資料 真是畜生一隻
01/29 22:37
→
NEWinx
中國不偷才是新聞吧
01/29 22:41
噓
Bachack000
中國意外嗎?騙、偷、搶樣樣來
01/29 22:47
噓
pttouch
不知道要說啥,我是覺得不用一直洗一直洗一直洗一
01/29 22:49
→
pttouch
直洗一直洗一直洗一直洗一直洗一直洗一直洗一直洗
01/29 22:49
→
pttouch
一直洗一直洗一直洗一直洗一直洗一直洗一直洗一直
01/29 22:49
→
pttouch
洗一直洗一直洗一直洗一直洗一直洗
01/29 22:49
推
copybrown
哪個內部人士?笑死
01/29 22:49
推
black205
說一直洗的搞笑人士不如趕快把ChatDPP弄回來啊
01/29 22:51
→
black205
不知道要說啥 改說說廢物唐部長拿兩百億做什麼垃圾
01/29 22:51
噓
bitcch
一堆無腦言論 一堆公開paper都在做 連Google都在玩
01/29 22:54
→
bitcch
蒸餾本來就是正常的模型壓縮技術 只是這次ds做的特
01/29 22:55
→
bitcch
好
01/29 22:55
推
pttouch
看不懂這是在炒股的搞笑人士請不要又泛政治化…這
01/29 23:23
→
pttouch
就是在話題炒股,韭菜不要在那邊什麼都要滑坡好嗎
01/29 23:23
→
pttouch
==
01/29 23:23
→
Chien996
綠蝇精神勝利法 很在意台灣輸慘XD
01/29 23:24
推
takeda3234
如果繼續蒸餾下去 硬體成本是不是會變越低就能達成
01/29 23:26
推
pttouch
哇靠我還左轉出去看吧我是不是在股版,奇怪了明明
01/29 23:27
→
pttouch
是在討論股票的事情,係咧==
01/29 23:27
推
jason613
那明天劇本是 deepsuck
01/29 23:59
推
noseng
這次……兩天?……果然還是無視就好
01/30 00:09
→
stanleyplus
多蛙丸子
01/30 00:18
噓
sanos168
哈哈哈.果然是畝產萬斤糧的翻版,什麼最節省成本..
01/30 00:48
→
logitech2004
大家都是這樣做的好嗎?
01/30 00:53
→
solarem
嘻嘻 就說你是抄的 有美國可以抄襲 中國要懂的感激
01/30 00:54
推
ljh109
中吹又要森七七了
01/30 02:08
→
Brioni
現在最燒屁股的是星門專案吧,投資機構一個閃現就變
01/30 03:12
→
Brioni
閉門專案
01/30 03:12
推
mdkn35
結果還真的被說對了?柵欄仔又翻了?
01/30 06:53
→
NexusPrime
學術研究的paper用蒸餾沒問題啊,但是你DS是商業化
01/30 09:31
→
NexusPrime
的app
01/30 09:31
推
SRNOB
開源免費的 什麼商業化zz
01/30 10:36
推
sid3
他抄襲我的髮型
01/30 15:32
推
adamyang2000
打炮也是抄襲A片學來的
01/30 20:31