史丹福大學AI團隊抄襲中國大模型 曝光後全網刪庫 終道歉收場
https://bit.ly/4c6lYd0
網傳史丹佛大學AI團隊抄襲、「套殼」中國國産大模型成果,引起業界高度關注和熱議。目
前,涉事的史丹佛學生已公開正式道歉。
史丹福大學的一個研究團隊在5月29日發布Llama3-V項目,宣稱僅需500美元就能訓練出一個
SOTA(State of the Art,即最先進的)多模態大模型,效果比肩GPT-4V、Gemini Ultra、
Claude Opus等,但模型小100倍。
公開信息顯示,Llama3-V團隊的其中兩位作者 Siddharth Sharma 與 Aksh Garg 是史丹福
大學計算機系的本科生,曾發表過數篇機器學習相關的論文。
名校背景,特斯拉、SpaceX等大廠經歷的成員,再加上號稱足以「改變現狀」的研究成果,
Llama3-V受到了相當程度的關注。Llama3-V不僅在社交媒體上迅速躥紅,還一度沖上了Hugg
ingFace趨勢榜(機器學習領域中較有影響力的平台,其趨勢榜一定程度反映出模型的流行
度)的首頁。
然而,沒過幾天,一位網民發現,Llama3-V的模型結構和代碼與出自清華系明星創業公司面
壁智能的MiniCPM-Llama3-V 2.5幾乎一模一樣,只是變量名有所變化。
網民在面壁智能GitHub的項目下放出了證據。這些證據包括:Llama3-V的模型架構和代碼與
MiniCPM-Llama3-V 2.5幾乎完全相同,僅有一些變量名和格式化的差异;Llama3-V使用了Mi
niCPM-Llama3-V 2.5的分詞器(tokenizer),並且連同MiniCPM-Llama3-V 2.5定義的特殊
符號也出現在了Llama3-V中;將從HuggingFace下載的Llama3-V模型權重中的變量名改成Min
iCPM-Llama3-V 2.5的,模型可以用MiniCPM-V代碼成功運行。
網民為什麽不直接質疑Llama3-V,而是在面壁智能GitHub的項目下進行爆料?事實上,網民
此前於6月2日在Llama3-V頁面上提出的質疑,不過很快便被Llama3-V的作者已經删除了。
為此,提出質疑的網民被激怒暴走,跑到了 MiniCPM-V 的 Github 頁面進行事件還原,提
醒面壁智能團隊關注此事。
在MiniCPM-Llama3-V 2.5團隊收到提醒後也迅速作出反應,於是一個新的證據出現。
面壁智能的MiniCPM-Llama3-V 2.5項目具有獨特的功能,如識別清華簡——一種罕見的中國
古代文字。
公開資料顯示,清華簡是清華大學於2008年7月收藏的一批戰國竹簡,為戰國中晚期文物。M
iniCPM-Llama3-V 2.5團隊透露,識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能,訓
練圖像是最近從出土文物中掃描並由MiniCPM-Llama3-V 2.5團隊標注,且尚未公開發布。
Llama3-V模型居然也可以識別「清華簡」。兩個模型在識別的表現上,正確的結果上基本一
致,錯誤的情况也頗為相似。
鑒於這些結果,MiniCPM-Llama3-V 2.5團隊表示,很難用巧合來解釋這種不尋常的相似性,
希望Llama3-V的作者能够對這個問題給出官方解釋。相信這對開源社區的共同利益很重要。
當網民拋出三大事實質疑後,Llama3-V的做法是——不回應直接删除網民評論。
目前,Llama3-V 的 GitHub 項目主頁已顯示為「404」,HuggingFace上Llama3-V項目也已
經不可見,在作者社交媒體賬號上也找不到此前宣傳 Llama3-V 的內容。
6月3日,Llama3-V團隊成員Aksh Garg在社交媒體上發文回應了質疑。但隨後不久這條回應
便被删除。
Llama3-V在未公開的實驗性特徵上與MiniCPM-Llama3-V 2.5表現出高度相似的行為,這些特
徵是根據MiniCPM-Llama3-V 2.5團隊內部數據訓練的。
面對抄襲的質疑,史丹福團隊最初辯稱,他們的工作早於面壁智能的MiniCPM,只是使用了
他們的tokenizer。
另據媒體消息,面壁智能聯合創始人兼CEO李大海在朋友圈回應說「深表遺憾」,這也是一
種「受到國際團隊認可的方式」,並呼籲大家共建開放、合作、有信任的社區環境。
面壁智能首席科學家、清華大學長聘副教授劉知遠表示,人工智能的飛速發展離不開全球算
法、數據與模型的開源共享,讓人們始終可以站在SOTA的肩上持續前進。面壁開源的MiniCP
M-Llama3-V 2.5 就用了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協議
的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴重破壞了這
一點。他們在受到質疑後已在Huggingface删庫,該團隊三人中的兩位也只是史丹福大學本
科生,未來還有很長的路,如果知錯能改,善莫大焉。
北京面壁智能科技有限責任公司成立於2022年8月,今年4月,面壁智能完成新一輪數億元融
資,由華為哈勃領投,春華創投、北京市人工智能産業投資基金等跟投,知乎作為戰略股東
持續跟投支持。今年2月,面壁智能發布開源模型MiniCPM後,又推出MiniCPM 2系列端側模
型。李大海表示,推動大模型在端側的落地是面壁目前的重點工作之一。
據第一財經報道,在最新的進展中,史丹福Llama3-V團隊的兩位作者Siddharth Sharma和 A
ksh Garg在社交平台上就這一學術不端行為向面壁MiniCPM團隊正式道歉,並表示會將Llama
3-V模型悉數撤下。
另外,史丹福人工智能實驗室主任Christopher David Manning也發文譴責這一抄襲行為,
並對MiniCPM這一中國開源模型表示贊揚。
Manning寫道,「怎能不為自己的錯誤買單!清華大學自然語言處理實驗室做出了很棒的開
源工作,有力推動科學發展。」
Manning還痛斥道:「所謂『真正做到之前,假裝你做到了』是矽谷的無耻産物。」Manning
引用的這句流行語「Fake it before you make it」,一度盛行於矽谷的初創圈和科技公司
,被不少創業者奉為圭臬。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.25.200 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1717490752.A.100.html
※ 編輯: KotoriCute (123.204.25.200 臺灣), 06/04/2024 16:46:28
※ Vanced:轉錄至看板 Gossiping 06/04 17:50
推文 (131)
推
psychic
反了?
06/04 16:48
推
WenliYang
中國的AI實力很猛的
06/04 16:55
推
ab4daa
可憐哪
06/04 17:02
推
jizzyui
64不一樣
06/04 17:24
推
Ron51320
幾十億人口隨便也能養出天才咩
06/04 17:28
推
lovebridget
民主的抄襲能叫抄襲麼? 這什麼通敵賣國新聞
06/04 17:43
→
yunf
真可恥耶 念到史丹佛還這樣 代表說美國的升學機制也
06/04 17:44
→
yunf
要檢討 這些學生祖宗18代都要拿出來檢討 為什麼會有
06/04 17:44
→
yunf
這種現象?台大作弊就算了 畢竟在全世界排名還不到5
06/04 17:44
→
yunf
0 但史丹佛也作弊 難怪現在世界上假貨那麼多詐騙那
06/04 17:44
→
yunf
麼多 !
06/04 17:44
噓
hobnob
26新聞公正度有待考察
06/04 17:54
推
EPIRB406
中文大模型對岸還是比較強
06/04 18:00
→
DrTech
史丹福大學的人都出來道歉了還有人說:公正度待考察
06/04 18:14
→
DrTech
。一定是假的。逢中必反啦
06/04 18:14
噓
justdoit
他國事務
06/04 18:17
→
zonppp
這新聞來源是?
06/04 18:27
推
u7451519
未來會不會各種不同領域AI互相訓練來訓練去,搞個AI
06/04 18:29
→
u7451519
自動訓練鏈啊
06/04 18:29
→
u7451519
也不需要人類了
06/04 18:30
→
RumiManiac
https://tinyurl.com/fs5yd4xf 作者的道歉聲明
06/04 18:35
推
motherlay
Stanford還要抄襲 可憐哪
06/04 18:46
推
good5755
作者是兩個在史丹福讀書的大學生?
06/04 18:47
推
owen5566
Github上都刪了,目前好像內鬥中
06/04 18:52
→
lingerptt
a nice wakeup call,台灣民代也是
06/04 18:53
→
owen5566
目前推到的那個感覺像中東裔? 穆斯塔之類的
06/04 18:55
推
Bugquan
說是兩邊都是undergraduate的樣子,然後Stanford
06/04 18:58
→
Bugquan
那邊是兩個阿拉伯兩個印度人,所以才這麼雷
06/04 18:58
推
j0958322080
在某些人眼中中國還在黑暗時代啊
06/04 19:06
推
owen5566
原來如此XD
06/04 19:06
推
coffeedemon
中國的大模型跟軟體應用進步其實超快
06/04 19:32
推
spirit119
印度人阿 不意外
06/04 19:42
推
Vanced
需求多使用者多 迭代很快的
06/04 19:47
推
pponywong
新聞是真的 reddit有講到
06/04 19:59
→
LinuxKernel
台灣根本看不到車尾燈…
06/04 20:04
推
Csongs
中國的信用程度會讓人覺得反過來吧,除非史丹佛學生
06/04 20:16
→
Csongs
也是中國人
06/04 20:16
推
Csongs
原來有程式碼比對
06/04 20:18
推
lolpklol0975
https://i.imgur.com/VEifBZS.jpeg
06/04 20:23
推
hank821017
現在的劇情是史丹佛的兩個印度人開始切割,把鍋甩到
06/04 20:26
→
hank821017
第三個南加大的阿拉伯人身上。印度人在X上說他們只
06/04 20:26
→
hank821017
負責推廣但是程式是阿拉伯人寫的,他們也是受害者。
06/04 20:26
→
hank821017
不過目前看起來這鍋沒有甩出去,X上的鄉民還是覺得
06/04 20:26
→
hank821017
印度人敢一起當作者就要敢一起承擔責任而不是甩鍋。
06/04 20:26
→
hank821017
至於阿拉伯人...目前神隱中,沒有任何回應找不到人
06/04 20:26
→
hank821017
。
06/04 20:26
→
hank821017
補噓一下史丹佛,這間真的沒大家想的那麼神,大學部
06/04 20:31
→
hank821017
跟碩士班也是一堆妖魔鬼怪zzz
06/04 20:31
噓
hank821017
教出一堆嘴砲仔
06/04 20:35
推
s06i06
史丹佛真丟臉,支國軟體真的沒話說 ,強強的
06/04 20:37
推
Brioni
北京清大某些人強的跟鬼一樣
06/04 20:37
推
yueayase
蠻誇張
06/04 20:41
噓
yychiuchang
印度人啊,那就完全不意外了
06/04 20:44
→
RumiManiac
最好是能那樣推,列名作者怎可能完全不知情
06/04 20:46
噓
pjc202
這是內地報紙的新聞嗎?
06/04 20:46
→
iamacomic
再怎麼高級的學還是會有作弊的學生
06/04 20:55
推
CrabBro
丟臉
06/04 21:03
推
owen5566
都掛名了還想推,我覺得史丹佛跟南加大都要嚴懲
06/04 21:41
推
li118
大學生發過數篇論文?扯
06/04 22:40
推
xlwsjtu
假的,不可能,我不信
06/04 22:55
推
physicsdk
印度人甩鍋真的沒什麼人會信 惡名昭彰XD
06/04 22:55
推
PoloHuang
印仔不意外
06/04 22:59
推
Tkuei
印度人,哈哈,能比26雷的莫過於阿三了
06/04 23:02
推
eugeniajim
中國搞軟體這塊實力還是很猛的
06/04 23:35
推
aowen
未看先猜印度嘴砲人
06/04 23:46
推
redyi
垃圾抄襲仔
06/05 00:38
推
theta4719
阿三的話鬼才信
06/05 01:01
推
WorkForFree
阿三很雷啊
06/05 01:23
推
snow10725
中印混戰& 開源共產主義XD
06/05 02:24
→
c41231717
中國有些東西不錯 但他們的社會沒法讓那些人出頭
06/05 02:48
→
c41231717
要發光還是要到比較公平競爭的地方
06/05 02:48
推
shikemurajy
印度人啊
06/05 04:04
→
RumiManiac
不要攻擊種族吧,台灣也是一堆抄襲
06/05 05:20
噓
yunf
少來有沾到的團隊都有份
06/05 06:31
→
yunf
他們討論的時候都不知道對方用什麼嗎?
06/05 06:32
→
yunf
他們是不是覺得自己能騙全天下人?
06/05 06:32
→
yunf
其實智力只是超越同年齡層但跨幾年就未必
06/05 06:34
→
yunf
就好像一個國小生說謊他可能騙倒同年齡甚至高中生
06/05 06:35
→
yunf
但未必能騙過導師
06/05 06:35
推
physicsdk
台灣的噁心政客素質跟阿三差不多
06/05 07:45
推
likeyousmile
台灣抄襲的麻煩爆一下,然後別拿政客的標準要求學術
06/05 07:55
→
likeyousmile
界
06/05 07:55
推
cancelpc
印度IT不強,強在英語以及分工。所以軟體代工,客服
06/05 08:15
→
cancelpc
中心強
06/05 08:15
→
cancelpc
以中文,軟實力而言,中國真的強。沒看Google等網路
06/05 08:17
→
cancelpc
大廠,遊戲大廠,中國皆由對等的公司
06/05 08:17
→
cancelpc
當然有人說是市場夠大,所以,,,
06/05 08:18
→
cancelpc
另外AI也強,發展/訓練AI要的大量數據,中國都直接
06/05 08:20
→
cancelpc
拿真人真資料來訓練(臉孔)等。
06/05 08:20
推
una283
AI程式沒辦法只用幾個人單獨完成都是開源撈改改
06/05 08:21
→
una283
這也是為什麼AI這麼好吹
06/05 08:21
→
una283
就連這次一開始也很難證明是清華的模型
06/05 08:22
→
cancelpc
其他歐美國家/日本很多IT話落後,跟這邊一堆建築看
06/05 08:22
→
cancelpc
起來老舊一樣,因為提早50多年就發展,現在老舊
06/05 08:22
→
cancelpc
中國剛好在這些階段發展起來,生對時代。
06/05 08:24
推
cancelpc
印度軟體代工,強在分工。分工需要有領導人。所以不
06/05 08:28
→
cancelpc
少科技大廠CEO都是印度人。
06/05 08:28
→
cancelpc
有領導能力的領導人也相對多
06/05 08:30
→
cancelpc
這些理論很少憑空出現,所以魔改多少才不算抄襲很難
06/05 08:32
→
cancelpc
劃分。不像有人照搬就,,,
06/05 08:32
→
cancelpc
或東拼西湊拼沒有明顯的改良。
06/05 08:33
推
ptta
有在twitter 上面看到兩位學生的道歉了
06/05 08:34
推
eineFrage
AI領域因為中國沒有隱私資料量海放米國,確實很可能
06/05 08:40
→
eineFrage
中國領先(米國只好在算力上卡中國)
06/05 08:40
推
physicsdk
81樓的意思是 政客的標準應該比較低嗎? 這有點奇
06/05 08:49
→
physicsdk
怪喔XD
06/05 08:49
推
samarium
都當工程師了只能看這種華文媒體真可悲,加油好嗎
06/05 08:53
推
jokc7839
印度人甩鍋根本日常 誰信誰白癡
06/05 09:33
推
nxuanr
真慘 台灣人民加油
06/05 10:01
推
likeyousmile
政治需要妥協各方,學術研究可不能因人妥協
06/05 10:43
推
woulin
史丹福AI大咖很多,還要抄中國喔?
06/05 15:44
→
yunf
我只要簡單地說幾句話就能打開這整個產業的迷思
06/05 16:58
→
yunf
不過我猜應該已經有非常多人知道只是不講 他們只是
06/05 17:00
→
yunf
把這項技術作為他私下驗證的秘密武器
06/05 17:00
推
Oolong5566
如果今天是中國抄襲那就不是新聞了…
06/05 17:10
推
physicsdk
笑死 還華文媒體 死忠舔美仔這麼看不起華文就用英
06/05 19:41
→
physicsdk
文說話 用什麼繁體中文
06/05 19:41
→
RumiManiac
所以小智抄的那個算學術研究還是算政治妥協
06/05 20:03
推
kkk99923
中國軟體本來就很頂
06/05 20:05
噓
peterlin0224
可信度極低…..XDDD
06/05 21:39
推
rogergon
這兩個大學生,拿來說是史丹福大學AI團隊有點扯
06/06 07:17
→
rogergon
每個詞都對,合起來的意思就很誤導了。
06/06 07:19
推
HenryLin123
呵呵
06/06 07:53
推
jackyu
印度仔不意外(?)
06/06 13:06
推
hallow
第二名可以抄襲第一名,但第一名不能
06/06 16:00
推
k7117836
網傳 哈哈 但是小草都會相信
06/06 22:34
推
doranako
不知道fanng會錄用這種人嗎
06/07 07:11
推
Lonelyprince
支那豬才史丹福,智障才信
06/07 08:05
噓
qq251988
整個事情都公開透明了 還在假新聞 是多情弱才在那
06/07 08:32
→
qq251988
丟臉
06/07 08:32
→
bbinbbin
資訊來源自中國 可能是假的
06/09 17:15