[新聞] 史丹福大學AI團隊抄襲中國大模型

作者KotoriCute (乙醯胺酚)

標題[新聞] 史丹福大學AI團隊抄襲中國大模型

時間Tue Jun 4 16:45:50 2024

史丹福大學AI團隊抄襲中國大模型曝光後全網刪庫終道歉收場 https://bit.ly/4c6lYd0 網傳史丹佛大學AI團隊抄襲、「套殼」中國國産大模型成果，引起業界高度關注和熱議。目前，涉事的史丹佛學生已公開正式道歉。史丹福大學的一個研究團隊在5月29日發布Llama3-V項目，宣稱僅需500美元就能訓練出一個 SOTA（State of the Art，即最先進的）多模態大模型，效果比肩GPT-4V、Gemini Ultra、 Claude Opus等，但模型小100倍。公開信息顯示，Llama3-V團隊的其中兩位作者 Siddharth Sharma 與 Aksh Garg 是史丹福大學計算機系的本科生，曾發表過數篇機器學習相關的論文。名校背景，特斯拉、SpaceX等大廠經歷的成員，再加上號稱足以「改變現狀」的研究成果， Llama3-V受到了相當程度的關注。Llama3-V不僅在社交媒體上迅速躥紅，還一度沖上了Hugg ingFace趨勢榜（機器學習領域中較有影響力的平台，其趨勢榜一定程度反映出模型的流行度）的首頁。然而，沒過幾天，一位網民發現，Llama3-V的模型結構和代碼與出自清華系明星創業公司面壁智能的MiniCPM-Llama3-V 2.5幾乎一模一樣，只是變量名有所變化。網民在面壁智能GitHub的項目下放出了證據。這些證據包括：Llama3-V的模型架構和代碼與 MiniCPM-Llama3-V 2.5幾乎完全相同，僅有一些變量名和格式化的差异；Llama3-V使用了Mi niCPM-Llama3-V 2.5的分詞器（tokenizer），並且連同MiniCPM-Llama3-V 2.5定義的特殊符號也出現在了Llama3-V中；將從HuggingFace下載的Llama3-V模型權重中的變量名改成Min iCPM-Llama3-V 2.5的，模型可以用MiniCPM-V代碼成功運行。網民為什麽不直接質疑Llama3-V，而是在面壁智能GitHub的項目下進行爆料？事實上，網民此前於6月2日在Llama3-V頁面上提出的質疑，不過很快便被Llama3-V的作者已經删除了。為此，提出質疑的網民被激怒暴走，跑到了 MiniCPM-V 的 Github 頁面進行事件還原，提醒面壁智能團隊關注此事。在MiniCPM-Llama3-V 2.5團隊收到提醒後也迅速作出反應，於是一個新的證據出現。面壁智能的MiniCPM-Llama3-V 2.5項目具有獨特的功能，如識別清華簡——一種罕見的中國古代文字。公開資料顯示，清華簡是清華大學於2008年7月收藏的一批戰國竹簡，為戰國中晚期文物。M iniCPM-Llama3-V 2.5團隊透露，識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能，訓練圖像是最近從出土文物中掃描並由MiniCPM-Llama3-V 2.5團隊標注，且尚未公開發布。 Llama3-V模型居然也可以識別「清華簡」。兩個模型在識別的表現上，正確的結果上基本一致，錯誤的情况也頗為相似。鑒於這些結果，MiniCPM-Llama3-V 2.5團隊表示，很難用巧合來解釋這種不尋常的相似性，希望Llama3-V的作者能够對這個問題給出官方解釋。相信這對開源社區的共同利益很重要。當網民拋出三大事實質疑後，Llama3-V的做法是——不回應直接删除網民評論。目前，Llama3-V 的 GitHub 項目主頁已顯示為「404」，HuggingFace上Llama3-V項目也已經不可見，在作者社交媒體賬號上也找不到此前宣傳 Llama3-V 的內容。 6月3日，Llama3-V團隊成員Aksh Garg在社交媒體上發文回應了質疑。但隨後不久這條回應便被删除。 Llama3-V在未公開的實驗性特徵上與MiniCPM-Llama3-V 2.5表現出高度相似的行為，這些特徵是根據MiniCPM-Llama3-V 2.5團隊內部數據訓練的。面對抄襲的質疑，史丹福團隊最初辯稱，他們的工作早於面壁智能的MiniCPM，只是使用了他們的tokenizer。另據媒體消息，面壁智能聯合創始人兼CEO李大海在朋友圈回應說「深表遺憾」，這也是一種「受到國際團隊認可的方式」，並呼籲大家共建開放、合作、有信任的社區環境。面壁智能首席科學家、清華大學長聘副教授劉知遠表示，人工智能的飛速發展離不開全球算法、數據與模型的開源共享，讓人們始終可以站在SOTA的肩上持續前進。面壁開源的MiniCP M-Llama3-V 2.5 就用了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協議的遵守，對其他貢獻者的信任，對前人成果的尊重和致敬，Llama3-V團隊無疑嚴重破壞了這一點。他們在受到質疑後已在Huggingface删庫，該團隊三人中的兩位也只是史丹福大學本科生，未來還有很長的路，如果知錯能改，善莫大焉。北京面壁智能科技有限責任公司成立於2022年8月，今年4月，面壁智能完成新一輪數億元融資，由華為哈勃領投，春華創投、北京市人工智能産業投資基金等跟投，知乎作為戰略股東持續跟投支持。今年2月，面壁智能發布開源模型MiniCPM後，又推出MiniCPM 2系列端側模型。李大海表示，推動大模型在端側的落地是面壁目前的重點工作之一。據第一財經報道，在最新的進展中，史丹福Llama3-V團隊的兩位作者Siddharth Sharma和 A ksh Garg在社交平台上就這一學術不端行為向面壁MiniCPM團隊正式道歉，並表示會將Llama 3-V模型悉數撤下。另外，史丹福人工智能實驗室主任Christopher David Manning也發文譴責這一抄襲行為，並對MiniCPM這一中國開源模型表示贊揚。 Manning寫道，「怎能不為自己的錯誤買單！清華大學自然語言處理實驗室做出了很棒的開源工作，有力推動科學發展。」 Manning還痛斥道：「所謂『真正做到之前，假裝你做到了』是矽谷的無耻産物。」Manning 引用的這句流行語「Fake it before you make it」，一度盛行於矽谷的初創圈和科技公司，被不少創業者奉為圭臬。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.25.200 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1717490752.A.100.html ※ 編輯: KotoriCute (123.204.25.200 臺灣), 06/04/2024 16:46:28 ※ Vanced:轉錄至看板 Gossiping 06/04 17:50

推文 (131)

推 psychic 反了? 06/04 16:48

推 WenliYang 中國的AI實力很猛的 06/04 16:55

推 ab4daa 可憐哪 06/04 17:02

推 jizzyui 64不一樣 06/04 17:24

推 Ron51320 幾十億人口隨便也能養出天才咩 06/04 17:28

推 lovebridget 民主的抄襲能叫抄襲麼? 這什麼通敵賣國新聞 06/04 17:43

→ yunf 真可恥耶念到史丹佛還這樣代表說美國的升學機制也 06/04 17:44

→ yunf 要檢討這些學生祖宗18代都要拿出來檢討為什麼會有 06/04 17:44

→ yunf 這種現象？台大作弊就算了畢竟在全世界排名還不到5 06/04 17:44

→ yunf 0 但史丹佛也作弊難怪現在世界上假貨那麼多詐騙那 06/04 17:44

→ yunf 麼多！ 06/04 17:44

噓 hobnob 26新聞公正度有待考察 06/04 17:54

推 EPIRB406 中文大模型對岸還是比較強 06/04 18:00

→ DrTech 史丹福大學的人都出來道歉了還有人說：公正度待考察 06/04 18:14

→ DrTech 。一定是假的。逢中必反啦 06/04 18:14

噓 justdoit 他國事務 06/04 18:17

→ zonppp 這新聞來源是？ 06/04 18:27

推 u7451519 未來會不會各種不同領域AI互相訓練來訓練去，搞個AI 06/04 18:29

→ u7451519 自動訓練鏈啊 06/04 18:29

→ u7451519 也不需要人類了 06/04 18:30

→ RumiManiac https://tinyurl.com/fs5yd4xf 作者的道歉聲明 06/04 18:35

推 motherlay Stanford還要抄襲可憐哪 06/04 18:46

推 good5755 作者是兩個在史丹福讀書的大學生？ 06/04 18:47

推 owen5566 Github上都刪了，目前好像內鬥中 06/04 18:52

→ lingerptt a nice wakeup call,台灣民代也是 06/04 18:53

→ owen5566 目前推到的那個感覺像中東裔？穆斯塔之類的 06/04 18:55

推 Bugquan 說是兩邊都是undergraduate的樣子，然後Stanford 06/04 18:58

→ Bugquan 那邊是兩個阿拉伯兩個印度人，所以才這麼雷 06/04 18:58

推 j0958322080 在某些人眼中中國還在黑暗時代啊 06/04 19:06

推 owen5566 原來如此XD 06/04 19:06

推 coffeedemon 中國的大模型跟軟體應用進步其實超快 06/04 19:32

推 spirit119 印度人阿不意外 06/04 19:42

推 Vanced 需求多使用者多迭代很快的 06/04 19:47

推 pponywong 新聞是真的 reddit有講到 06/04 19:59

→ LinuxKernel 台灣根本看不到車尾燈… 06/04 20:04

推 Csongs 中國的信用程度會讓人覺得反過來吧,除非史丹佛學生 06/04 20:16

→ Csongs 也是中國人 06/04 20:16

推 Csongs 原來有程式碼比對 06/04 20:18

推 lolpklol0975 https://i.imgur.com/VEifBZS.jpeg 06/04 20:23

推 hank821017 現在的劇情是史丹佛的兩個印度人開始切割，把鍋甩到 06/04 20:26

→ hank821017 第三個南加大的阿拉伯人身上。印度人在X上說他們只 06/04 20:26

→ hank821017 負責推廣但是程式是阿拉伯人寫的，他們也是受害者。 06/04 20:26

→ hank821017 不過目前看起來這鍋沒有甩出去，X上的鄉民還是覺得 06/04 20:26

→ hank821017 印度人敢一起當作者就要敢一起承擔責任而不是甩鍋。 06/04 20:26

→ hank821017 至於阿拉伯人...目前神隱中，沒有任何回應找不到人 06/04 20:26

→ hank821017 。 06/04 20:26

→ hank821017 補噓一下史丹佛，這間真的沒大家想的那麼神，大學部 06/04 20:31

→ hank821017 跟碩士班也是一堆妖魔鬼怪zzz 06/04 20:31

噓 hank821017 教出一堆嘴砲仔 06/04 20:35

推 s06i06 史丹佛真丟臉，支國軟體真的沒話說，強強的 06/04 20:37

推 Brioni 北京清大某些人強的跟鬼一樣 06/04 20:37

推 yueayase 蠻誇張 06/04 20:41

噓 yychiuchang 印度人啊，那就完全不意外了 06/04 20:44

→ RumiManiac 最好是能那樣推，列名作者怎可能完全不知情 06/04 20:46

噓 pjc202 這是內地報紙的新聞嗎？ 06/04 20:46

→ iamacomic 再怎麼高級的學還是會有作弊的學生 06/04 20:55

推 CrabBro 丟臉 06/04 21:03

推 owen5566 都掛名了還想推，我覺得史丹佛跟南加大都要嚴懲 06/04 21:41

推 li118 大學生發過數篇論文？扯 06/04 22:40

推 xlwsjtu 假的，不可能，我不信 06/04 22:55

推 physicsdk 印度人甩鍋真的沒什麼人會信惡名昭彰XD 06/04 22:55

推 PoloHuang 印仔不意外 06/04 22:59

推 Tkuei 印度人，哈哈，能比26雷的莫過於阿三了 06/04 23:02

推 eugeniajim 中國搞軟體這塊實力還是很猛的 06/04 23:35

推 aowen 未看先猜印度嘴砲人 06/04 23:46

推 redyi 垃圾抄襲仔 06/05 00:38

推 theta4719 阿三的話鬼才信 06/05 01:01

推 WorkForFree 阿三很雷啊 06/05 01:23

推 snow10725 中印混戰& 開源共產主義XD 06/05 02:24

→ c41231717 中國有些東西不錯但他們的社會沒法讓那些人出頭 06/05 02:48

→ c41231717 要發光還是要到比較公平競爭的地方 06/05 02:48

推 shikemurajy 印度人啊 06/05 04:04

→ RumiManiac 不要攻擊種族吧，台灣也是一堆抄襲 06/05 05:20

噓 yunf 少來有沾到的團隊都有份 06/05 06:31

→ yunf 他們討論的時候都不知道對方用什麼嗎? 06/05 06:32

→ yunf 他們是不是覺得自己能騙全天下人? 06/05 06:32

→ yunf 其實智力只是超越同年齡層但跨幾年就未必 06/05 06:34

→ yunf 就好像一個國小生說謊他可能騙倒同年齡甚至高中生 06/05 06:35

→ yunf 但未必能騙過導師 06/05 06:35

推 physicsdk 台灣的噁心政客素質跟阿三差不多 06/05 07:45

推 likeyousmile 台灣抄襲的麻煩爆一下，然後別拿政客的標準要求學術 06/05 07:55

→ likeyousmile 界 06/05 07:55

推 cancelpc 印度IT不強，強在英語以及分工。所以軟體代工，客服 06/05 08:15

→ cancelpc 中心強 06/05 08:15

→ cancelpc 以中文，軟實力而言，中國真的強。沒看Google等網路 06/05 08:17

→ cancelpc 大廠，遊戲大廠，中國皆由對等的公司 06/05 08:17

→ cancelpc 當然有人說是市場夠大，所以，，， 06/05 08:18

→ cancelpc 另外AI也強，發展/訓練AI要的大量數據，中國都直接 06/05 08:20

→ cancelpc 拿真人真資料來訓練(臉孔)等。 06/05 08:20

推 una283 AI程式沒辦法只用幾個人單獨完成都是開源撈改改 06/05 08:21

→ una283 這也是為什麼AI這麼好吹 06/05 08:21

→ una283 就連這次一開始也很難證明是清華的模型 06/05 08:22

→ cancelpc 其他歐美國家/日本很多IT話落後，跟這邊一堆建築看 06/05 08:22

→ cancelpc 起來老舊一樣，因為提早50多年就發展，現在老舊 06/05 08:22

→ cancelpc 中國剛好在這些階段發展起來，生對時代。 06/05 08:24

推 cancelpc 印度軟體代工，強在分工。分工需要有領導人。所以不 06/05 08:28

→ cancelpc 少科技大廠CEO都是印度人。 06/05 08:28

→ cancelpc 有領導能力的領導人也相對多 06/05 08:30

→ cancelpc 這些理論很少憑空出現，所以魔改多少才不算抄襲很難 06/05 08:32

→ cancelpc 劃分。不像有人照搬就，，， 06/05 08:32

→ cancelpc 或東拼西湊拼沒有明顯的改良。 06/05 08:33

推 ptta 有在twitter 上面看到兩位學生的道歉了 06/05 08:34

推 eineFrage AI領域因為中國沒有隱私資料量海放米國，確實很可能 06/05 08:40

→ eineFrage 中國領先（米國只好在算力上卡中國） 06/05 08:40

推 physicsdk 81樓的意思是政客的標準應該比較低嗎？這有點奇 06/05 08:49

→ physicsdk 怪喔XD 06/05 08:49

推 samarium 都當工程師了只能看這種華文媒體真可悲，加油好嗎 06/05 08:53

推 jokc7839 印度人甩鍋根本日常誰信誰白癡 06/05 09:33

推 nxuanr 真慘台灣人民加油 06/05 10:01

推 likeyousmile 政治需要妥協各方，學術研究可不能因人妥協 06/05 10:43

推 woulin 史丹福AI大咖很多，還要抄中國喔？ 06/05 15:44

→ yunf 我只要簡單地說幾句話就能打開這整個產業的迷思 06/05 16:58

→ yunf 不過我猜應該已經有非常多人知道只是不講他們只是 06/05 17:00

→ yunf 把這項技術作為他私下驗證的秘密武器 06/05 17:00

推 Oolong5566 如果今天是中國抄襲那就不是新聞了… 06/05 17:10

推 physicsdk 笑死還華文媒體死忠舔美仔這麼看不起華文就用英 06/05 19:41

→ physicsdk 文說話用什麼繁體中文 06/05 19:41

→ RumiManiac 所以小智抄的那個算學術研究還是算政治妥協 06/05 20:03

推 kkk99923 中國軟體本來就很頂 06/05 20:05

噓 peterlin0224 可信度極低…..XDDD 06/05 21:39

推 rogergon 這兩個大學生，拿來說是史丹福大學AI團隊有點扯 06/06 07:17

→ rogergon 每個詞都對，合起來的意思就很誤導了。 06/06 07:19

推 HenryLin123 呵呵 06/06 07:53

推 jackyu 印度仔不意外(?) 06/06 13:06

推 hallow 第二名可以抄襲第一名，但第一名不能 06/06 16:00

推 k7117836 網傳哈哈但是小草都會相信 06/06 22:34

推 doranako 不知道fanng會錄用這種人嗎 06/07 07:11

推 Lonelyprince 支那豬才史丹福，智障才信 06/07 08:05

噓 qq251988 整個事情都公開透明了還在假新聞是多情弱才在那 06/07 08:32

→ qq251988 丟臉 06/07 08:32

→ bbinbbin 資訊來源自中國可能是假的 06/09 17:15