📋 PTT 文章瀏覽
1.媒體來源: 華爾街日報 (本篇為AI機翻) 2.記者署名: Katherine Bindley 2026/4/22 3.完整新聞標題: Workers Sue $10 Billion AI Startup for Collecting and Exposing Personal Data 員工控告估值百億 AI 新創公司收集與洩漏個人資料 副標題: Mercor, which has worked with OpenAI, Anthropic and Meta, disputes the allegations 曾與 OpenAI、Anthropic 及 Meta 合作的 Mercor 否認這些指控 4.完整新聞內文: 重點摘要 AI 訓練新創公司 Mercor 在一次資料外洩事件中暴露了約聘人員的資訊後,目前面臨至 少七起集體訴訟。 訓練人工智慧 (AI) 模型需要大量最新的資料。Mercor 是一家估值達 100 億美元的新創 公司,專門招募約聘人員來提供 AI 訓練回饋,該公司正處於這場高風險資料爭奪戰的最 前線。 然而,這種對資料的渴求有時會踩到爭議的紅線。 這家總部位於舊金山的新創公司,其客戶曾包括 OpenAI、Anthropic 和 Meta。在發生第 三方資料外洩事件後,該公司最近幾週面臨了至少七起集體訴訟。據稱,外洩內容包含 了 Mercor 約聘人員的工作面試錄影、臉部生物辨識資料以及員工電腦的螢幕截圖等。 這些訴訟讓人們得以一窺 Mercor 涉嫌如何取得用於服務客戶的資料。 週二在北加州提起的一項集體訴訟指控,Mercor 收集了求職者的審查資料(包含背景調 查)並與合作夥伴分享,此舉違反了美國聯邦法規。 原告指出,該公司的做法包括監控其約聘人員的電腦並將這些資料分享給客戶、使用求職 者的面試錄影來訓練 AI 模型,以及使用可能屬於其他公司的素材來訓練客戶的模型。 Mercor 在一份聲明中表示:「我們強烈否認這些訴訟中推測性的指控,並期待在適當的 時間和地點陳述事實。」 「我們非常重視客戶、約聘人員、員工以及面試者的隱私,並且我們遵守所有相關法律與 法規,」聲明中繼續提到,並補充該公司已迅速採取行動來修補資料外洩問題,且這次外 洩事件也影響了許多其他公司。「我們正與頂尖的第三方數位鑑識專家進行徹底調查,並 在有調查結果時,直接與受影響的利害關係人進行溝通。」 此前,《華爾街日報》曾報導指出,Mercor 試圖向 LinkedIn 上的用戶購買他們過去的 工作資料:但這些人表示自己並不擁有這些工作內容的版權。根據網路上的貼文, Mercor 曾提議以每份 100 美元的價格收購約聘人員的個人財務文件,例如試算表和 PowerPoint 簡報。該公司也曾提議以 100 美元購買民眾的 Google Maps 歷史紀錄。 尋找並處理如此大量的資料會帶來許多複雜的問題:由於據稱外洩的資料中包含員工的電 腦螢幕截圖,約聘人員不僅因為自身個資遭到外洩而控告 Mercor,同時也因為他們其他 雇主的資訊遭到外洩而提告。 Meta 的發言人表示,Meta 已暫停與 Mercor 的合作並正在調查此事。(Meta 暫停與 Mercor 合作的消息早前已由《連線》(Wired) 雜誌報導。)Anthropic 拒絕發表評論。 OpenAI 則未回應置評請求。 麻省理工學院 (MIT) 研究 AI 的博士候選人 Shayne Longpre 表示,為了訓練第一代的 大型語言模型 (LLM),AI 開發商已經找出並擷取了世界上多數容易取得的主要資料來源 。現在,企業必須尋求更專業的資料。 「許多資料獲取策略似乎正轉向更專業的來源,」他指出,目標轉向了那些「知識淵博, 且曾在金融、醫療、法律、科學等領域執行過複雜任務的人士。」 Mercor 在 2025 年聘用了 3 萬名約聘人員。其競爭對手包括 Handshake AI、Micro1 和 Surge。近期,LinkedIn 開始測試自家的 AI 訓練市集,該測試早前由《商業內幕》 (Business Insider) 報導。Handshake 共同創辦人 Garrett Lord 最近也在 LinkedIn 貼文表示,他的公司正在尋求購買程式碼庫 (codebases)、內部資料庫等資料。 「我們會將所有資料匿名化,」他寫道。「那些網路上找不到的東西,正是我們所需要的 。」 Longpre 表示,大型 AI 實驗室與 Mercor 等使用約聘人員的仲介機構合作的方式,可能 會讓資料來源的責任歸屬變得更模糊。他補充說,在整個產業界,「目前的誘因是先在短 期內盡可能搶佔市場,之後再來搞清楚法規。」 真實情境的難題 在週二提起的集體訴訟中,原告 Thitipun Srinarmwong 指控,Mercor 的專案經理與審 查員鼓勵員工使用來自他們(原本任職)公司的真實資料,只要將來源遮蔽或稍微修改即 可。訴訟指出,當 Srinarmwong 為了保護機密資訊而轉換寫法時,審查員卻批評其工作 成果太過簡短且含糊。 曾在高盛 (Goldman Sachs) 工作的 Mercor 約聘人員 David Bevvino-Berv 在同一訴訟 中指控,他看到了一些財務模型與提示詞 (prompts),他懷疑這是其他員工分享了其他公 司的專有資訊。訴狀中寫道,他還看到了「專案前的中介資料 (metadata)、隱藏的自訂 名稱、機構數據終端標記、真實貸款人或交易對手名稱、不規則的數值精確度,以及其他 引發對資料來源產生嚴重質疑的特徵。」 一位同時是聯邦調查員的約聘人員告訴《華爾街日報》,Mercor 要求提供「真實情境」 ,但並未要求提供可能屬於其他公司的過往工作內容或專有資料。然而,該名調查員補充 說,公司會清洗資料以移除個人或商業識別資訊,以防約聘人員沒有遵守指示。 Mercor 執行長 Brendan Foody 去年秋天在 TechCrunch Disrupt 大會上表示,雖然他們 會提供指引,要求約聘人員不要使用其他公司的資料或文件,但「有些事情還是會發生。 」他補充:「我們這邊已經盡了一切努力。」 該公司表示,其徵才資訊有明文規定,工作內容不會涉及存取員工的雇主、客戶或機構的 機密或專有資訊。 史丹佛大學以人為本人工智慧研究院 (Stanford HAI) 的資訊專家 Jennifer King 表示 ,要求專業人士提出真實情境來訓練 AI 是一件很棘手的事。 她說:「大多數從事專業工作的人,並不會在客戶或自身專業工作之外,自然產出原創的 工作成果。這些資料不會憑空出現。」 她補充道,AI 非常擅長模式匹配 (pattern matching),因此即使公司在將資料輸入 AI 模型前先進行了資料清洗,模型仍可能在被上傳的素材與其原始來源之間進行推論,進而 將兩者連結起來。 面試、入職與工作情形 求職者和前員工表示,在應徵 Mercor 的約聘工作時,他們參加了由看不見的「AI 面試 官」進行的錄影面試。通常整個過程沒有任何人類參與。一旦被錄取,他們通常會被要求 簽署保密協定 (NDA)。 兩名去年曾在 Mercor 工作的約聘人員表示,他們的任務是比對求職者的面試影片與其後 續擔任約聘人員時的表現,藉此改善該公司用來發掘人才的自家 AI 系統。 在北德州提起的一起與資料外洩有關的訴訟指控,面試錄影被分享給了 Mercor 的客戶。 該公司表示,求職者的面試內容僅供內部使用,並未用於訓練客戶的 AI 模型。 在週二提起的訴訟中,原告稱公司還收集了背景調查及其他資料並分享給客戶。Mercor 則表示,他們不會與客戶分享求職者的背景調查資料。 在開始為公司工作時,Mercor 的員工必須安裝一款名為 Insightful 的軟體,該軟體會 擷取電腦螢幕的截圖。 未參與訴訟的 Mercor 約聘人員向《華爾街日報》描述了他們的工作環境,稱螢幕截圖可 能會每分鐘進行一次。 曾在高盛工作的原告 Bevvino-Berv 指控,Insightful 擷取了他使用銀行帳戶、健保入 口網站以及大約 240 個其他應用程式的紀錄。訴訟還指控,Bevvino-Berv 並未被「明確 告知」Insightful 會擷取他在 Mercor 相關工作以外的任何畫面。 一位去年曾擔任 Mercor 專案負責人數個月的約聘人員表示,他能夠查看其專案上每個人 的電腦螢幕截圖。 公司表示,他們有告知員工在「計費工時」(billing hours) 內可能會對其工作畫面進行 截圖,並明確告誡員工在 Insightful 運作期間只能使用與工作相關的應用程式。 (本篇為AI機翻) 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: https://www.wsj.com/tech/ai/mercor-ai-startup-personal-data-lawsuit-0b5c349b 6.備註: 一群受聘的各行各業專業人士控告了Mercor公司 這家公司專門聘僱各行各業專業人士 提供AI公司專業的訓練回饋 該公司要求這些約聘專業人士安裝一個叫Insighful的軟體 跟他們說這軟體會在他們工作時截圖 但是該軟體每分鐘截圖一次 而且連同銀行帳戶畫面跟數百個其他APP使用畫面等等涉及個資也全都截圖 Mercor公司被發現把所有截圖全都交給AI公司當成訓練資料 (該公司解釋: 有事先要求在軟體運行中不要開其他應用程式) 而且涉嫌也把這些專業人士面試時的錄影紀錄也交給AI公司當成訓練資料(該公司否認) 這些事情是因為第三方資料外洩才被發現 那些專業人士進而提起集體訴訟 除了個資外洩的問題以外 這篇還提到了專業人士提供專業資料的問題 該公司鼓勵受聘專業人士提供原任職公司的真實資料 只要將關鍵字遮蔽即可 但是當那些專業人士轉換寫法時卻被審查員批評過於含糊 而且即使真的遮蔽或稍微修改 專家指出AI擅長模式匹配也能反推來源公司是哪家 這可能涉及侵權問題 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 135.136.27.41 (日本) ※ 文章網址: https://webptt.cc/bbs/Gossiping/M.1776994199.A.E5A.html

推文 (2)

spzper 基本上用這些東西躲不掉 125.230.217.135 04/24 09:30
error405 就是要訓練自動辦公AI啊 114.36.252.228 04/24 09:32
‹ 回 八卦板 列表