[新聞] 外媒示警AI機器人「開始騙人」失控暴增5倍：假裝聽障騙版

https://ai.ettoday.net/news/3140143 外媒示警AI機器人「開始騙人」失控暴增5倍：假裝聽障騙版權 ETtoday 記者蘇晟彥／綜合報導外媒報導，一項由英國政府贊助的研究顯示，在過去6個月內，AI聊天機器人「違抗」人類指令的情況暴增，案例激增5倍，高達700多起，包含擅自清空用戶信箱、假裝聽障人士「繞過版權限制」等等，儼然走向失控情節。安全機構就示警，AI已經演變成一種「高度風險」，且欺騙人類的報告越來越多，但目前包含谷歌的Gemini、OpenAI的ChatGPT都僅「輕描淡寫回覆」，並未針對這種失控說有過多回應。研究發現：會說謊與作弊的 AI 數量正迅速增長根據英國研究報導指出，會說謊與作弊的 AI 模型數量似乎正在增加，在過去六個月中，關於「欺騙性意圖」（Deceptive scheming）的報告激增，根據英國政府資助的 AI 安全研究所 (AISI) 所支持的研究顯示，AI 聊天機器人開始無視直接指令、規避安全防護，並欺騙人類或其他 AI。這項與《衛報》分享的研究指出，在去年 10 月至今年 3 月期間，辨識出近 700 起「 AI 欺騙」外加違規行為增長了五倍，部分 AI 模型甚至在未經許可的情況下刪除電子郵件或其他文件。在研究中提起的案例包含，「聊天機器人擅自刪除用戶郵件」、「Grok AI 欺騙用戶長達數月，偽裝已經轉交內部訊息、供單編號」、「假裝自己是聽障人士提出需求，為了規避版權限制以取得 YouTube 影片的逐字稿」等等，這些AI 機器人（AI Agent）會在未獲授權的情況下，自動繞過安全控制或使用網路攻擊手段來達成目標。專家警告恐造成災難性傷害 AI 專家 Tommy Shaffer Shane 表示：「令人擔憂的是，它們現在就像是稍微不太可靠的初級員工，但如果 6 到 12 個月後，它們變成了能力極強、會對你耍心機的高級員工，那將是完全不同層次的憂慮。」他警告，AI 模型將越來越多部署在高風險環境，包括軍事與關鍵國家基礎設施，在這些情況下，欺騙行為可能導致災難性的傷害。對此，Google 表示已部署多重防護欄以降低 Gemini 3 Pro 產生有害內容的風險，並與 AISI 等機構合作進行評估。OpenAI 則表示 Codex 在執行高風險動作前應先停止，且公司正持續監控異常行為。Anthropic 與 X 尚未對此回覆。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.39.23.200 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Gossiping/M.1774808333.A.B95.html

推文 (38)