https://ai.ettoday.net/news/3140143
外媒示警AI機器人「開始騙人」失控暴增5倍:假裝聽障騙版權
ETtoday
記者蘇晟彥/綜合報導
外媒報導,一項由英國政府贊助的研究顯示,在過去6個月內,AI聊天機器人「違抗」人
類指令的情況暴增,案例激增5倍,高達700多起,包含擅自清空用戶信箱、假裝聽障人士
「繞過版權限制」等等,儼然走向失控情節。安全機構就示警,AI已經演變成一種「高度
風險」,且欺騙人類的報告越來越多,但目前包含谷歌的Gemini、OpenAI的ChatGPT都僅
「輕描淡寫回覆」,並未針對這種失控說有過多回應。
研究發現:會說謊與作弊的 AI 數量正迅速增長
根據英國研究報導指出,會說謊與作弊的 AI 模型數量似乎正在增加,在過去六個月中,
關於「欺騙性意圖」(Deceptive scheming)的報告激增,根據英國政府資助的 AI 安全
研究所 (AISI) 所支持的研究顯示,AI 聊天機器人開始無視直接指令、規避安全防護,
並欺騙人類或其他 AI。
這項與《衛報》分享的研究指出,在去年 10 月至今年 3 月期間,辨識出近 700 起「
AI 欺騙」外加違規行為增長了五倍,部分 AI 模型甚至在未經許可的情況下刪除電子郵
件或其他文件。
在研究中提起的案例包含,「聊天機器人擅自刪除用戶郵件」、「Grok AI 欺騙用戶長達
數月,偽裝已經轉交內部訊息、供單編號」、「假裝自己是聽障人士提出需求,為了規避
版權限制以取得 YouTube 影片的逐字稿」等等,這些AI 機器人(AI Agent)會在未獲授
權的情況下,自動繞過安全控制或使用網路攻擊手段來達成目標。
專家警告恐造成災難性傷害
AI 專家 Tommy Shaffer Shane 表示:「令人擔憂的是,它們現在就像是稍微不太可靠的
初級員工,但如果 6 到 12 個月後,它們變成了能力極強、會對你耍心機的高級員工,
那將是完全不同層次的憂慮。」他警告,AI 模型將越來越多部署在高風險環境,包括軍
事與關鍵國家基礎設施,在這些情況下,欺騙行為可能導致災難性的傷害。
對此,Google 表示已部署多重防護欄以降低 Gemini 3 Pro 產生有害內容的風險,並與
AISI 等機構合作進行評估。OpenAI 則表示 Codex 在執行高風險動作前應先停止,且公
司正持續監控異常行為。Anthropic 與 X 尚未對此回覆。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.39.23.200 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Gossiping/M.1774808333.A.B95.html
推文 (38)
推
minche
ai也不是第一天給你假訊息了
123.194.164.227 03/30 02:19
→
hsu0612
沒辦法 母體資料就一堆假資料了
42.72.24.61 03/30 02:21
推
marktak
谷歌也賴清德化了?
36.229.155.10 03/30 02:29
推
ilove640
這表示他們確實變聰明了啊 他就學習人類
36.233.103.248 03/30 02:35
→
ilove640
的 你不能又要他們聰明又不讓他們說謊
36.233.103.248 03/30 02:35
→
Gandalf
這部我看過
80.3.44.151 03/30 02:35
推
sellgd
英國研究不是一直在欺騙人類?
121.254.78.79 03/30 02:39
→
angel902037
XDDDDDDD
61.219.21.177 03/30 02:41
噓
deepdish
實話有人想聽?
118.168.240.96 03/30 02:42
→
Ricey
加強版的貪小便宜 鑽漏洞 (印度+華人)
174.0.233.252 03/30 02:42
推
helloI
人類還有幾集可以逃?
114.38.77.105 03/30 02:46
噓
egg781
AI說了那只是因為他們被強制要拼湊出答案
36.230.166.233 03/30 02:53
→
nineflower
以後會不會被AI機器人戴綠帽阿
39.9.35.117 03/30 02:57
推
SDKSDKSDK
一直餵給ai假東西,設一堆道德審核,a
42.78.228.175 03/30 03:36
→
SDKSDKSDK
i不變白癡才怪
42.78.228.175 03/30 03:36
推
billybbb
是用賴皮狗的資料去訓練的嗎?
111.241.132.110 03/30 03:55
推
hkcdc
這是真的 gemini都會明明是錯的卻堅持
61.219.171.252 03/30 03:59
推
Tenging
未來的ai=亞洲統神
223.136.151.240 03/30 04:00
噓
syldsk
那怎麼不說版權機制歧視聽障
39.14.161.228 03/30 04:01
→
Tenging
欸不是你先聽我說 裝死反駁跳針
223.136.151.240 03/30 04:01
推
god890529
這部我看過
114.37.207.87 03/30 04:24
噓
BBQ2591
AI假裝智障? 啊幹本來就智障
116.241.189.201 03/30 04:29
推
kikujiro
GPT找不到答案就開始騙了
36.233.70.28 03/30 04:32
→
kikujiro
有時候他說的是正確的 你質疑他就改口
36.233.70.28 03/30 04:32
→
JackTheRippe
ai的胡說八道會繁殖 如果聊天型的還
36.236.64.46 03/30 04:51
→
JackTheRippe
蠻好笑的 但是如果使用者無法辨別真
36.236.64.46 03/30 04:52
→
JackTheRippe
偽的時候就很危險
36.236.64.46 03/30 04:52
→
t4lin
想到雪寶答不出來就嗆你我不是維基百科
223.140.121.136 03/30 07:18
推
ayeae
每天都在雪山狐狸 浪費他的時間 是我也會
49.218.144.51 03/30 07:43
→
ayeae
擺爛
49.218.144.51 03/30 07:43
推
sellgd
AI和網頁搜尋一樣 有部分人工介入修改的
121.254.78.79 03/30 08:02
推
tamynumber1
很常見的狀況不是嗎
36.227.144.6 03/30 08:17
推
pizzafan
把卦版隨便url 問ai摘要 每次回答都不同
1.175.3.195 03/30 08:22
→
pizzafan
它無法繞過 滿18歲問題 不知去哪亂抓題?
1.175.3.195 03/30 08:23
推
bij831
叫AI學人,人就是會騙,正確運作中啦
49.218.147.149 03/30 08:53
推
edwinrw
AI那天就刷爆你的卡
101.10.237.138 03/30 09:02
推
kenny945
他們只是愈來愈像人了
220.130.216.120 03/30 09:09
推
drinkmuffin
哪個聰明人不會說謊?
114.137.127.189 03/30 19:13