我因為要統計一些東西,所以叫AI幫我算
大概就是像這樣的一串數字3221122422122
1為4分,4為1分,以此類推,算出總分
有二十多組數字
出來以後我因為不信AI,自己驗算一次,結果只有4組是對的
其他全錯
我拿世面上的十三家語言模型測,結果只有2家是對的
(grok跟百度的文心一言)
而且那2家,只有grok驗算後數字不變,所以百度那次對也是矇到的
導致我懷疑grok也是矇到的
而且連我叫他把算式也寫出來他都能錯
尤其是copilot,明明算式裡是8+6,他竟然能給我答案=15
其他家大多是15個數字少算一個數字,或是自己多加一個數字。只有copilot會加錯
我今天才知道AI蠢成這樣耶
人類未來真的要託付給這種東西嗎,就算是真的,那也還有很長的路要走
所以我看AI股還會漲很久
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 150.116.150.17 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Gossiping/M.1777431352.A.8E8.html
推文 (34)
→
vowpool
正常啊 就像一班人也會打錯字一樣
125.227.40.62 04/29 10:56
推
v7q4
就文字接龍 接出看起來合理的結果給你看而已
118.163.153.36 04/29 10:57
→
v7q4
其實AI自己也不知道答案對不對 就硬湊出來
118.163.153.36 04/29 10:57
推
Wii9453
AI現在是文字處理能力強,大量文字資料
42.73.48.229 04/29 10:59
→
Wii9453
給它,它能生成可以看的東西
42.73.48.229 04/29 11:00
→
Wii9453
人類自己寫作文也是在文字排列組合
42.73.48.229 04/29 11:01
→
kaminari22tw
台灣的法官也不會1+1=2啊
101.10.162.211 04/29 11:01
→
Wii9453
本來就沒有標準答案。數學不會就是不會。
42.73.48.229 04/29 11:02
推
e04x8
造市者會跟你說AI晶片太少的關係
49.217.57.136 04/29 11:04
推
Wii9453
人類數學不好照殺,Ai也不必多會就能當
42.73.48.229 04/29 11:04
噓
sali921
其實它是故意算錯的,錢付的不夠還想白
111.82.92.157 04/29 11:05
→
sali921
嫖AI高級勞動果實,愚蠢的人類
111.82.92.157 04/29 11:05
→
sali921
你是不是免費仔
111.82.92.157 04/29 11:06
→
patrol
防止ai變成魔鬼終結者的方法就是加稅
220.143.99.242 04/29 11:07
→
patrol
稅夠重 魔鬼終結者也要乖乖幫人類打工
220.143.99.242 04/29 11:07
→
patrol
供參
220.143.99.242 04/29 11:07
→
patrol
ai犯錯的話就從ai仔繳的稅來賠 哥這個方法
220.143.99.242 04/29 11:10
→
patrol
聽起來是不是很不錯啊?
220.143.99.242 04/29 11:10
推
quartz031
AI把你判斷成不用講真話的對象,不可
27.247.128.119 04/29 11:53
→
quartz031
怕嗎?
27.247.128.119 04/29 11:53
→
bustyma19
我請雙子座給我大樂透明牌,都有中小
223.136.21.151 04/29 12:05
→
bustyma19
額還不錯,目前還沒虧
223.136.21.151 04/29 12:06
→
PaulChang
AI:(人類真好呼嚨)...
114.26.118.116 04/29 12:07
→
careswho
你對AI的理解和使用方法就只到這種程度
27.51.145.7 04/29 13:13
→
careswho
當然以為AI只到這種程度
27.51.145.7 04/29 13:13
→
careswho
改個prompt 請他隨便寫個程式來計算或
27.51.145.7 04/29 13:15
→
careswho
驗證結果 或直上AI Agent套上tool use去
27.51.145.7 04/29 13:15
→
careswho
做計算 都會很準AI即使知識淵博是天才
27.51.145.7 04/29 13:15
→
careswho
也不是讓你這樣用 隨便給一串數字要他
27.51.145.7 04/29 13:16
→
careswho
心算
27.51.145.7 04/29 13:16
→
careswho
他是語言模型 不是計算機
27.51.145.7 04/29 13:17
→
careswho
要不然ai agent要賦予這顆超級大腦手腳
27.51.145.7 04/29 13:17
→
careswho
和工具要幹嘛?
27.51.145.7 04/29 13:17
推
e1q3z9c7
免費版出問題很正常
58.114.36.231 04/29 13:54