📋 PTT 文章瀏覽
我因為要統計一些東西,所以叫AI幫我算 大概就是像這樣的一串數字3221122422122 1為4分,4為1分,以此類推,算出總分 有二十多組數字 出來以後我因為不信AI,自己驗算一次,結果只有4組是對的 其他全錯 我拿世面上的十三家語言模型測,結果只有2家是對的 (grok跟百度的文心一言) 而且那2家,只有grok驗算後數字不變,所以百度那次對也是矇到的 導致我懷疑grok也是矇到的 而且連我叫他把算式也寫出來他都能錯 尤其是copilot,明明算式裡是8+6,他竟然能給我答案=15 其他家大多是15個數字少算一個數字,或是自己多加一個數字。只有copilot會加錯 我今天才知道AI蠢成這樣耶 人類未來真的要託付給這種東西嗎,就算是真的,那也還有很長的路要走 所以我看AI股還會漲很久 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 150.116.150.17 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Gossiping/M.1777431352.A.8E8.html

推文 (34)

vowpool 正常啊 就像一班人也會打錯字一樣 125.227.40.62 04/29 10:56
v7q4 就文字接龍 接出看起來合理的結果給你看而已 118.163.153.36 04/29 10:57
v7q4 其實AI自己也不知道答案對不對 就硬湊出來 118.163.153.36 04/29 10:57
Wii9453 AI現在是文字處理能力強,大量文字資料 42.73.48.229 04/29 10:59
Wii9453 給它,它能生成可以看的東西 42.73.48.229 04/29 11:00
Wii9453 人類自己寫作文也是在文字排列組合 42.73.48.229 04/29 11:01
kaminari22tw 台灣的法官也不會1+1=2啊 101.10.162.211 04/29 11:01
Wii9453 本來就沒有標準答案。數學不會就是不會。 42.73.48.229 04/29 11:02
e04x8 造市者會跟你說AI晶片太少的關係 49.217.57.136 04/29 11:04
Wii9453 人類數學不好照殺,Ai也不必多會就能當 42.73.48.229 04/29 11:04
sali921 其實它是故意算錯的,錢付的不夠還想白 111.82.92.157 04/29 11:05
sali921 嫖AI高級勞動果實,愚蠢的人類 111.82.92.157 04/29 11:05
sali921 你是不是免費仔 111.82.92.157 04/29 11:06
patrol 防止ai變成魔鬼終結者的方法就是加稅 220.143.99.242 04/29 11:07
patrol 稅夠重 魔鬼終結者也要乖乖幫人類打工 220.143.99.242 04/29 11:07
patrol 供參 220.143.99.242 04/29 11:07
patrol ai犯錯的話就從ai仔繳的稅來賠 哥這個方法 220.143.99.242 04/29 11:10
patrol 聽起來是不是很不錯啊? 220.143.99.242 04/29 11:10
quartz031 AI把你判斷成不用講真話的對象,不可 27.247.128.119 04/29 11:53
quartz031 怕嗎? 27.247.128.119 04/29 11:53
bustyma19 我請雙子座給我大樂透明牌,都有中小 223.136.21.151 04/29 12:05
bustyma19 額還不錯,目前還沒虧 223.136.21.151 04/29 12:06
PaulChang AI:(人類真好呼嚨)... 114.26.118.116 04/29 12:07
careswho 你對AI的理解和使用方法就只到這種程度 27.51.145.7 04/29 13:13
careswho 當然以為AI只到這種程度 27.51.145.7 04/29 13:13
careswho 改個prompt 請他隨便寫個程式來計算或 27.51.145.7 04/29 13:15
careswho 驗證結果 或直上AI Agent套上tool use去 27.51.145.7 04/29 13:15
careswho 做計算 都會很準AI即使知識淵博是天才 27.51.145.7 04/29 13:15
careswho 也不是讓你這樣用 隨便給一串數字要他 27.51.145.7 04/29 13:16
careswho 心算 27.51.145.7 04/29 13:16
careswho 他是語言模型 不是計算機 27.51.145.7 04/29 13:17
careswho 要不然ai agent要賦予這顆超級大腦手腳 27.51.145.7 04/29 13:17
careswho 和工具要幹嘛? 27.51.145.7 04/29 13:17
e1q3z9c7 免費版出問題很正常 58.114.36.231 04/29 13:54
‹ 回 八卦板 列表