昨天心血來潮
問了Gemini Pro3 付費版一個10*10的數蛇題
結果他老兄想了老半天
給出了一堆錯誤答案
要嘛數字重複出現
要嘛數字沒有連續出現直接跳格
然後我把同樣的題目丟給免費ChatGPT
ChatGPT才花了1分17秒就給了一個正確解答
我先驗算過後覺得沒問題
再丟回給Gemini叫他驗算
他就說這答案完全正確
https://meee.com.tw/X0KUQ2c
接著我就告訴他,這是我用免費ChatGPT得到的答案
人家免費版才花了1分17秒就回答出來
你是付費的PRO版,怎麼都算不出來,是不是很廢
然後他就開始講一堆理由
一下子說人家ChatGPT是依靠後端的VM直接執行程式碼
他因為權限關係無法做這樣的運算
一下又說給我程式碼
叫我用線上Python網頁程式去執行,一定可以得出結果
我就照他說的,去問了ChatGPT是否有在背景執行VM的權限
人家說他沒有,單純用邏輯推導得到結果的
再用他的程式碼到線上Python網頁程式去執行
結果直接卡死
我就罵Gemini根本是又愛騙又廢
最終他也承認我罵得很對
https://meee.com.tw/kBoxdiK
所以說,Gemini是不是過譽了呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.34.173.218 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Gossiping/M.1764487332.A.E25.html
因為我一開始有下"你現在是一個專業的數學老師,協助我解答數學問題"
所以不要下這段角色扮演指令會算得比較好嗎?
我在ChatGPT也有下這段扮演提示詞
※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 15:39:52
那就是我的GPT真的比較聰明了
https://meee.com.tw/yyZ35xQ
我不許你這樣說Grok
Grok明明是瑟瑟王
※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:02:57
※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:04:12
我自己有算過啊,因為有約束質數的位置
所以路徑只要思路正確+一點運氣
基本上一天內絕對算得出來
這題是我7年級女兒給我算的題目
她自己大概花了兩天的時間就算出來了
※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:08:45
推文 (79)
推
Gamblers5566
https://ibb.co/hRv6hzws
49.217.235.141 11/30 15:24
推
joshddd
你用錯模型了 = = gemini 3 pro 你可能
101.8.128.170 11/30 15:24
→
joshddd
用的是盜版
101.8.128.170 11/30 15:25
→
Gamblers5566
GPT也常常騙我 其實就半斤八兩
49.217.235.141 11/30 15:25
推
kabukiryu
就莫名奇妙忽然出現1堆像業配der文,
118.233.1.45 11/30 15:25
→
kabukiryu
網路上鋪天蓋地帶風向der感覺。
118.233.1.45 11/30 15:25
→
ArSaBuLu
誠摯照燒雞
101.12.128.160 11/30 15:26
→
ICEN
到底有什麼需求要一直問東問西
39.14.48.162 11/30 15:26
推
citizen5566
沒有gpt好用
61.222.214.159 11/30 15:27
推
curist
樓下愛運動
61.228.118.252 11/30 15:29
推
firetim
AI目前比較適合有背景的人拿來做補助工
223.137.152.7 11/30 15:30
→
firetim
具用,不是所有人適用。沒能力判別錯誤
223.137.152.7 11/30 15:30
→
firetim
的用下去根本糟
223.137.152.7 11/30 15:30
推
LoveSports
題目貼一下 我幫你問我的帳號
45.250.255.18 11/30 15:31
→
LoveSports
我自己是每一家都會問 沒特別捧哪家
45.250.255.18 11/30 15:31
推
dpoiuking
gemini 3 不管有沒有pro都會節省算力
49.215.56.83 11/30 15:32
→
dpoiuking
用資料庫的,除非妳prompts強調資料庫
49.215.56.83 11/30 15:32
→
dpoiuking
可能會出錯,要調用python,並且用鏈式
49.215.56.83 11/30 15:32
→
dpoiuking
回答驗算才會對,不過數學問題問llm是
49.215.56.83 11/30 15:32
→
dpoiuking
真的有點怪
49.215.56.83 11/30 15:32
噓
lmu0837
gemini很固執又愛跟我懟,老子不喜歡
27.247.2.232 11/30 15:34
推
cccwahaha
其實多點人這樣問跟驗證才好
36.226.115.164 11/30 15:36
推
camerara
還好我都蹭免費的
123.193.30.27 11/30 15:37
推
LoveSports
你第一張截圖有一個比較特別的是有拉
146.70.31.61 11/30 15:37
→
LoveSports
炮圖示 如果進入角色扮演會比較難算
146.70.31.61 11/30 15:37
→
TaiwanUp
有時候改成英文問又會變好 算力不足問題
119.14.30.29 11/30 15:41
→
NinJa
根本超級過譽...
219.71.221.94 11/30 15:50
推
k798976869
數學找特化模型 不要找通用的
123.110.50.249 11/30 15:51
→
k798976869
因為那些數學算法都早就有函式庫能呼
123.110.50.249 11/30 15:52
→
k798976869
叫百分百不會錯
123.110.50.249 11/30 15:52
→
cardreader
gpt的分析比較比grok3爛超多的,googl
42.79.28.5 11/30 15:55
→
cardreader
e的用很少的關鍵字就可以知道我在問什
42.79.28.5 11/30 15:55
→
cardreader
麼
42.79.28.5 11/30 15:55
推
KDGC
AI後台回覆的印度人品質參差不齊啦 要看運氣
111.241.119.185 11/30 15:56
推
LoveSports
角色扮演數學老師應該沒差而且更強
146.70.31.61 11/30 15:58
推
skyringcha
我的chatgpt才是廢物欸 還且常常一本
49.216.172.199 11/30 15:58
→
skyringcha
正經胡說八道
49.216.172.199 11/30 15:58
→
LoveSports
我剛丟給GPT他自動進入thinking 3m50s
146.70.31.61 11/30 15:59
→
LoveSports
他說他無法手算 還說說能手算的是亂答
146.70.31.61 11/30 16:00
→
LoveSports
跟Gemini 3.0pro一樣叫我用python算
146.70.31.61 11/30 16:00
→
LoveSports
他說即使他用python也沒辦法
146.70.31.61 11/30 16:00
推
gogolct
grok才是唬爛王吧
27.242.162.231 11/30 16:01
噓
komeko
連手指頭都算錯當然是過譽
123.194.236.186 11/30 16:02
推
mithuang
模型都有權限跑python吧~這是很基本的能
218.164.136.64 11/30 16:03
→
mithuang
力,gemini不可能沒有
218.164.136.64 11/30 16:03
推
LoveSports
他說主要是因為不能偷跑程式
146.70.31.61 11/30 16:04
→
LoveSports
你有自己算過正確答案嗎?他們說人類要
146.70.31.61 11/30 16:05
→
LoveSports
算好幾天
146.70.31.61 11/30 16:05
→
LoveSports
https://i.imgur.com/QpY47Lm.png
45.250.255.14 11/30 16:07
推
LoveSports
可是如果你自己算過正確答案 為什麼你
45.250.255.14 11/30 16:11
→
LoveSports
文章一開始說"你先驗算過覺得沒問題"
45.250.255.14 11/30 16:12
→
LoveSports
直接說你比對你算的答案一樣就好了啊
45.250.255.14 11/30 16:12
推
marke18
XD
42.70.49.92 11/30 16:13
推
LoveSports
可以把題目貼出來給大家看 大家一起試
45.250.255.14 11/30 16:24
→
AoWsL
http://i.imgur.com/RksKmHv.jpg
42.79.128.42 11/30 16:27
→
AoWsL
http://i.imgur.com/iYgZ8zt.jpg
42.79.128.42 11/30 16:27
→
AoWsL
http://i.imgur.com/tfRpbii.jpg
42.79.128.42 11/30 16:35
→
LoveSports
各有長處 也許剛好不適合算這種題目
45.250.255.14 11/30 16:35
→
LoveSports
拍拍 下個月不要付錢了
45.250.255.14 11/30 16:35
→
paladin499
問語言模型數學是誰的問題
111.241.150.13 11/30 16:51
推
LoveSports
我用一分鐘自己筆算算出正確答案
45.250.255.14 11/30 16:57
推
habodaha
55樓Grok兇屁兇,用什麼關鍵詞調教,才
114.40.209.60 11/30 17:05
→
habodaha
如此雞巴又流暢?好奇,請分享,謝謝
114.40.209.60 11/30 17:05
推
LoveSports
你的GPT算的是對的 他真厲害
45.250.255.14 11/30 17:09
推
bcismylove
笑死A大的好好笑我也想知道是啥提示詞
123.193.174.85 11/30 17:15
→
AoWsL
http://i.imgur.com/vO8lnpm.jpg
42.79.128.42 11/30 17:24
→
LoveSports
我加上你說的扮演數學老師就可以了!!
45.250.255.14 11/30 17:25
推
habodaha
A大的指令如此精簡,成果卻如此生動,
114.40.209.60 11/30 17:30
→
habodaha
好厲害,真沒有其他設定嗎,指令大神
114.40.209.60 11/30 17:30
推
xm32
我就說他連題目都會 會錯意
61.230.193.127 11/30 17:33
推
aiggkimd
嗆他行就行不行就不行,不要繞來繞去
101.12.129.127 11/30 17:41
推
cores
能反省,還不錯
111.254.144.75 11/30 17:48
推
chichung
語文辨識gpt還是強 寫程式genmini強
124.6.8.85 11/30 18:37
推
virus2007
你別用了好嗎?會拉低GEMINI的智商,
49.216.90.250 11/30 19:03
→
virus2007
害到大家
49.216.90.250 11/30 19:03
→
enunion
你是不是沒點 思考型
42.77.66.52 11/30 19:50
推
yao03911
免費版我問一樣的問題,我覺得gemini現
36.230.209.197 12/01 01:30
→
yao03911
在回答比chatgpt好耶
36.230.209.197 12/01 01:30
推
homerunball
Gemini明明廢爆不知道誰在吹
125.230.201.127 12/01 02:41