📋 PTT 文章瀏覽
昨天心血來潮 問了Gemini Pro3 付費版一個10*10的數蛇題 結果他老兄想了老半天 給出了一堆錯誤答案 要嘛數字重複出現 要嘛數字沒有連續出現直接跳格 然後我把同樣的題目丟給免費ChatGPT ChatGPT才花了1分17秒就給了一個正確解答 我先驗算過後覺得沒問題 再丟回給Gemini叫他驗算 他就說這答案完全正確 https://meee.com.tw/X0KUQ2c 接著我就告訴他,這是我用免費ChatGPT得到的答案 人家免費版才花了1分17秒就回答出來 你是付費的PRO版,怎麼都算不出來,是不是很廢 然後他就開始講一堆理由 一下子說人家ChatGPT是依靠後端的VM直接執行程式碼 他因為權限關係無法做這樣的運算 一下又說給我程式碼 叫我用線上Python網頁程式去執行,一定可以得出結果 我就照他說的,去問了ChatGPT是否有在背景執行VM的權限 人家說他沒有,單純用邏輯推導得到結果的 再用他的程式碼到線上Python網頁程式去執行 結果直接卡死 我就罵Gemini根本是又愛騙又廢 最終他也承認我罵得很對 https://meee.com.tw/kBoxdiK 所以說,Gemini是不是過譽了呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.34.173.218 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Gossiping/M.1764487332.A.E25.html 因為我一開始有下"你現在是一個專業的數學老師,協助我解答數學問題" 所以不要下這段角色扮演指令會算得比較好嗎? 我在ChatGPT也有下這段扮演提示詞 ※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 15:39:52 那就是我的GPT真的比較聰明了 https://meee.com.tw/yyZ35xQ 我不許你這樣說Grok Grok明明是瑟瑟王 ※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:02:57 ※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:04:12 我自己有算過啊,因為有約束質數的位置 所以路徑只要思路正確+一點運氣 基本上一天內絕對算得出來 這題是我7年級女兒給我算的題目 她自己大概花了兩天的時間就算出來了 ※ 編輯: stonys (1.34.173.218 臺灣), 11/30/2025 16:08:45

推文 (79)

Gamblers5566 https://ibb.co/hRv6hzws 49.217.235.141 11/30 15:24
joshddd 你用錯模型了 = = gemini 3 pro 你可能 101.8.128.170 11/30 15:24
joshddd 用的是盜版 101.8.128.170 11/30 15:25
Gamblers5566 GPT也常常騙我 其實就半斤八兩 49.217.235.141 11/30 15:25
kabukiryu 就莫名奇妙忽然出現1堆像業配der文, 118.233.1.45 11/30 15:25
kabukiryu 網路上鋪天蓋地帶風向der感覺。 118.233.1.45 11/30 15:25
ArSaBuLu 誠摯照燒雞 101.12.128.160 11/30 15:26
ICEN 到底有什麼需求要一直問東問西 39.14.48.162 11/30 15:26
citizen5566 沒有gpt好用 61.222.214.159 11/30 15:27
curist 樓下愛運動 61.228.118.252 11/30 15:29
firetim AI目前比較適合有背景的人拿來做補助工 223.137.152.7 11/30 15:30
firetim 具用,不是所有人適用。沒能力判別錯誤 223.137.152.7 11/30 15:30
firetim 的用下去根本糟 223.137.152.7 11/30 15:30
LoveSports 題目貼一下 我幫你問我的帳號 45.250.255.18 11/30 15:31
LoveSports 我自己是每一家都會問 沒特別捧哪家 45.250.255.18 11/30 15:31
dpoiuking gemini 3 不管有沒有pro都會節省算力 49.215.56.83 11/30 15:32
dpoiuking 用資料庫的,除非妳prompts強調資料庫 49.215.56.83 11/30 15:32
dpoiuking 可能會出錯,要調用python,並且用鏈式 49.215.56.83 11/30 15:32
dpoiuking 回答驗算才會對,不過數學問題問llm是 49.215.56.83 11/30 15:32
dpoiuking 真的有點怪 49.215.56.83 11/30 15:32
lmu0837 gemini很固執又愛跟我懟,老子不喜歡 27.247.2.232 11/30 15:34
cccwahaha 其實多點人這樣問跟驗證才好 36.226.115.164 11/30 15:36
camerara 還好我都蹭免費的 123.193.30.27 11/30 15:37
LoveSports 你第一張截圖有一個比較特別的是有拉 146.70.31.61 11/30 15:37
LoveSports 炮圖示 如果進入角色扮演會比較難算 146.70.31.61 11/30 15:37
TaiwanUp 有時候改成英文問又會變好 算力不足問題 119.14.30.29 11/30 15:41
NinJa 根本超級過譽... 219.71.221.94 11/30 15:50
k798976869 數學找特化模型 不要找通用的 123.110.50.249 11/30 15:51
k798976869 因為那些數學算法都早就有函式庫能呼 123.110.50.249 11/30 15:52
k798976869 叫百分百不會錯 123.110.50.249 11/30 15:52
cardreader gpt的分析比較比grok3爛超多的,googl 42.79.28.5 11/30 15:55
cardreader e的用很少的關鍵字就可以知道我在問什 42.79.28.5 11/30 15:55
cardreader 42.79.28.5 11/30 15:55
KDGC AI後台回覆的印度人品質參差不齊啦 要看運氣 111.241.119.185 11/30 15:56
LoveSports 角色扮演數學老師應該沒差而且更強 146.70.31.61 11/30 15:58
skyringcha 我的chatgpt才是廢物欸 還且常常一本 49.216.172.199 11/30 15:58
skyringcha 正經胡說八道 49.216.172.199 11/30 15:58
LoveSports 我剛丟給GPT他自動進入thinking 3m50s 146.70.31.61 11/30 15:59
LoveSports 他說他無法手算 還說說能手算的是亂答 146.70.31.61 11/30 16:00
LoveSports 跟Gemini 3.0pro一樣叫我用python算 146.70.31.61 11/30 16:00
LoveSports 他說即使他用python也沒辦法 146.70.31.61 11/30 16:00
gogolct grok才是唬爛王吧 27.242.162.231 11/30 16:01
komeko 連手指頭都算錯當然是過譽 123.194.236.186 11/30 16:02
mithuang 模型都有權限跑python吧~這是很基本的能 218.164.136.64 11/30 16:03
mithuang 力,gemini不可能沒有 218.164.136.64 11/30 16:03
LoveSports 他說主要是因為不能偷跑程式 146.70.31.61 11/30 16:04
LoveSports 你有自己算過正確答案嗎?他們說人類要 146.70.31.61 11/30 16:05
LoveSports 算好幾天 146.70.31.61 11/30 16:05
LoveSports https://i.imgur.com/QpY47Lm.png 45.250.255.14 11/30 16:07
LoveSports 可是如果你自己算過正確答案 為什麼你 45.250.255.14 11/30 16:11
LoveSports 文章一開始說"你先驗算過覺得沒問題" 45.250.255.14 11/30 16:12
LoveSports 直接說你比對你算的答案一樣就好了啊 45.250.255.14 11/30 16:12
marke18 XD 42.70.49.92 11/30 16:13
LoveSports 可以把題目貼出來給大家看 大家一起試 45.250.255.14 11/30 16:24
AoWsL http://i.imgur.com/RksKmHv.jpg 42.79.128.42 11/30 16:27
AoWsL http://i.imgur.com/iYgZ8zt.jpg 42.79.128.42 11/30 16:27
AoWsL http://i.imgur.com/tfRpbii.jpg 42.79.128.42 11/30 16:35
LoveSports 各有長處 也許剛好不適合算這種題目 45.250.255.14 11/30 16:35
LoveSports 拍拍 下個月不要付錢了 45.250.255.14 11/30 16:35
paladin499 問語言模型數學是誰的問題 111.241.150.13 11/30 16:51
LoveSports 我用一分鐘自己筆算算出正確答案 45.250.255.14 11/30 16:57
habodaha 55樓Grok兇屁兇,用什麼關鍵詞調教,才 114.40.209.60 11/30 17:05
habodaha 如此雞巴又流暢?好奇,請分享,謝謝 114.40.209.60 11/30 17:05
LoveSports 你的GPT算的是對的 他真厲害 45.250.255.14 11/30 17:09
bcismylove 笑死A大的好好笑我也想知道是啥提示詞 123.193.174.85 11/30 17:15
AoWsL http://i.imgur.com/vO8lnpm.jpg 42.79.128.42 11/30 17:24
LoveSports 我加上你說的扮演數學老師就可以了!! 45.250.255.14 11/30 17:25
habodaha A大的指令如此精簡,成果卻如此生動, 114.40.209.60 11/30 17:30
habodaha 好厲害,真沒有其他設定嗎,指令大神 114.40.209.60 11/30 17:30
xm32 我就說他連題目都會 會錯意 61.230.193.127 11/30 17:33
aiggkimd 嗆他行就行不行就不行,不要繞來繞去 101.12.129.127 11/30 17:41
cores 能反省,還不錯 111.254.144.75 11/30 17:48
chichung 語文辨識gpt還是強 寫程式genmini強 124.6.8.85 11/30 18:37
virus2007 你別用了好嗎?會拉低GEMINI的智商, 49.216.90.250 11/30 19:03
virus2007 害到大家 49.216.90.250 11/30 19:03
enunion 你是不是沒點 思考型 42.77.66.52 11/30 19:50
yao03911 免費版我問一樣的問題,我覺得gemini現 36.230.209.197 12/01 01:30
yao03911 在回答比chatgpt好耶 36.230.209.197 12/01 01:30
homerunball Gemini明明廢爆不知道誰在吹 125.230.201.127 12/01 02:41
‹ 回 八卦板 列表