Re: [閒聊] Gemini的ACG超自信幻覺更嚴重了 - PTT 文章瀏覽

作者wei115 (社畜)

標題Re: [閒聊] Gemini的ACG超自信幻覺更嚴重了

時間Fri Apr 24 14:28:36 2026

原文PTT 原始連結 ↗

這就現在大模型的問題惹模型是無狀態的，他的知識量只截止到訓練前之後跑起來後，他都不會更新特別是模型越來越大，知識量越來越多的情況下模型會越來越自信他覺得他是對的，就算有搜尋工具可以使用，他也傾向直接回答，而不是去用工具反而一些參數比較小的模型會更積極的去使用搜尋工具但小模型的指令遵循性更差，理解力也不如大模型所以更有可能胡言亂語，或是把搜尋結果與提示詞搞混這之間的度還是很難把握的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.90.253 (臺灣) ※ 文章網址: https://webptt.cc/bbs/C_Chat/M.1777012118.A.2C6.html

推文 (44)

推 error405 https://www.youtube.com/watch?v=bMFFpAN2cWU 04/24 14:32

→ error405 稍早刷到這個在講類似問題 04/24 14:33

推 kirimaru73 現在容易出現下面這種問題： 04/24 14:33

→ kirimaru73 使用者：你必須使用搜尋工具，根據找到的最新資料回答 04/24 14:33

→ kirimaru73 這個問題，不要只依賴你原本有的資訊 04/24 14:34

→ kirimaru73 AI：好的，我一定會使用搜尋工具，根據找到的最新資料 04/24 14:34

→ kirimaru73 來回答問題，關於你想知道的事情實際上是...... 04/24 14:34

→ DendiQ Gemini的問題，我ChatGPT Plus用很久了就不像Gemini那樣 04/24 14:35

→ kirimaru73 然後你如果知道什麼叫做文字接龍，就能想像前面這句話 04/24 14:35

→ kirimaru73 的可靠性了 04/24 14:35

→ kirimaru73 當然你可以用訓練防止光說不練，但終究無法避免 04/24 14:35

推 rgbff 人也是一樣吧，如果你自信答案是正確的可能也會省去求證 04/24 14:41

推 EXTECH 請查一下網路，關於balabala...我想問... 04/24 14:41

推 webermist 你叫Gemini先做搜尋就會抓到新資料了 04/24 14:43

推 vsepr55 一堆prompt真的有比直接查快嗎== 04/24 14:46

→ necrophagist 所以你可以依照需求建立不同系統題詞模板 04/24 14:48

推 kirimaru73 你可以叫他一定要搜尋，但各家模型的可靠度不太一樣 04/24 14:48

→ kirimaru73 然後身為一個情緒價值模型，他一定會承諾他有遵命 04/24 14:48

→ necrophagist 跟他聊天打屁和寫專業報告不會使用同一個操作模 04/24 14:49

→ necrophagist 板 04/24 14:49

推 GenShoku 現在要搜東西grok都比gemini好常常提示要先搜尋了結果 04/24 14:49

→ GenShoku 第一次就是不愛搜非要錯一次被指正才肯乖乖調用搜尋 04/24 14:49

推 Adlem 可以貼截圖打臉Gemini 請他檢討自己至少可以看哪步有問題 04/24 14:51

→ ap525922 越來越像人了，我知道的事情幹嘛還要再搜尋 04/24 14:52

推 kirimaru73 打臉檢討環節就類似人工智慧教學中「讓我們看看AI有沒 04/24 14:53

→ kirimaru73 有自我反省能力」的環節了，這是很有意思的事情沒錯 04/24 14:53

→ kirimaru73 但你如果要做的事情很單純，你自己不是早就菇狗完了嗎 04/24 14:53

推 maria001 Google關鍵字搜尋比較快，出來的結果不一定能直接用需 04/24 14:54

→ maria001 要自己閱讀理解重構，AI回覆比較慢，但出來的結果可以 04/24 14:54

→ maria001 直接用不過不一定正確，贏在不用動腦丟給AI重做就好 04/24 14:54

推 h0103661 檢討沒用，AI下次還敢 04/24 14:54

→ ap525922 用gemini就是要不停的質詢他，也是挺有意思的 04/24 14:55

推 Adlem 有時就省時間而已丟個問題就先去做別的事情了 04/24 14:56

→ Adlem 整理出來的排版也比翻一堆網站來的好吸收 04/24 15:00

推 bheegrl AI老害 04/24 15:06

推 aegius1r https://i.urusai.cc/21iOK.png 昨天還前天遇到的一題 04/24 15:06

→ aegius1r gpt抓不到網址內容直接猜答案www 04/24 15:07

推 onionandy Gemini不一定我最近會直接要他從指定網站撈資料而不是 04/24 15:09

→ onionandy 他自己不知哪來的結果但她根本沒管 04/24 15:09

推 arrenwu "可以直接用不過不一定正確" <-- 這句話前後矛盾了吧=D= 04/24 15:10

推 maria001 可以丟下去跑，但結果不一定對這樣 04/24 15:14

→ maria001 用指令燒token的方式，正確率似乎可以隨著信用卡燃燒的 04/24 15:18

→ maria001 速度提升 04/24 15:18

→ smart0eddie 想搜尋的話用 google AI mode 吧 04/24 16:16