這就現在大模型的問題惹
模型是無狀態的,他的知識量只截止到訓練前
之後跑起來後,他都不會更新
特別是模型越來越大,知識量越來越多的情況下
模型會越來越自信
他覺得他是對的,就算有搜尋工具可以使用,他也傾向直接回答,而不是去用工具
反而一些參數比較小的模型
會更積極的去使用搜尋工具
但小模型的指令遵循性更差,理解力也不如大模型
所以更有可能胡言亂語,或是把搜尋結果與提示詞搞混
這之間的度還是很難把握的
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.90.253 (臺灣)
※ 文章網址: https://webptt.cc/bbs/C_Chat/M.1777012118.A.2C6.html
推文 (44)
推
error405
https://www.youtube.com/watch?v=bMFFpAN2cWU
04/24 14:32
→
error405
稍早刷到這個在講類似問題
04/24 14:33
推
kirimaru73
現在容易出現下面這種問題:
04/24 14:33
→
kirimaru73
使用者:你必須使用搜尋工具,根據找到的最新資料回答
04/24 14:33
→
kirimaru73
這個問題,不要只依賴你原本有的資訊
04/24 14:34
→
kirimaru73
AI:好的,我一定會使用搜尋工具,根據找到的最新資料
04/24 14:34
→
kirimaru73
來回答問題,關於你想知道的事情實際上是......
04/24 14:34
→
DendiQ
Gemini的問題,我ChatGPT Plus用很久了就不像Gemini那樣
04/24 14:35
→
kirimaru73
然後你如果知道什麼叫做文字接龍,就能想像前面這句話
04/24 14:35
→
kirimaru73
的可靠性了
04/24 14:35
→
kirimaru73
當然你可以用訓練防止光說不練,但終究無法避免
04/24 14:35
推
rgbff
人也是一樣吧,如果你自信答案是正確的可能也會省去求證
04/24 14:41
推
EXTECH
請查一下網路,關於balabala...我想問...
04/24 14:41
推
webermist
你叫Gemini先做搜尋 就會抓到新資料了
04/24 14:43
推
vsepr55
一堆prompt真的有比直接查快嗎==
04/24 14:46
→
necrophagist
所以你可以依照需求建立不同系統題詞模板
04/24 14:48
推
kirimaru73
你可以叫他一定要搜尋,但各家模型的可靠度不太一樣
04/24 14:48
→
kirimaru73
然後身為一個情緒價值模型,他一定會承諾他有遵命
04/24 14:48
→
necrophagist
跟他聊天打屁 和 寫專業報告 不會使用同一個操作模
04/24 14:49
→
necrophagist
板
04/24 14:49
推
GenShoku
現在要搜東西grok都比gemini好 常常提示要先搜尋了 結果
04/24 14:49
→
GenShoku
第一次就是不愛搜 非要錯一次被指正才肯乖乖調用搜尋
04/24 14:49
推
Adlem
可以貼截圖打臉Gemini 請他檢討自己 至少可以看哪步有問題
04/24 14:51
→
ap525922
越來越像人了,我知道的事情幹嘛還要再搜尋
04/24 14:52
推
kirimaru73
打臉檢討環節就類似人工智慧教學中「讓我們看看AI有沒
04/24 14:53
→
kirimaru73
有自我反省能力」的環節了,這是很有意思的事情沒錯
04/24 14:53
→
kirimaru73
但你如果要做的事情很單純,你自己不是早就菇狗完了嗎
04/24 14:53
推
maria001
Google關鍵字搜尋比較快,出來的結果不一定能直接用需
04/24 14:54
→
maria001
要自己閱讀理解重構,AI回覆比較慢,但出來的結果可以
04/24 14:54
→
maria001
直接用不過不一定正確,贏在不用動腦丟給AI重做就好
04/24 14:54
推
h0103661
檢討沒用,AI下次還敢
04/24 14:54
→
ap525922
用gemini就是要不停的質詢他,也是挺有意思的
04/24 14:55
推
Adlem
有時就省時間而已 丟個問題就先去做別的事情了
04/24 14:56
→
Adlem
整理出來的排版也比翻一堆網站來的好吸收
04/24 15:00
推
bheegrl
AI老害
04/24 15:06
推
aegius1r
https://i.urusai.cc/21iOK.png 昨天還前天遇到的一題
04/24 15:06
→
aegius1r
gpt抓不到網址內容 直接猜答案www
04/24 15:07
推
onionandy
Gemini不一定 我最近會直接要他從指定網站撈資料而不是
04/24 15:09
→
onionandy
他自己不知哪來的結果 但她根本沒管
04/24 15:09
推
arrenwu
"可以直接用不過不一定正確" <-- 這句話前後矛盾了吧=D=
04/24 15:10
推
maria001
可以丟下去跑,但結果不一定對這樣
04/24 15:14
→
maria001
用指令燒token的方式,正確率似乎可以隨著信用卡燃燒的
04/24 15:18
→
maria001
速度提升
04/24 15:18
→
smart0eddie
想搜尋的話用 google AI mode 吧
04/24 16:16