Re: [心得] 蘋果揭露人工智能並不思考

作者midas82539 (喵)

標題Re: [心得] 蘋果揭露人工智能並不思考

時間Mon Jun 16 02:04:32 2025

大語言模型(LLM)它的原始目的是要「模仿人類回答出人類看得懂的答案。」但跟人類的語言不同，你我使用的與言語表達會是一系列的文字規則，例如「主詞，動詞，受詞」的SVO結構。但模型本身並不是這樣學習的，它是把你看到的字，拆成詞素(token) 然後將這些詞向量化，變成一系列數列： king → [0.8, 0.1, 0.3, 0.7] queen → [0.9, 0.1, 0.5, 0.9] man → [0.9, 0.0, 0.3, 0.6] woman → [0.8, 0.0, 0.5, 0.8] 這個數列可以很長，例如有必要的話，可以到有300多個。然後模型可以找到特徵。這個特徵用人類可以理解例子，就姑且濃縮成一個角度，便為說明就簡化成： king=右上 man=右上 queen=左上 woman=左上那麼就算是你，也可以找到king跟man都是右上，故似乎有關連性。而king跟queen角度不同，所以這兩個不是同樣的東西。再把朕、殿下、皇帝、國王，排在一起。只要資訊夠多，理論上是可以讓模型自己圈出有向量角度相近的集合。我們可以再增加這個字出現在字首、字尾、中間第幾個字的頻率作為變數。那麼就可以算出這個字出現在哪裡的特徵比較大。這時我們回到剛剛的SVO結構，模型就可以在不懂中文，但憑統計出的特徵，可以拼湊出一個你可以看懂的中文回答。然而這並不是人類的理解與語意判定，以及衍伸的推理。所以它就會造就出「中文房間」的錯覺，例如假設一個外國人被關在房間。但他有一本教戰手則，上面說明了那些字出現了，可以給出哪些答案。那他就算不懂中文，在手冊的指引上也可以回答定型文。大語言模型也是同樣的概念，它是基於大量的資料來找出「特徵」，而這些特徵的組合在在它的神經網絡會給予特定的權重，最後形成類似"手冊" 的東西，然後依照手冊找到近似值的解答，生成給你看。但它不見得是理解回答是否有意義，所以才會出現錯誤。比如說很常見的，現在threads被一堆詐騙仔用AI生成圖片，例如啥我是護理師給我一個讚好嗎？但裡面的圖片會出現一些錯誤，例如敘述自己是75年出生，但生成的身分證是57年出生。或者有生成名字了，但它的字型大小很明顯不一致。然而對於模型來說，它不會知道"怎麼樣才是對的格式"，而它只是針對中華民國身分證大概是長怎樣，而隨機生成一個結果。故單純直接產出，就免不了會有以上的問題。 GPT4-O3它是說有多一個推理功能。然而它的底層還是大語言模型(LLM) 加上它的數據處理是弄成很長串的多維資料，你人類也看不懂，所以你還是不會知道，它的推理過程，是不是也是模仿生成人類看得懂的邏輯。但這個算法是否正確與必要，不見得正確。這個問題在你處理只有你會面對的數學問題就有機會發生。例如假設你要模型生成一個模型由0至指定最大值，與指定最小值機率遞減，而機率遞減的分配公式，正常我們人類就是設一個權重來分配。但我問過O3它就很奇葩，它想用自然常數來分配，然後算式會出現錯誤。其他你看過的就是GPT跟deepseek下西洋棋，結果deepseek憑空出現棋子，或者無視規則走奇怪的動作。這些都說明了語言模型並不是真的了解規則，而只是像兩隻猴子看人類下棋，而模仿人類玩西洋棋。由於這不是你熟知的建立規則(base rule)，所以在面對複雜的隨機模擬。它可能做出錯誤的資訊，而你沒有發現錯誤的話，它就會繼續引用上下文而給出錯誤的結論，但你看起來覺得是對的。比如說你不會選擇權，但你想要模型直接生成一個賣方與調整策略。而模型基於call有正的delta，而錯誤認為sell call也有正dela，那它就會繼續基於錯誤資訊引用，而得出：當標的價格趨近於SC履約價，整體delta會變正而且增加，故需要買put調整的規則。當然對我來說我可以看出哪裡有問題，但對於沒有理解的人來說，那他就不會發現這個推理與建立規則錯誤，就會導致利用而產生虧損。而這我認為基於大語言模型的訓練方式，本質上是無解。你只能靠自己判斷模型的回答是否邏輯正確。而不是期望模型像神燈精靈，你不用會你也可以產出一個東西跟專業的人競爭。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 192.253.210.90 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Stock/M.1750010675.A.954.html

推文 (199)

推 aegis43210 人類的建立規則是靠五感的回饋機制不斷修正而來，但 06/16 02:09

→ aegis43210 LLM只能靠文字 06/16 02:09

推 eric878787 目前AI只負責生成，不負責對錯 06/16 02:12

推 qwe78971 LLM 講白只是接受很多數據然後連連看哪個規律最 06/16 02:15

→ qwe78971 高最匹配就用哪個不是真正 thinking 根本不是AG 06/16 02:15

→ qwe78971 I的方向一旦碰到的東西沒這數據就當機了沒有學 06/16 02:15

→ qwe78971 習及糾錯能力跟人腦差距還是太大 06/16 02:15

→ haha98 我比較認同Ilya的看法目前的LLM甚至 MLLM只是一種 06/16 02:24

→ haha98 基於語意的壓縮世界模型離真正的世界模型還差的遠 06/16 02:25

推 fajita 目前的模型，等老黃賣到G2兆時看能不能突破 06/16 03:09

推 abc12812 alphago下棋就沒這種問題 06/16 03:20

推 edward0811 生成式AI就大騙局，非人類進步方向 06/16 03:46

推 s0914714 生成式AI的概念可能只是人類思考的一部分而已 06/16 03:55

→ bobogei81123 講的好像別人跟你說一句話你是先拆成主詞受詞... 06/16 04:55

→ bobogei81123 再去理解分析的 06/16 04:55

推 ripple0129 其實大量的迴歸與收斂，最後答案都會越來越正確， 06/16 05:21

→ ripple0129 只是在於有沒有人校正什麼是錯誤什麼是正確。AI本 06/16 05:21

→ ripple0129 來就不應該完全與人類相同的思考模式發展，否則就 06/16 05:21

→ ripple0129 不可控了。讓AI限縮在LLM的極致與正確性，或許對人 06/16 05:21

→ ripple0129 類是一種安全的選擇。 06/16 05:21

推 guanting886 短時間內LLM還是要依賴Scale AI這類公司做資料清洗 06/16 06:04

→ guanting886 、修正跟媒合血汗打工仔幫忙打標籤沒有工人智慧就 06/16 06:04

→ guanting886 沒有你現在看到的人工智慧 06/16 06:04

推 guanting886 目前人們要的就是想要一個酷東西他們才不會在乎後 06/16 06:08

→ guanting886 面到底是統計模型還是真的會推理包括整個行業可 06/16 06:08

→ guanting886 能也不想戳這個東西的真相 06/16 06:08

推 guanting886 蘋果的論文可惜的是他發表的時間讓他們很尷尬只有 06/16 06:15

→ guanting886 被討罵的份而已 06/16 06:15

→ guanting886 現在的Ai被包裝的很好會有讓用戶認為他們是全能的 06/16 06:18

→ guanting886 但可能要小心其實會錯大包括整理資料跟分析講結 06/16 06:18

→ guanting886 論 06/16 06:18

→ guanting886 用戶事後都要去驗證但新的問題又來了當你習慣什 06/16 06:20

→ guanting886 麼東西的丟給這樣的模型去幫你做整理你要核實數字 06/16 06:20

→ guanting886 的難度就會變高 06/16 06:20

推 guanting886 因為藉由Ai你獲得了一個極佳的槓桿你甚至可以一次 06/16 06:21

→ guanting886 做的工作量變得以往多好幾倍 06/16 06:21

→ guanting886 但也丟出很大的工作量給Ai 你無法有限的時間核實A 06/16 06:23

→ guanting886 i給你說的數據是否正確最後你會鬼遮眼選擇忽略會 06/16 06:23

→ guanting886 發生這個問題的事實 06/16 06:23

推 guanting886 （之前拿某個模型來分析資料看了模型在推理過程直 06/16 06:30

→ guanting886 到他崩潰/幻覺，不難想像如果這樣的東西要在蘋果手 06/16 06:30

→ guanting886 機上，我看某個用戶可能因為某個原因發生嚴重問題 06/16 06:30

→ guanting886 我看集體訴訟就來了 06/16 06:30

→ ewayne 14樓，不然呢？還是你以為你可以在主詞受詞動詞都搞 06/16 06:37

→ ewayne 不清楚的狀態下就能理解一個句子？ 06/16 06:37

推 dildoe 隨便問個簡單問題都略過萬數量詞了XD 06/16 06:39

推 pujos @24樓，你可以藉由他有十倍百倍工作量，但你沒有十 06/16 06:54

→ pujos 倍、百倍的驗證能量，所以錯誤就成了必然 06/16 06:54

→ pujos 你還沒能力預防、控制這個“錯”，會不會出在什麼巨 06/16 06:55

→ pujos 大的地方 06/16 06:55

推 NTUT56 看起來背後就一堆線性代書運算 06/16 07:05

→ NTUT56 所以線代真的超重要的，從來不會退流行 06/16 07:05

→ bobogei81123 6歲小孩根本沒聽過主詞受詞這些概念還不是聽得懂人 06/16 07:19

→ bobogei81123 話 06/16 07:19

推 NTUT56 人家有爸媽天天跟他練英文，你有嗎 06/16 07:20

→ NTUT56 而且美國的小孩一樣要上英文課 06/16 07:20

噓 chang1248w 現在token embedding dim不是2048起跳嗎= = 06/16 07:34

推 zero00072 有點概念了，有點像人類識別顏色座標，相近的顏色座 06/16 07:36

→ zero00072 標相近；但是色弱的座標相對狹窄。 06/16 07:36

推 mdkn35 詞性只是能更複雜地形容精確的狀態不然只有名詞也 06/16 07:37

→ mdkn35 是能描述 06/16 07:37

推 kobebrian 這篇描繪的算蠻深入淺出 06/16 07:39

推 xephon 沒辦法很多猴子覺得AI會思考人類要毀滅了 06/16 07:44

推 Samurai 這篇很專業了，LLM基礎就是模糊性，才適用語言交流 06/16 07:51

→ Samurai ，拿來算數學容易錯誤 06/16 07:51

→ pujos 不是算數學容易錯，而是這玩意容易驗證，對就對、錯 06/16 07:54

→ pujos 就錯，生成其他文本類，錯了你也看不出來 06/16 07:54

→ pujos 實際上它的架構、答案生成方式，就決定他做什麼都是 06/16 07:55

→ pujos 容易出錯 06/16 07:55

推 prmotolprlin 專業推讚讚 06/16 08:09

推 jorden AI弄個網格交易工具可以要玩期貨可能有難度 06/16 08:14

推 gold9450412 我喜歡台大教授李宏毅的說法大家都說AI只是找機率 06/16 08:24

→ gold9450412 最大的排列組合成句子不是思考 06/16 08:24

→ gold9450412 但人類大腦何嘗不是這樣操作同樣是計算出最有可能 06/16 08:24

→ gold9450412 的答案 06/16 08:24

推 ohlong LLM只是像大腦裡面掌管語言的區塊模仿的功能跟字 06/16 08:27

→ ohlong 彙更強一點我們也是從小透過學習文法跟單字可以拼 06/16 08:27

→ ohlong 湊出語意暢通的句子 LLM就像模仿片語的巨量化而觀 06/16 08:27

→ ohlong 察小朋友還牙牙學語時早就有思考邏輯能力了 AGM真 06/16 08:27

→ ohlong 的還早 06/16 08:27

推 horseorange 推 06/16 08:28

→ kkking 台灣填鴨教育教出來的也沒好多少 06/16 08:32

推 Homeparty 寫代碼跟畫圖好用，因為是人類創造有邏輯規則。但 06/16 08:44

→ Homeparty 無法普及現實世界，因為現實轉換向量過於複雜。 06/16 08:44

推 Samurai AI思考方式就跟人腦一樣，至於容不容易出錯，很難 06/16 08:46

→ Samurai 定義，現在讓AI寫考卷，已經贏一大票學生了 06/16 08:46

推 a1379 推這篇現在的AI跟人們幻想的AI根本是兩回事 06/16 08:48

推 dearevan 推 06/16 08:53

推 vovovolibear 長知識了 06/16 09:03

推 kyukyu 謝謝分享 06/16 09:08

→ etrangere 我猜那個推理也是偵測到關鍵字call function而已xD 06/16 09:14

推 a1234567289 推本篇 06/16 09:16

推 ProTrader 對於AI與機器學習來說自有資訊分析與呈現的方式 06/16 09:17

→ ProTrader 目前模型跟人類真正的資訊分析呈現方式並不相同 06/16 09:18

→ ProTrader LLM只是盡可能讓結果與人類語言類似 06/16 09:19

推 steven961302 好文 06/16 09:20

→ ProTrader 這些模型分析追求的是最大可能性並不能保證正確 06/16 09:21

→ ProTrader 從google搜尋的角度來看這是更好用的智慧型搜尋 06/16 09:23

→ ProTrader 然而這還不是有可靠度的任務代理人 06/16 09:24

推 Sinreigensou 推所以大型語言模型才有幻覺問題 06/16 09:27

→ Sinreigensou 所以我搜尋東西還是盡可能用傳統搜尋引擎 06/16 09:27

推 fan415 不管你說的對不對，人家已經打趴9成人類的工作，該 06/16 09:34

→ fan415 慶幸機器不能像牛馬一樣負責任扛包，不然哪還有工 06/16 09:34

→ fan415 作給你做 06/16 09:34

推 addy7533967 線代...死去的記憶在攻擊我 06/16 09:36

→ ARTORIA 9成...要吹也別這麼誇張連大部分低端工作都還不能 06/16 09:40

→ ARTORIA 做你跟我說9成 06/16 09:41

→ takase 所以需要對齊啊 06/16 09:41

推 strlen 其實我忘了在哪個地方看過底層是靠機率在排出答案 06/16 09:46

→ strlen 的這個模式並不一定是錯的喔想想看這世界基本是 06/16 09:47

→ strlen 量子力學所組成的量子力學本身就有隨機性 06/16 09:47

→ strlen 所以代表這個世界的基礎其實也是建立在機率之上 06/16 09:47

→ strlen 那為什麼量子能達到現在這樣「看似」普通的穩定態？ 06/16 09:48

→ strlen 答案就在量子的規模夠巨大隨機性被降到極低就沒 06/16 09:49

→ strlen 事惹這也是為何奧本海默團隊有人就計算到核彈是有 06/16 09:50

→ strlen 機率燒掉整個大氣層連鎖反應停不下來但很低而已 06/16 09:50

→ strlen LLM用機率當底層也沒什麼關係吧？出錯的機率夠低就 06/16 09:50

→ strlen 好了簡單說方向就是把算力當量子他X加爆就對了 06/16 09:51

推 moonlovemai 蘋果的不行不代表別人的也不行 06/16 09:55

→ liliumeow 人腦可能就是這樣思考的 06/16 09:56

推 pmes9866 人類大腦的預測能力屌打LLM 06/16 10:00

噓 uller LLM確實是統計機率並不會思考，但這就必經的路，不 06/16 10:09

→ uller 是說，這沒用，我不要研究。那你蘋果乖乖滾下去吧 06/16 10:09

推 hank850503 如果智慧的本質就是這樣呢？ 06/16 10:23

→ hank850503 LLM 現在辦到的就是我家鸚鵡會的 06/16 10:23

推 dream1124 推解釋 06/16 10:40

→ VicLien 社群媒體狂洗某隻股票利多就是一堆人會去買誰說A 06/16 11:02

→ VicLien I不如人 AI插電就學習串越多學越快取代5成人類 06/16 11:02

→ VicLien 認知很難嗎 06/16 11:02

推 AlarmAlarm 用這麼久AI 要由人判斷正確不是很明顯嗎一堆說專 06/16 11:07

→ AlarmAlarm 業要被取代就覺得好笑講這種話的AI都沒用過幾次吧 06/16 11:07

推 axz123999 推推 06/16 11:48

→ aloness 驗證這個狀況只適合擁有專業的人來執行，對外行人 06/16 12:13

→ aloness 來講，不論是透過ai給答案，還是自己翻書湊答案， 06/16 12:13

→ aloness 無法保證兩邊都能對，此時ai因為被問過同樣類型的 06/16 12:13

→ aloness 問題次數多，ai的答案方向或許還比自力學習來的可 06/16 12:13

→ aloness 靠 06/16 12:13

→ aloness ai並不是在創造解答，但一般人遇到的問題多半都是 06/16 12:15

→ aloness 另一個人每月每年都在處理的，ai只是在各領域吸收 06/16 12:15

→ aloness 每月每年都在處理的例行公事，回答提問人 06/16 12:15

→ Tatsuya72 標籤這件事就代表工人智慧 06/16 12:44

→ Tatsuya72 靠吹AI欺世盜名撈錢的共犯結構沒那麼容易放棄 06/16 12:46

→ Tatsuya72 加上戰爭的因素，給了他們能最大化剝削資源的機會 06/16 12:47

→ Tatsuya72 操弄恐懼 06/16 12:48

→ Tatsuya72 如一年前提過，過度投資的泡沫會比想像中更快到來 06/16 12:49

推 guanting886 長期使用下來的心得：只利用他的統計特性減少我找 06/16 12:52

→ guanting886 尋某一種全新知識的時間至於他能不能直接解決問題 06/16 12:52

→ guanting886 通常不能 06/16 12:52

推 guanting886 就連詐騙集團都認爲LLM做翻譯裡面的文法都不一定 06/16 12:55

→ guanting886 是常用或合理的 06/16 12:55

推 guanting886 數值運算證明了只要他不call python來算，他的回 06/16 12:58

→ guanting886 答是基於數據裡面某一種類別的資料的解題過程來湊 06/16 12:59

→ guanting886 答案就好比一個沒唸書的學生為了應付考試題目什 06/16 12:59

→ guanting886 麼他就到處看書的東湊西湊只求這題能寫點什麼 06/16 12:59

推 guanting886 他的狀況很像阿里巴巴全球數學競賽醜聞那位被老師 06/16 13:00

→ guanting886 當分身帳號使的少女 06/16 13:00

→ guanting886 她根本無法解題只是受老師指示抄給她的答案送上去 06/16 13:02

→ guanting886 要她真的理解根本不能因為她連某些公式符號是什 06/16 13:02

→ guanting886 麼都不知道 06/16 13:02

→ guanting886 寫程式碼這件事只能說更離譜因為特性的關係程式 06/16 13:03

→ guanting886 碼都是掰的（LLM特性） 06/16 13:03

→ guanting886 就好比你在stackoverflow發起一個問題結果回答你 06/16 13:04

→ guanting886 的人解決方案都是想像出來的他也跑過 06/16 13:04

→ guanting886 也沒跑過（這個部分大概要解決只能要讓ai想程式 06/16 13:08

→ guanting886 碼的時候要同步出你的環境條件藉由不間斷的試錯 06/16 13:08

→ guanting886 他可能才勉強真的驗證過回答是正確的 06/16 13:08

推 guanting886 但實現上困難簡單環境可以複雜一點他的運算資源 06/16 13:09

→ guanting886 會反向被濫用或DDoS別人 06/16 13:09

推 Samurai 人思考過程也是一樣啊，根據學習經歷去找出能解決 06/16 13:09

→ Samurai 問題的方法，只是目前模型沒這麼全能 06/16 13:09

→ guanting886 目前LLM是能解決某些問題但是他的一開始的架構就 06/16 13:11

→ guanting886 已經決定他的極限在哪 06/16 13:11

→ guanting886 人類學習過程會試錯得到經驗 06/16 13:11

→ guanting886 LLM是抄題仔他的答案是沒有被驗證過的 06/16 13:12

推 Samurai 模型學習本質就是試錯得到經驗，也一樣 06/16 13:12

→ Samurai 另外模型訓練過程，資料會分成驗證組，不是沒驗證 06/16 13:13

→ guanting886 如果他要為他的答案負責大多數你大概會寧可關掉視 06/16 13:13

→ guanting886 窗因為非常慢運氣好他陷入幻覺你要的答案根本你 06/16 13:13

→ guanting886 等不到 06/16 13:13

→ guanting886 為什麼Scale Ai這間公司很重要因為數據來源跟有沒 06/16 13:14

→ guanting886 有做好整理就大多決定了模型的能力 06/16 13:14

推 guanting886 我認為現在研究團隊應該就是趁這個時間在熱度的高 06/16 13:16

→ guanting886 峰拿到投資人的錢看能不能解決LLM的真實痛點 06/16 13:16

推 Samurai 人也是一樣啊，唸了國文課本但去考數學一樣爆炸XD 06/16 13:16

→ guanting886 在這之前大家都會盡可能拖就拖 06/16 13:17

→ guanting886 嗯。～我只想表達LLM真的離通用Ai真的蠻遠的但也 06/16 13:18

→ guanting886 因為這個東西的誕生人們之間的資訊落差的確有改 06/16 13:18

→ guanting886 善 06/16 13:18

推 jodawa 推 06/16 13:19

推 rickyiu 推 06/16 13:25

推 johnlin35 推 06/16 13:46

推 KrisNYC 問題是現在有一個軍備競賽強迫一大部分的資源錯置 06/16 14:24

→ KrisNYC 這個方向並沒有錯只是單用這個方法走不到終點而已 06/16 14:25

噓 chenyei 你的中文很不通順，外國人？ 06/16 15:05

推 ctes940008 對答案 06/16 15:14

噓 lavign 語言是離散的有限的，真實世界是連續的無限的 06/16 17:31

推 lavign 數位資料的離散性就注定AI永遠不能真的思考 06/16 17:36

推 hanhsiangmax 推 06/17 01:59

推 jiusishuai 推推 06/17 07:32