[討論] OpenAI GPT o1模型

作者NTHUlagka (拉卡)

標題[討論] OpenAI GPT o1模型

時間Tue Sep 17 10:14:50 2024

https://openai.com/index/learning-to-reason-with-llms/ 上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1 宣稱模型有更強大的思考能力 o1在回答之前會深入思考產生內部的推理練結果就是o1模型在各個人類頂尖領域獲得相當好的成績 o1數學方便相當於美國奧林匹克AIME前500名的選手程式方面位居Codeforce前11% 上禮拜的Leetcode雙週比賽 https://leetcode.com/contest/biweekly-contest-139/ranki ng/ 以12分鐘通關在物理生物化學領域(GPQA)已經超過人類博士的程度對科技業比較相關的是看來以後線上面試考白板題可能都還要關注面試者眼神有沒有亂飄以防用GPT作弊但如果是OA好像就無法可防了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.51.3 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1726539293.A.A27.html 這樣看來白板題八股文是不是要走入歷史了以後也不用刷題了只是是說這些know how未來也會被GPT取代吧現在都已經能達到這個程度了 SWE以後可能就是負責下指令然後幫gpt review吧 ※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:35:00 ※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:58:58 ※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 12:08:38

推文 (71)

推 mydear3310 太興奮了看成OL模型 09/17 10:22

推 hips 現在可以解3.11vs3.9哪個大了嗎？ 09/17 10:29

推 koushimei 但是沒辦法貼圖片或者附檔比較麻煩 09/17 10:42

→ somerabbit 搭配cursor使用 ng立刻變senior level 09/17 11:23

推 lemonsheep 不用防吧以後就不用考白板題啦 09/17 11:29

→ lemonsheep Gpt 已經比99%的面試者強了 09/17 11:29

→ lemonsheep 以後只剩know how比較重要了 09/17 11:29

推 HiHiCano 軟工刷題仔逝去 09/17 11:45

→ HiHiCano 還好台灣大部分是不用刷題的硬體工作 09/17 11:46

推 musashi023 leetcode這種陋習早該下去了 09/17 11:46

推 Wishmaster gpt的知識量真的屌虐,自己研究個東西可能要兩三小 09/17 11:51

→ Wishmaster 問一下答案直接套用,雖然不能每次都work也夠了 09/17 11:51

推 HiHiCano 軟工的知識在網路上太多了很容易訓練 09/17 11:52

推 reprobate 看什麼時候能讓我當甲方直接開需求就把軟體含UI都 09/17 12:04

→ reprobate 寫好 09/17 12:04

推 NTUCS5566 好像網頁製作可以正確產生 bilibili有人測試 09/17 12:41

→ NTUCS5566 直接提需求 code直接寫完成品網頁直接產生 09/17 12:41

→ NTUCS5566 但我走FW的看不懂他們在幹嘛感覺有點厲害就是了 09/17 12:42

推 darkangel119 先拿台灣學測的數學戳戳看 09/17 12:43

推 MAGICMCGRADY 刷題其實不算陋習 09/17 12:45

推 MAGICMCGRADY 台廠聊天面試比較像陋習 09/17 12:49

推 yoyoyolin 以前就說了，現場考實作題比較有鑑別度。考那個leet 09/17 13:03

→ yoyoyolin code 還不如直接挑本科系人選就好。 09/17 13:03

→ yoyoyolin 考實作題本科系還不一定答的出來。 09/17 13:05

推 MAGICMCGRADY 還好啦，面試還會考系統設計那才是定級的關鍵 09/17 13:07

→ MagicMomo19 是說還真的把整份需求丟上去過，寫是寫的出來但是畫 09/17 13:42

→ MagicMomo19 面醜爆，有資安檢測也不可能過的那種，頂多就是單一 09/17 13:42

→ MagicMomo19 功能能跑能動，可是串不起來整個流程這樣 09/17 13:42

推 lemonsheep 系統設計大部分人也都是唸書本上的再想辦法兜啊只 09/17 13:43

→ lemonsheep 要是套現成系統性的知識99%的人都贏不了gpt 的只 09/17 13:43

→ lemonsheep 剩最後1%真的能做開創性東西的人才還有一席之地 09/17 13:43

推 sy2es6404 https://reurl.cc/OrRqaX 新智元這篇報導說o1 門薩 09/17 13:50

→ sy2es6404 測驗IQ超過120 09/17 13:50

推 ejnfu 刷題慢慢式微也不錯，本來太偏重刷題也不太正確 09/17 13:53

→ yunf 沒差吧他們應該會調整難度 09/17 13:55

→ yunf 畢竟真的問題他解不了 09/17 13:57

→ yunf 上次有個門薩的說pchome會倒閉後來也沒有 09/17 14:06

推 yueayase 其實這些工具出來，即使取代了一些功能，總有別的方 09/17 15:57

→ yueayase 面可以去努力吧 09/17 15:57

推 strlen 還考啥？連職缺都可以關一關了喇 09/17 16:42

推 rodion 不能驗證自己說出口的話就依舊只是高級 google搜尋 09/17 17:04

推 a9101214 好猛喔拉卡 09/17 17:54

推 create8 也進步太快了… 09/17 18:41

推 andy810306 雙週賽Q4解法醜到爆，這絕對過不了面試的放心 09/17 19:41

推 hobnob 我分享一下我寫1000多題的心得啦，講好聽是單純講 09/17 20:10

→ hobnob 難聽是死板，幫你複習大學學過的資結演算法而已，去 09/17 20:10

→ hobnob 想我們用的工具哪個不是以資結與演算法為基本的？ 09/17 20:10

→ hobnob 不知所以然的人還是很多啦，不要說刷題面試是陋習， 09/17 20:10

→ hobnob 題刷不好才有問題 09/17 20:10

推 hobnob 但是週賽是competitive programming，題目本質跟面 09/17 20:13

→ hobnob 試有差 09/17 20:13

推 dont 真要防只能回歸疫情前 onsite都進公司考白板題了吧 09/17 20:32

推 steak5566 應該會回歸真的on site 然後很多場擠在同一天這樣 09/17 21:47

推 VScode 以後應該會優先考system design了 09/17 22:01

推 shortoneal 是說copilot最近變好笨，有甚麼方法可以重製嗎 09/17 22:10

→ shortoneal 他會auto complete一些別的repo的structure...蝦寫 09/17 22:10

→ shortoneal 一波 09/17 22:10

推 bitcch 以後測驗大概會變成看你是否能理解除錯AI生成的答案 09/17 22:22

→ bitcch 以及如何用最佳的prompt來快速建構出程式碼 09/17 22:23

推 AudiA4Avant 說真的,AI寫題這麼強的情況下,以後考算法絕對不是現 09/17 22:53

→ AudiA4Avant 在這樣 09/17 22:53

→ AudiA4Avant 甚至 system design prompt 下對的情況,也能在很短 09/17 22:54

→ AudiA4Avant 時間內透過互動得到一個還行的架構 09/17 22:54

→ TSMCfabXX HTML 碰到特殊字元還是不行 09/17 23:57

推 dj025258 聽休學後待業超過10年的人談論努力，真是醍醐灌頂， 09/18 07:40

→ dj025258 謝謝開示 09/18 07:40

推 nxuanr ai 會解決一切問題 09/18 09:09

推 X28338136X 所以現在會寫verilog 了嗎 09/18 15:54

推 Izangel Nvda內部就有verilog生成器了好嗎 09/18 18:39

推 aasssdddd 4o 9.11>9.9 o1 9.9>9.11 但明顯算比較久 09/19 09:55

推 Izangel 你先提示他9.11跟9.9是純數字，就不會算錯了啦 09/19 10:31