https://openai.com/index/learning-to-reason-with-llms/
上禮拜OpenAI發布經過強化學習訓練的新型語言模型o1
宣稱模型有更強大的思考能力
o1在回答之前會深入思考產生內部的推理練
結果就是o1模型在各個人類頂尖領域獲得相當好的成績
o1數學方便相當於美國奧林匹克AIME前500名的選手
程式方面位居Codeforce前11%
上禮拜的Leetcode雙週比賽 https://leetcode.com/contest/biweekly-contest-139/ranki
ng/
以12分鐘通關
在物理生物化學領域(GPQA)已經超過人類博士的程度
對科技業比較相關的是 看來以後線上面試考白板題
可能都還要關注面試者眼神有沒有亂飄以防用GPT作弊 但如果是OA好像就無法可防了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.250.51.3 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1726539293.A.A27.html
這樣看來白板題八股文是不是要走入歷史了 以後也不用刷題了
只是是說這些know how未來也會被GPT取代吧 現在都已經能達到這個程度了
SWE以後可能就是負責下指令然後幫gpt review吧
※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:35:00
※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 11:58:58
※ 編輯: NTHUlagka (42.70.92.176 臺灣), 09/17/2024 12:08:38
推文 (71)
推
mydear3310
太興奮了看成OL模型
09/17 10:22
推
hips
現在可以解3.11vs3.9哪個大了嗎?
09/17 10:29
推
koushimei
但是沒辦法貼圖片或者附檔比較麻煩
09/17 10:42
→
somerabbit
搭配cursor使用 ng立刻變senior level
09/17 11:23
推
lemonsheep
不用防吧 以後就不用考白板題啦
09/17 11:29
→
lemonsheep
Gpt 已經比99%的面試者強了
09/17 11:29
→
lemonsheep
以後只剩know how比較重要了
09/17 11:29
推
HiHiCano
軟工刷題仔逝去
09/17 11:45
→
HiHiCano
還好台灣大部分是不用刷題的硬體工作
09/17 11:46
推
musashi023
leetcode這種陋習早該下去了
09/17 11:46
推
Wishmaster
gpt的知識量真的屌虐,自己研究個東西可能要兩三小
09/17 11:51
→
Wishmaster
問一下答案直接套用,雖然不能每次都work也夠了
09/17 11:51
推
HiHiCano
軟工的知識在網路上太多了 很容易訓練
09/17 11:52
推
reprobate
看什麼時候能讓我當甲方直接開需求就把軟體含UI都
09/17 12:04
→
reprobate
寫好
09/17 12:04
推
NTUCS5566
好像網頁製作可以正確產生 bilibili有人測試
09/17 12:41
→
NTUCS5566
直接提需求 code直接寫完 成品網頁直接產生
09/17 12:41
→
NTUCS5566
但我走FW的 看不懂他們在幹嘛 感覺有點厲害就是了
09/17 12:42
推
darkangel119
先拿台灣學測的數學戳戳看
09/17 12:43
推
MAGICMCGRADY
刷題其實不算陋習
09/17 12:45
推
MAGICMCGRADY
台廠聊天面試比較像陋習
09/17 12:49
推
yoyoyolin
以前就說了,現場考實作題比較有鑑別度。考那個leet
09/17 13:03
→
yoyoyolin
code 還不如直接挑本科系人選就好。
09/17 13:03
→
yoyoyolin
考實作題本科系還不一定答的出來。
09/17 13:05
推
MAGICMCGRADY
還好啦,面試還會考系統設計 那才是定級的關鍵
09/17 13:07
→
MagicMomo19
是說還真的把整份需求丟上去過,寫是寫的出來但是畫
09/17 13:42
→
MagicMomo19
面醜爆,有資安檢測也不可能過的那種,頂多就是單一
09/17 13:42
→
MagicMomo19
功能能跑能動,可是串不起來整個流程這樣
09/17 13:42
推
lemonsheep
系統設計大部分人也都是唸書本上的再想辦法兜啊 只
09/17 13:43
→
lemonsheep
要是套現成系統性的知識99%的人都贏不了gpt 的 只
09/17 13:43
→
lemonsheep
剩最後1%真的能做開創性東西的人才還有一席之地
09/17 13:43
推
sy2es6404
https://reurl.cc/OrRqaX 新智元這篇報導說o1 門薩
09/17 13:50
→
sy2es6404
測驗IQ超過120
09/17 13:50
推
ejnfu
刷題慢慢式微也不錯,本來太偏重刷題也不太正確
09/17 13:53
→
yunf
沒差吧他們應該會調整難度
09/17 13:55
→
yunf
畢竟真的問題他解不了
09/17 13:57
→
yunf
上次有個門薩的說pchome會倒閉後來也沒有
09/17 14:06
推
yueayase
其實這些工具出來,即使取代了一些功能,總有別的方
09/17 15:57
→
yueayase
面可以去努力吧
09/17 15:57
推
strlen
還考啥?連職缺都可以關一關了喇
09/17 16:42
推
rodion
不能驗證自己說出口的話 就依舊只是高級 google搜尋
09/17 17:04
推
a9101214
好猛喔拉卡
09/17 17:54
推
create8
也進步太快了…
09/17 18:41
推
andy810306
雙週賽Q4解法醜到爆,這絕對過不了面試的放心
09/17 19:41
推
hobnob
我分享一下我寫1000多題的心得啦,講好聽是單純講
09/17 20:10
→
hobnob
難聽是死板,幫你複習大學學過的資結演算法而已,去
09/17 20:10
→
hobnob
想我們用的工具哪個不是以資結與演算法為基本的?
09/17 20:10
→
hobnob
不知所以然的人還是很多啦,不要說刷題面試是陋習,
09/17 20:10
→
hobnob
題刷不好才有問題
09/17 20:10
推
hobnob
但是週賽是competitive programming,題目本質跟面
09/17 20:13
→
hobnob
試有差
09/17 20:13
推
dont
真要防只能回歸疫情前 onsite都進公司考白板題了吧
09/17 20:32
推
steak5566
應該會回歸真的on site 然後很多場擠在同一天這樣
09/17 21:47
推
VScode
以後應該會優先考system design了
09/17 22:01
推
shortoneal
是說copilot最近變好笨,有甚麼方法可以重製嗎
09/17 22:10
→
shortoneal
他會auto complete一些別的repo的structure...蝦寫
09/17 22:10
→
shortoneal
一波
09/17 22:10
推
bitcch
以後測驗大概會變成看你是否能理解除錯AI生成的答案
09/17 22:22
→
bitcch
以及如何用最佳的prompt來快速建構出程式碼
09/17 22:23
推
AudiA4Avant
說真的,AI寫題這麼強的情況下,以後考算法絕對不是現
09/17 22:53
→
AudiA4Avant
在這樣
09/17 22:53
→
AudiA4Avant
甚至 system design prompt 下對的情況,也能在很短
09/17 22:54
→
AudiA4Avant
時間內透過互動得到一個還行的架構
09/17 22:54
→
TSMCfabXX
HTML 碰到特殊字元還是不行
09/17 23:57
推
dj025258
聽休學後待業超過10年的人談論努力,真是醍醐灌頂,
09/18 07:40
→
dj025258
謝謝開示
09/18 07:40
推
nxuanr
ai 會解決一切問題
09/18 09:09
推
X28338136X
所以現在會寫verilog 了嗎
09/18 15:54
推
Izangel
Nvda內部就有verilog生成器了好嗎
09/18 18:39
推
aasssdddd
4o 9.11>9.9 o1 9.9>9.11 但明顯算比較久
09/19 09:55
推
Izangel
你先提示他9.11跟9.9是純數字,就不會算錯了啦
09/19 10:31