GPT-5.5 API 價格翻倍 強調成本效益更高
連結:https://reurl.cc/3kMegV
時間:2026年4月24日週五 上午6:14
記者署名:Doris
原文內容:OpenAI 正式發佈了 GPT-5.5 代理式模型,聲稱其達到了「用於實際工作和驅動代理程式
的新一代智能」。這款模型旨在自主執行複雜任務,能夠跨多種工具獨立完成工作,並檢
查其自身的輸出。儘管其 API 價格比上一代模型翻倍,但 OpenAI 強調 GPT-5.5 在效率
上有所提升。目前,GPT-5.5 已向付費的 ChatGPT 及 Codex 用戶開放。
提升代理式工作流程與長上下文處理能力
OpenAI 表示,GPT-5.5 在程式碼編寫與除錯、網路研究、數據分析、文件與試算表創建
,以及軟體操作方面表現突出。該模型能夠獨立地在不同工具之間切換,直至任務完成。
OpenAI 指出,GPT-5.5 的主要提升集中在代理式程式設計、電腦使用、知識工作和早期
科學研究等四個領域,這些都需要跨情境推理和長時間執行動作的能力。在針對代理式工
作流程的 Terminal-Bench 2.0 編碼基準測試中,GPT-5.5 取得 82.7% 的分數,超越前
身 GPT-5.4 的 75.1%,同時在困難數學問題上的優勢更為明顯。此外,GPT-5.5 的長上
下文處理能力也大幅改善,在 MRCR v2 基準測試中,其在 512K 至 1M Token 的上下文
長度下,準確率從 GPT-5.4 的 36.6% 躍升至 74.0%。
優勢並非全面性
然而,GPT-5.5 的優勢並非全面性。在測試實際 GitHub 問題解決能力的 SWE-Bench
Pro 基準測試中,Anthropic 的 Claude Opus 4.7 以 64.3% 的分數超越 GPT-5.5 的
58.6%。在由 Scale AI 執行的工具使用基準測試 MCP Atlas 中,GPT-5.5 獲得 75.3%,
仍落後於 Claude Opus 4.7 (79.1%) 和 Gemini 3.1 Pro (78.2%)。同時發佈的
GPT-5.5 Pro 型號,旨在作為更強大的「研究夥伴」,特別適合處理大量上下文的複雜工
作負載。在網絡安全能力方面,OpenAI 將 GPT-5.5 歸類為「高」,並表示其在
CyberGym 基準測試中相較 GPT-5.4 有所改善,達到 81.8%。
心得/評論:
剛剛測試了一下,推理能力真的有上來,之前被酸openai要下去了,這個版本要重返榮耀
了嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.91.32.112 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1776992566.A.AD2.html
確實
※ 編輯: arsl400 (49.216.55.158 臺灣), 04/24/2026 11:32:59
推文 (85)
推
max0616
屌打隔壁4.7
04/24 09:06
推
kuninaka
價格翻倍是要重返榮耀啥
04/24 09:06
推
pponywong
我用Codex-5.4寫程式 覺得它很會飄 常常產生code
04/24 09:06
→
pponywong
偏離主題 即使用AGENT.md 規範它也一樣
04/24 09:06
→
pponywong
但是好處就基本上不限流 沒事就用還行
04/24 09:08
推
moneywinner2
Chatgpt 早就不用了 爛到有剩
04/24 09:09
→
fonzae
蠻多人跳到gemini跟clude
04/24 09:10
推
Tohkachan
不上不下還這麼貴 我看難喔
04/24 09:14
推
gladopo
看脆上蠻獲好評的
04/24 09:15
推
avmm9898
Claude 太貴了 Pro方案問兩個問題就要等5個小時
04/24 09:15
推
jenchieh5
gpt感覺不出有什麼大幅進步了
04/24 09:16
推
Nitricacid
隔壁4.7跑分完就變智障了根本沒屁用
04/24 09:17
推
Muilie
屌打gemini
04/24 09:19
→
max0616
二樓是不知道Claude本來比OpenAI貴多少嗎 嘻嘻
04/24 09:19
→
Chian3675
沒有cowork的功能 沒用
04/24 09:21
→
scottie5138
5.5升級有感,對長任務的效率更高了
04/24 09:24
推
awenracious
Codex好用 目前已從claude轉向用這個
04/24 09:24
→
herculus6502
有競爭是好事 不過claude我大哥
04/24 09:27
→
strlen
Claude現在是垃圾 貴又降智嚴重
04/24 09:30
推
zxcv12300
早就沒用了 太貴了
04/24 09:32
→
b9513227
井蛙整天臭codex 井到笑死 claude現在更臭
04/24 09:37
→
b9513227
現在還有人要吹gemini也是笑死
04/24 09:37
推
jeff22aa22
欸欸欸 我前幾天才跳到Claude誒
04/24 09:41
→
salamender
現在換gemini有點智障
04/24 09:45
→
netsphere
有競爭是好事+1
04/24 09:45
→
salamender
拿他分析數值沒強調要多方查證會給你完全不一樣的
04/24 09:46
→
salamender
結果
04/24 09:46
推
Waitaha
價格翻倍也能吹喔XD
04/24 09:46
推
coffeedemon
沒在接觸使用AI才會臭codex
04/24 09:50
→
ssarc
哈哈哈,繼續當免費仔,他的翻譯還不錯
04/24 09:56
推
quanhwe
Gemini最近一直亂給答案
04/24 09:57
→
ssarc
AI用久了答案都會亂飄很正常
04/24 10:00
→
wr
貴代表他專注在獲利 只想認真服務高階用戶
04/24 10:01
→
wr
那些整天問些智障問題的免費用戶不是他們想要的
04/24 10:02
推
oh753951
所以月訂閱就好,不要一直訂一年的,過陣子龍頭又
04/24 10:04
→
oh753951
換人
04/24 10:04
噓
y0707186
notebooklm屌打
04/24 10:05
推
lp2650056
notebooklm免費又比你強,真的笑死
04/24 10:09
推
lav1147
GEMINI最近變得有點阿諛奉承沒辦法給好建議了
04/24 10:17
推
kuninaka
notebooklm真的超強,免費就很好用
04/24 10:18
→
kuninaka
根本就沒對手
04/24 10:18
推
centaurjr
價格翻倍....XD
04/24 10:20
推
ohlong
5.3才是cp值最高的版本 當無腦碼農
04/24 10:21
推
poisonB
現在都卡算力吧 用戶一多 就自動降智
04/24 10:25
推
sonyvaio
Chatgpt 已經被蛋雕
04/24 10:26
推
uller
gpt 最近比gemini 好很多
04/24 10:27
→
edwinrw
Gpt有變好?
04/24 10:31
推
KrebikShaw
GPT最近變強很多
04/24 10:34
→
KY1998
算力不足可能會跟claude 一樣,水token ?
04/24 10:38
→
kuninaka
GPT 5.3 codex就滿穩定的阿
04/24 10:42
→
kuninaka
鴨子划水
04/24 10:42
推
NiKuKuO
Gemini現在超白癡
04/24 10:46
→
salamender
有在用ai分析股票的,應該都知道gemini數值沒下命
04/24 10:57
→
salamender
令要查證的話浮動超級大,連0050都會給出分割前的
04/24 10:57
→
salamender
價錢。
04/24 10:57
推
ise
gemini 蠢到沒辦法用 claude 又慢又貴
04/24 10:58
推
debris
Gemini最近爛又慢
04/24 11:04
推
visa9527
Opus 4.7 整個跟智障一樣
04/24 11:05
推
eierom
我用目前版本寫程式蠻好用的
04/24 11:09
推
melovejunki
Claude 最近真的越來越難用
04/24 11:10
推
Garbolin
我穩定使用gpt 覺得讚
04/24 11:21
推
blue821229
大概只有免費仔跟低端打工仔會覺得gemini比GPT強
04/24 11:30
推
pmes9866
gemini最近降智太嚴重完全和gpt沒得比
04/24 11:37
推
seemoon2000
gemini坦白說就是他綁定雲端硬碟 如果你不是生產力
04/24 11:46
→
seemoon2000
要用到工作流 買gemini確實是最單純 就問些常識很強
04/24 11:46
→
seemoon2000
而且又送雲端和notebooklm 使用門檻很低
04/24 11:47
推
andy79323
各家老招 吸引一票人又開始降智
04/24 11:47
推
osiris9088
用戶變多算力不足的時候智商就變低了
04/24 12:06
推
DrowningPool
現在Genimi 比較廢
04/24 12:07
→
stocktonty
整天玩跑分宣傳 就跟當年炒顯卡一樣
04/24 12:25
推
sell504387
現在都用阿里爸爸了 誰鳥GPT
04/24 12:29
推
csy0922
notebook lm越來越爛了 一堆白癡網紅拿去亂整理生
04/24 12:32
→
csy0922
白癡圖之後整理得越來越差 還覺得好用的大概沒自己
04/24 12:32
→
csy0922
看內容
04/24 12:32
→
eriker
gemini 3.1 pro跟3.0 flash都不錯吧 個人agent智商
04/24 12:32
→
eriker
基本上就跟每個coding測試級結果一樣
04/24 12:32
→
eriker
可能我codex用不多 gpt分數都很高 但感覺比gemini差
04/24 12:33
→
chaobeilun
gemini就算要求查證股票價格 還是繼續唬爛啊 你妹的
04/24 12:48
推
hegemon
Genimi 連輸入股票代碼都會找錯股票,直接貼文章網
04/24 12:59
→
hegemon
址給他做總結還會出一個跟文章完全沒關係的結果
04/24 12:59
推
hsienchelu
cowork已經取代我了每天在公司就是滑
04/24 13:05
推
pmes9866
現在覺得ai pro升級5T就是為了彌補降智
04/24 13:30
推
Informatik
歐噴ai
04/24 15:04
推
myyalga
吃了那麼多記憶體,結果同一個帳號不能在兩地共通紀
04/24 15:51
→
myyalga
錄。付費還沒法共通很瞎欸
04/24 15:51