原文標題:馬斯克吹了半年的模型終於發布:Grok 3 你需要知道的所有信息
原文連結:https://news.qq.com/rain/a/20250218A04EFA00
發布時間:2025-02-18 13:29
記者署名:歸藏
原文內容:
從 24 年底馬斯克就開始給他們新建巨大計算中心訓練的 Grok3 模型開始預熱了,今天中午 12 點的直播活動中終於發布了 Grok3。
這次馬斯克開始玩真的了,不僅模型的素質跟上了 Open AI 的 O1,而且在產品功能上全面對標 ChatGPT。
訓練的硬件
Musk 聲稱 Grok 3 的開發使用了比其前身 Grok 2「10 倍」多的計算資源,xAI 一直在使用位於孟菲斯的一個龐大數據中心——一個包含約 20 萬個 GPU 的數據中心——來訓練 Grok 3。其中的一期工程只用了 122 天就完成了,工程這塊還得看馬斯克。
圖片
模型能力
Grok 3 的訓練量是 Grok 2 的 10 倍,在 1 月初完成了預訓練,即使現在依然在訓練過程中。
Grok3 包含兩個模型版本 Grok3 和 Grok3-mini,Grok 3 AIME 和 GPQA 在內的基準測試中顯著優於其他模型,如 Gemini 2 Pro 和 GPT-4o。即使是 Grok-3 mini 也表現不錯。目前的早期版本在 Elo 機製的 LLM 競技場 1400 分排第一。
圖片
同時 Grok3 也具備推理能力,馬斯克表示在代碼能力上 Grok3 非常強,同時在推理時不會展示原始思考過程。
至於推理性能,在提供更多測試時間計算資源(使其能夠思考更長時間)的情況下,它優於 o1 和 DeepSeek-R1。
Grok 3 Reasoning Beta 在 AIME 2025 上的表現也高於 o3-mini-high。
圖片
深度搜索功能
除了模型能力對標 Open AI 之外,前沿的 Agents 能力也必須跟上,Grok3 支持類似 Open AI 深度研究的 DeepSearch能力。
這個功能模型能夠深入思考用戶意圖、需要考慮哪些事實、要瀏覽多少個網站、可以交叉驗證不同來源,確保信息的真實性。DeepSearch 還會公開其執行搜索本身所采取的步驟。
圖片
如何使用和收費
目前最先可以體驗到 Grok3 的渠道應該是推特的 X Premium+ 會員,同時他們也推出了單獨的 Grok 網站和 APP。
另外還有搭配單獨有用的 Super Grok 會員,支持 Grok 3的權限、解鎖DeepSearch和Think功能、搶先體驗新功能、更高的圖像生成限製等。
圖片
未來規劃
網頁和應用的所有功能會在一周內推全、API 會在幾周內推出。
一周後還會有由 Grok 驅動的語音應用即將推出。
另外 Grok2 可能會在幾個月後開源,最後一個版本將在最新版本完全發布後開源。
心得/評論:
grok3相當於在給deepseek打配合吧。
花了DS200倍的訓練成本,提高了一點點分數。恰恰證明了堆硬件的路徹底走不通了,毫無意義
我覺得今晚NASDAQ跌的就是這個吧。還有什麽原因呢
--
當心,被擊沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 171.14.60.249 (中國)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1739978254.A.F0B.html
推文 (92)
推
gino0717
可以色色嗎
02/19 23:18
推
SRNOB
沒強多少 1%多 耗能更多
02/19 23:20
→
zzzbear
也吹太久
02/19 23:21
推
qwe78971
貴 沒什麼用 目前跟各大佬聊 價格一致看衰
02/19 23:21
→
SRNOB
大力出奇蹟已經出現邊際效益遞減
02/19 23:21
→
s1612316
只要還不是獨大 成本就別想回收
02/19 23:25
→
s1612316
收費至少要再少一百倍
02/19 23:26
推
gladopo
馬老闆的東西不用回收,再吹一下就一堆融資
02/19 23:27
推
ter2788
OPENAI做一個我也做一個 明明是差不多的東西但錢還
02/19 23:29
→
ter2788
是要花
02/19 23:29
→
ter2788
這是力大飛磚 但也是做差不多的東西
02/19 23:29
→
gladopo
他就看openai不爽啊,要自己搞一個
02/19 23:31
推
SRNOB
這條路有點到底了 資料也都訓練完 只能另辟蹊蹺
02/19 23:31
→
SRNOB
微軟最近放一個重磅的 GitHub 衝分好高
02/19 23:32
推
Orianna
10倍資源? omg 那有幾倍功效嗎
02/19 23:33
推
ter2788
現在最大問題是 這樣堆真能AGI?
02/19 23:34
推
simba1222
覺得再過不久就會把各家模型拿去軍用,再讓他們對
02/19 23:35
→
simba1222
打,決定誰最強
02/19 23:35
→
Ceferino
整天只會吹,看起來就像把別人論文寫的東西跟架構
02/19 23:36
→
Ceferino
用他的20萬張gpu跟海量資料復現而已
02/19 23:36
推
s90002442
tsla乖乖回300吧
02/19 23:38
推
gamixxxx
最後上車時間 All in Tsll
02/19 23:41
推
seemoon2000
這就跟讀書一樣啊 你要全科PR80 沒有太困難 但你要
02/19 23:44
推
dongdong0405
TSLA還沒買夠啊
02/19 23:44
→
seemoon2000
全科PR90以上 投入的時間和效益會越來越低阿
02/19 23:45
推
oyaji5566
人家都開源了你還在收費
02/19 23:46
→
CYL009
馬斯克很會做直銷的啦 安啦
02/19 23:48
噓
e123456ddd
又一個覺得自己比巨頭們聰明的
02/19 23:48
→
liangnet
說不定差那分數就差多了,畢竟使用者最終要的是可
02/19 23:51
→
liangnet
以回答他正確的答案,而不是瞎掰的答案。
02/19 23:51
推
ejnfu
但NVDA沒跌
02/19 23:55
→
ejnfu
都回140了
02/19 23:55
推
seemoon2000
AI不是永遠都在跑這個語言模型 主要是還有其他應用
02/19 23:56
→
partsex
tsm股價真弱
02/20 00:05
→
partsex
該不回真的要等合資的事情確認後 才會漲或跌吧?
02/20 00:05
推
acgotaku
看 gpt 4.5會不會被提前逼出來 如果沒有
02/20 00:10
推
iuiuisme
99特斯拉
02/20 00:10
→
acgotaku
Grok3 可能就是在走 OpenAI走過的路而已
02/20 00:10
推
sgaor
Nasdaq狂跌0.22%
02/20 00:11
推
dophin332
這個鬼東西的價值是沒有內建DEI吧
02/20 00:12
推
chysh
你敢用deepseek便宜自駕還是grok十萬片H100堆出來的
02/20 00:13
→
chysh
自駕?
02/20 00:14
噓
willy0411
喔喔喔喔喔喔喔喔
02/20 00:15
→
fgkor123
力大出奇蹟
02/20 00:19
推
Karida
deepseek動不動就系統崩潰當機,誰敢用在自駕上?
02/20 00:22
推
OneDianHwen
Nvda SMCI :你們買不夠多!
02/20 00:23
→
sezna
grok沒什麼突破才是問題,ds有開源和拉低門檻。
02/20 00:26
→
ejnfu
SMCI都要60了.. 18抄底的爽死
02/20 00:29
推
Brioni
但目前最高分就他
02/20 00:29
推
jo4
AI世界以後大概只有第一和others
02/20 00:37
→
jo4
大佬又不是客家人誰在和你CP值
02/20 00:39
→
jo4
以後就是硬體最新資源最多的贏 一切一切預告在前
02/20 00:40
噓
highca0709
還在吹DS我真的笑死,隨便一點訪問量就崩潰的爛AI
02/20 00:56
→
highca0709
還有人說堆硬體沒用
02/20 00:56
推
dtfg
一堆鄉民自以為比首富和專家聰明厲害,笑死
02/20 00:59
推
ImHoluCan
DS嚴重算力不足,問個問題ㄧ直伺服器繁忙,DS自己
02/20 01:07
→
ImHoluCan
也說太多人用刮分算力
02/20 01:07
噓
LimYoHwan
吹半年? grok從零開始研發也才1年
02/20 01:10
推
TSMCfabXX
在台灣用自駕很好啊 自撞當自駕
02/20 01:39
推
kingofsdtw
要收費,我pass
02/20 02:17
推
etset
DS還有天才少女
02/20 02:34
推
zzzzaaaa
可以吹花最多的錢啊,nv感謝您
02/20 02:49
→
qoojo2002
快壓機器人股啊
02/20 03:17
推
stosto
grok後來不是變20萬片100+200?
02/20 03:56
→
stosto
現在看起來就是堆算力,狂堆,狂堆,再狂堆
02/20 03:56
→
stosto
這就是AI
02/20 03:57
推
ksjr
我知道老馬還有錢
02/20 04:35
→
dream12305
20號腿了
02/20 07:55
推
lrac
他們比較晚才投入吧 短時間迎頭趕上了
02/20 07:57
→
lavign
噁男AI
02/20 08:09
→
bojan0701
AI 後期就是加堆巨大算力,獲得小小改善...
02/20 08:14
推
mopa
就說了,推論落地的算力需求遠大約訓練。
02/20 08:25
→
jceefailurer
這個可以用來分析股票嗎?
02/20 08:31
推
kotorichan
推論用華為芯片就夠了 過一陣子再看看DS有沒有改善
02/20 08:35
→
forbefor
DS就是蒸餾仔 跩啥小
02/20 08:55
推
g1254501
力大出棒槌
02/20 10:01
推
jimmy12332
現在買一張4090就能跑deepseek 671B的完整model 誰
02/20 10:54
→
jimmy12332
需要你們這些算力怪物?
02/20 10:54
推
eric356
戰鬥機你比別人多個0.1秒就可以打趴對方
02/20 11:00
→
lluunnaa
昨天X都是馬投顧跟我川XD
02/20 11:16
推
ejnfu
講半天 NVDA也是漲回140了
02/20 11:38
推
eoeoeo
我們也有天才美少女
02/20 12:34
推
annboy
拜託 老馬是要跟OpenAI 拼SOTA跟AGI
02/20 13:43
→
annboy
蒸餾是另一個賽事 不要混為一談
02/20 13:43
推
ilqgray
https://tinyurl.com/bdwu55js
02/20 15:59
→
ilqgray
https://statementdog.com/news/12508
02/20 15:59
→
ilqgray
這幾篇綜合講了deepseek 蘋果和老馬xAI的動態
02/20 16:00
→
ilqgray
還提到南韓的新計劃...有些替台灣擔心啊
02/20 16:01
推
Klauhal
Grok3問冷門的東西也能答出來挺屌的,比DS好多了
02/20 16:17
→
buffalobill
https://youtu.be/yyYV_hu_iEU 也不是很聰明...
02/20 16:36
→
buffalobill
https://youtu.be/k2YCp5Ficzw 同樣問題DS答對了
02/20 16:37
推
davidr
ds要蒸餾也要有一級的訓練數據啊
02/20 20:05