這篇文章的核心意思就是
我們掌握著一些竅門,可以提升回答質素的那些,我們早就實踐,而且怕被快速追上,所以把他們閉源了
但是這些訣竅被中國人自己研究出來了
還有一些技巧,早就可打破一味堆算力的瘋狂勢頭,但是為了保護美國七巨頭現在
極好的股票上升勢頭。我們把它們擱置了,ds一出,我們不得不把低成本部署的算法都拿出來準備實施了
現在的問題就是,一直靠堆算力堆數據堆電力就能到達AGI的幻境破滅了
投資人的狂熱消散了。起碼第一波狂熱終於被點破了
※ 引述《Lushen (pttlushen)》之銘言:
: OpenAPI 的 Chief Research Officer (首席研究員)
: Mark Chen 2025/01/29 凌晨發了一波推文評價 Deepseek R1 的論文
: https://i.imgur.com/A73X07x.png
: https://i.imgur.com/rjDczVH.png
: 恭喜 DeepSeek 產出了一個 o1 級別的推理模型!他們的研究論文顯示,他們獨立發現了
: 一些我們在通往 o1 道路上所找到的核心理念。
: 不過,我認為外界的反應有些過度,特別是在成本相關的敘事上。擁有兩種範式(預訓練
: 和推理)的一個重要影響是,我們可以在兩個軸向上最佳化能力,而不是只有一個,這將
: 帶來更低的成本。
: 但這也意味著我們有兩個可以擴展的軸向,而我們計劃在這兩個方向上都積極投入算力!
: 隨著蒸餾(distillation)技術的成熟,我們也看到降低成本和提升能力這兩者之間的關
: 係越來越解耦。能夠以更低的成本提供服務(尤其是在較高延遲的情況下),並不代表能
: 夠產生更強的能力。
: 我們將持續改進模型的低成本部署能力,但我們仍對研究路線保持樂觀,並將專注於執行
: 計劃。我們很興奮能在本季度及今年內推出更優秀的模型!
: Congrats to DeepSeek on producing an o1-level reasoning model! Their research
: paper demonstrates that they’ve independently found some of the core ideas
: that we did on our way to o1.
: However, I think the external response has been somewhat overblown,
: especially in narratives around cost. One implication of having two paradigms
: (pre-training and reasoning) is that we can optimize for a capability over
: two axes instead of one, which leads to lower costs.
: But it also means we have two axes along which we can scale, and we intend to
: push compute aggressively into both!
: As research in distillation matures, we're also seeing that pushing on cost
: and pushing on capabilities are increasingly decoupled. The ability to serve
: at lower cost (especially at higher latency) doesn't imply the ability to
: produce better capabilities.
: We will continue to improve our ability to serve models at lower cost, but we
: remain optimistic in our research roadmap, and will remain focused in
: executing on it. We're excited to ship better models to you this quarter and
: over the year!
: : 喊得很大聲,做出來的不過就那樣
--
當心,被擊沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.89.14.114 (中國)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1738199290.A.AFD.html
※ 編輯: icrose (223.89.14.114 中國), 01/30/2025 09:59:14
推文 (52)
→
laptic
所以人家的「蒸餾」說 不敢正面回應?(如算式等)
01/30 09:09
推
ggian123
美國狗輸不起了
01/30 09:10
→
ggian123
美國例外論信仰崩塌
01/30 09:10
推
sdbb
推一味,願意好好選字的人越來越少
01/30 09:14
噓
Leo4891
自己腦補就不用硬扯啥人家的意思了
01/30 09:14
推
fish813
要一直保持第一 很累
01/30 09:18
推
lusifa2007
沒吧 應該是更有效率的演算法加上更多的硬體 可以
01/30 09:22
→
lusifa2007
更快達到AGI的目標
01/30 09:22
推
xiemark
cudnn效率不是最佳
01/30 09:24
推
PaulPierce34
有點像仿製藥的歷史,軟體應該更難封鎖技術複製
01/30 09:26
噓
Jeff1989
單純腦補 笑死
01/30 09:27
推
mamorui
OpenAI不可能開源的,有pretrain data在手,沒必要
01/30 09:27
→
mamorui
開源
01/30 09:27
→
nobody0522
在這裏幫DS洗地到底有什麼好處? 看不太懂網路與論
01/30 09:30
→
nobody0522
這波操作
01/30 09:30
推
sdbb
仿製藥的問題,1.合成2.要有受試者驗證
01/30 09:30
→
sdbb
軟體的話,小魯就不確定會卡在哪邊y
01/30 09:31
噓
Manslayer69
中吹就搞笑啊,不過拿錢辦事可以理解。
01/30 09:32
推
k1k1832002
會洗地嗎,不就一堆在嘲諷不能查64,造假,抄襲,
01/30 09:36
→
k1k1832002
討論的重點一直都在於更低的成本達到相同效能,這
01/30 09:36
→
k1k1832002
洗什麼地
01/30 09:36
推
straggler7
好處就是降價97%
01/30 09:36
→
judy13857
https://i.imgur.com/cUq8tHw.jpeg
01/30 09:37
→
ookimoo
LLM是到不了AGI的 信徒早點洗洗睡
01/30 09:37
→
k1k1832002
訂閱要花兩百美元現在有低價版,低價版卻變成靶子X
01/30 09:37
→
k1k1832002
D
01/30 09:37
→
judy13857
有錢拿吧,上面Lushen都已經開示了,也洗好幾天了
01/30 09:37
→
tctv2002
好處就是一般需求的人用DS就可以了
01/30 09:37
→
ookimoo
目前的經濟環境 各國經濟自主 美國想用AGI征服世界
01/30 09:37
→
ookimoo
也不容易 大概需要一次大蕭條的經濟重置
01/30 09:38
→
straggler7
華碩 宏碁 都可以自建AI雲了 打破壟斷
01/30 09:39
推
s213092921
AI護城河還沒套利變現,就被DS挖了祖墳,看你氣不氣
01/30 09:43
→
ookimoo
至於版上多蛙 在喊多 都沒意義 要知道民主共和黨
01/30 09:44
→
ookimoo
後面站的都是猶太人 只是這次換選共和黨而已
01/30 09:45
→
ookimoo
你們在這裡喊多 但是操盤的猶太人要收回資金了
01/30 09:45
→
ookimoo
你們會贏嗎 呵呵
01/30 09:45
→
sunpedro0202
好啦不然你推說要買啥啊
01/30 09:50
噓
miguel1968
中國花錢買網軍的實力真的跟DS一樣稱霸世界
01/30 09:51
推
Samurai
什麼叫一般需求夠用?現在AI已經夠了?
01/30 09:54
推
NetsFan
好啦,意見不同先抹黑最實在
01/30 09:54
→
newwu
腦補太多了吧
01/30 09:59
→
newwu
後半段全部都是你自己在想
01/30 10:00
噓
fedona
電力股已經開始反彈
01/30 10:02
→
aewul
採訪說要用法律保持科技領先..怪怪
01/30 10:08
→
moustique
AI不只本夢比,還遇到追兵
01/30 10:09
推
clecer
ai還能幹嘛,說來聽聽
01/30 10:17
噓
ppdogininder
別造謠 門外漢就別亂評論
01/30 11:28
→
linzero
AI應用應該還有很多領域還沒完善,還是有砸錢搞算力
01/30 12:03
→
linzero
的需求吧,不過可能語言這部分會降低需求
01/30 12:04
→
linzero
而且應用落實後,研發可能需求降低,但應用方面需求
01/30 12:04
→
linzero
也可能會更多
01/30 12:05
噓
phoenixtwo
妳的結論就是硬ㄠ
01/30 18:43