※ 引述《icrose (人本良心)》之銘言:
: 但是問題在於,如果中國中小公司用沒有一個海歸的團隊
: 就做出了這麼優秀的演算法優化
: 那如果全世界一起繼續優化,這半年又大幅發生成本降低怎麼辦,變形金剛模型其實算法
: 主體框架五六年沒有大的進化了
: 所以輝達和openai的只有堆算力一條路的敘事欺騙了世界兩年,現在敘事光環已破
: 用戶尤其是大用戶必然要重新審查自己的對輝達下單量。觀望或者只買原計劃的一部分是
: 理性的
: 中小用戶因為自搭模型門檻降低而發生需求大爆發,要等到什麼時候呢。目前不明朗,我
: 覺得,先跌2個月再說吧
應該不用那麼久
重點是DS是開源的
現在應該有許多數據中心已經開始實驗DS的演算法
我們先假設DS的創新
是往AGI道路上的王道
那麼在10萬張H100的算力訓練下
應該很快就能看到LLM的表現
在10萬張H100的暴力訓練下,質的突破
如果10萬張H100
跟2000張H800的訓練結果差不多
推理準確性沒有辦法有質的提升
那這個演算法不過是一個
地板很容易達到,但馬上會碰到天花板的
低成本的,但無成長性的演算法
馬上就會被要求更高準確性的模型區別開來
結局就是只能當基礎的,低成本的,內卷模型
如果10萬張暴力訓練,迎來質的突破
那算力依然是AI碾壓的條件之一
-----
Sent from JPTT on my iPhone
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.74.99.187 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1737986132.A.DC0.html
現在堆算力的模式,不正是算力能帶來推理模型的正確性提升,大家才開始堆算力?想看看算力持續進步,演算法天花板到底在哪裡?
如果天花板已知,純服務需求
那服務vs GPU購買
無論如何也支撐不了NV現在的GPU費用吧
正是因為天花板的未知
才讓堆算力得以成為故事線
如果演算法的天花板已知,勢必支撐不起GPU的價格
如果演算法的天花板未知,算力依然可以主導
這樣說的通嗎?
※ 編輯: breathair (42.74.99.187 臺灣), 01/27/2025 23:22:42
推文 (496)
推
herculus6502
有道理
01/27 21:57
推
TentoEtsu
跟我想的一樣
01/27 21:57
推
etset
怎麼會覺得 開發者沒試過一萬張
01/27 21:58
推
openthedidi
這個才是正解
01/27 21:58
推
nanako81240
內捲模型才好推廣阿 才有市場競爭力
01/27 21:59
推
s800525
現在AI在專門類有用,但泛用性真的不怎樣,真的希望
01/27 21:59
→
s800525
能加速一下AI進步速度,不然通用性應用真的沒啥用
01/27 21:59
→
nanako81240
AI模型現在就是遇到拚多多了 直接跳過蝦皮
01/27 21:59
推
zerro7
總覺得很像之前超導體 最後虛驚一場
01/27 22:00
推
TentoEtsu
但是會不會10萬張下去天網直接誕生(對不起
01/27 22:01
推
Lushen
Deepseek=超導體2.0=ChatGPT套殼
01/27 22:01
→
Lushen
=中共割韭菜
01/27 22:01
推
s800525
如果AI進步只能靠堆硬體真的死路一條
01/27 22:01
推
chuag
接下來是換h100大出貨吧XDDD
01/27 22:01
→
Lushen
已經在脆上被揭露只是Open API串接
01/27 22:02
推
Daikin
假如給DS的硬體是OPENAI的算力,會如何?
01/27 22:02
推
uke823
所以華爾街都笨蛋嗎
01/27 22:02
→
s800525
華爾街有時候表現真的像笨蛋一樣XD
01/27 22:02
→
s800525
常看美股就知道華爾街初一十五不一樣,常常洗自己臉
01/27 22:03
推
freeclouds
OpenAI串接 那OPEN AI不就噴爆
01/27 22:03
→
NexusPrime
我想看看如果這個訓練架構真的可以這麼有效率,10
01/27 22:03
→
NexusPrime
兆參數的LLM會有多強
01/27 22:03
推
CMPunk
華西街找理由割韭菜賺大錢 哪裡笨了
01/27 22:03
→
poru
DS出現會加速AI之間的競爭態勢.
01/27 22:04
推
uller
好像有道理
01/27 22:04
推
uke823
抄底抄起來
01/27 22:04
推
vicklin
華爾街天龍國被疫情和戰爭耍得團團轉也不是第一天
01/27 22:04
→
JoeyChen
沒錯 看ds跟AI的天花板
01/27 22:05
推
sunpedro0202
推
01/27 22:05
推
TyuzuChou
https://i.imgur.com/OBFxyQJ.png
01/27 22:05
→
TyuzuChou
微軟去年買了45萬H100
01/27 22:06
→
poru
DS的出現等於中美AI競爭開啟.
01/27 22:06
推
BruceChen227
抄底啦 盤前直接開撿
01/27 22:07
→
TyuzuChou
合理推估deepseek從各種管道買進20萬個H100來衝模
01/27 22:07
→
TyuzuChou
型
01/27 22:07
推
lusifa2007
那十萬張gb200能直接實現奇點嗎?
01/27 22:07
推
ssdd740419
如果科技巨頭認為不停堆算力就能達到新境界 太好笑
01/27 22:07
推
OSDim
Goog買那麼少ㄛ
01/27 22:07
→
JoeyChen
只是串接open AI?那是騙錢嗎?
01/27 22:07
推
s800525
華爾街長期還是看財報,短線就跟鄉民一樣湊熱鬧到處
01/27 22:08
→
s800525
喊而已,這種短線常常喊完沒多久就自打臉的一堆,短
01/27 22:08
→
s800525
線看華爾街反映只會被割韭菜而已
01/27 22:08
→
Liberl
https://reurl.cc/EgyGVv Miula正在直播講deepseek
01/27 22:08
推
liscp
Ds 那麼猛 中共為什麼會讓它開源?
01/27 22:08
→
fantasystar
在還沒有實現 AGI 的現在,如果 DS 可以加速的話,
01/27 22:08
→
fantasystar
會更多人買鏟子;如果 DS 的天花板很低,大家還是只
01/27 22:08
→
fantasystar
能乖乖買鏟子。買鏟子概念股明明就很穩,推測今天這
01/27 22:08
→
fantasystar
波下殺只是找個藉口殺散戶。
01/27 22:08
推
koll
永遠要對中國數據存疑,就讓子彈飛一會,不要太急
01/27 22:10
推
Mosskappa
而且DS是蒸餾OpenAI的數據,之後要發展更強大的模
01/27 22:10
→
Mosskappa
型模型的成本只大不小
01/27 22:10
推
chuag
差別在原本可以用gb200薛人現在變成h100
01/27 22:10
→
chuag
不過對gg就短空而已,東西都他做的
01/27 22:11
→
chuag
而且我不覺得硬體僅不只會停在h100 遲早會往上堆的
01/27 22:11
→
IBIZA
fantasystar 市場上買來訓練AI核心的晶片是少數
01/27 22:11
→
IBIZA
絕大部分是拿來架平台 給一般企業call訓練自己的AI
01/27 22:12
→
IBIZA
應用
01/27 22:12
推
jumilin927
推,模型train出來後面學習的怎麼樣才是重點
01/27 22:13
→
IBIZA
以Meta訓練Llama 4號稱史上最大叢集 10萬張H100
01/27 22:14
推
jim543000
怎麼會有量變引起質變這種理解
01/27 22:14
→
IBIZA
資本支出也才30億美元
01/27 22:14
→
IBIZA
Meta用來架構平台的資本支出是650億美元
01/27 22:15
→
IBIZA
也就是meta用來訓練自家AI的支本支出, 是架構商業
01/27 22:15
→
IBIZA
應用平台的1/20
01/27 22:15
→
IBIZA
整個AI市場 訓練AI核心的資本支出 應該只有平台的
01/27 22:16
→
IBIZA
零頭百分點
01/27 22:16
→
IBIZA
目前市場有能力訓練自己AI模型的 就幾家大頭
01/27 22:17
→
IBIZA
DS會讓這個門檻從幾十億美元 降到幾到幾十M
01/27 22:17
→
IBIZA
會讓架構大規模商業運用平台的成本 從百億 降到幾億
01/27 22:18
推
andy810306
巨頭會比你還笨?早試過高參數的模型了,事實上就
01/27 22:19
→
andy810306
是沒有太大的改善,所以低參數的勢必會來臨
01/27 22:19
→
fantasystar
所以我的重點在於 AGI 跟其他目前還在"願景"裡的那
01/27 22:20
→
fantasystar
些AI夢。做現在的AI應用可以很便宜,但是要往前走還
01/27 22:20
→
fantasystar
是要繼續買鏟子。
01/27 22:20
推
lifeterry
聞起來,是不是有 over booking 的味道
01/27 22:20
→
IBIZA
我就跟你說了 做核心的只有整個市場資本支出的百分
01/27 22:21
→
IBIZA
之幾
01/27 22:21
推
clecer
pre-train就是快到極限算力推不動了,才在玩推理模
01/27 22:21
→
clecer
型,
01/27 22:21
→
IBIZA
就算這百分之幾還是大量買鏟子 那也是百分之幾
01/27 22:21
→
IBIZA
更何況這些做核心的 也會參考 DS的模型 改善自己的
01/27 22:22
→
IBIZA
效率 以前要10萬張H100訓練的模型 現在只要2000張
01/27 22:22
→
IBIZA
你說鏟子還要多賣?
01/27 22:22
→
clecer
算力成本降低,我看好應用端而且不需要太強的硬體
01/27 22:22
→
IBIZA
投入的廠商會多好幾倍 但這些廠商需要的硬體能力
01/27 22:23
→
IBIZA
只是過去的幾趴而以
01/27 22:23
推
Mosskappa
AI也不只LLM吧,現在高端硬體依然供不應求,也不是
01/27 22:24
→
Mosskappa
想買就買得到。
01/27 22:24
→
puritylife
如果優化演算法效益開始遠超買鏟子
01/27 22:26
→
puritylife
那鏟子的需求量勢必崩盤好嗎
01/27 22:26
→
puritylife
鏟子貴到爆 錢轉去搞演算法反而更划算的話
01/27 22:27
→
puritylife
你覺得他們還會死命買鏟子?
01/27 22:27
→
puritylife
部分的投資轉移會是更明智的做法吧
01/27 22:28
推
OSDim
覺得不會的記得放空,覺得繼續買的記得加碼
01/27 22:28
推
TentoEtsu
聽Miula分析完 感覺變成送分題了 0.0
01/27 22:37
推
kissa0924307
加倉+1
01/27 22:39
推
clecer
我只知道巨頭的AI科學家會拼命優化演算法
01/27 22:39
→
clecer
不然被LAYOFF就是他們了
01/27 22:39
→
ev331
miula講什麼
01/27 22:48
推
stosto
為什麼一堆匪區的用語
01/27 22:49
推
strlen
現在的問題就是 天花板要怎麼破 不也還是堆算力?
01/27 22:51
→
strlen
不然deepseek還有什麼好方法能在有限算力下突破?
01/27 22:52
→
strlen
現在最強AI的能力 是遠遠達不到大眾用戶需求的
01/27 22:53
→
strlen
為什麼AI現在商業化應用化困難 就是AI遠遠不夠好啊
01/27 22:53
推
kobebrian
miula講的基本跟我還有S大講的差不多
01/27 22:54
→
strlen
DS出來能加速大家AI突破天花板真的是功德一件
01/27 22:54
→
kobebrian
那些大公司做服務平台框架 對啊 那裡面的東西呢?
01/27 22:55
→
kobebrian
模型不夠好 那就是繼續堆運算啊 你裡面的東西比別
01/27 22:55
→
kobebrian
人差 別人幹嘛用你的框架
01/27 22:55
→
strlen
現在不要說算數學寫程式 連最基本做客服都很難用
01/27 22:55
推
meRscliche
True
01/27 22:56
→
IBIZA
miula剛剛明明就說 接下來幾個月 這些大公司會開始
01/27 22:56
→
IBIZA
修自己模型
01/27 22:57
→
IBIZA
其實DS指出方向 大家很快會跟上
01/27 22:57
→
kobebrian
但不會影響軍備競賽 你沒聽到嗎
01/27 22:57
→
IBIZA
改良演算法可以省幾百億美元 幹嘛堆算力
01/27 22:57
→
lonelyQQ
低成本ai好用又厲害 美股完蛋了
01/27 22:57
→
loveadu
他是用全新的方式不是堆疊硬體,中國被封鎖成這樣
01/27 22:58
→
loveadu
,只能創新
01/27 22:58
→
IBIZA
長期來講還是會堆 但你這個幾個月呢?
01/27 22:58
→
kobebrian
省幾百億大家一起省啊 然後呢 誰能勝出還不是繼續
01/27 22:58
→
kobebrian
花錢搞模型
01/27 22:58
→
kobebrian
我不在乎這幾個月啊…
01/27 22:58
→
IBIZA
而且長期來講 就算會堆 利潤一樣嗎?
01/27 22:58
→
IBIZA
cisco現在的營業額是2020年的三四倍
01/27 22:58
→
IBIZA
打錯2000年的三四倍
01/27 22:58
→
IBIZA
你說股價是多少?
01/27 22:58
→
kobebrian
以AI那個廢的程度 不堆就是贏不了 又不是消費者很
01/27 22:59
→
kobebrian
滿意現在的AI
01/27 22:59
→
IBIZA
只要步調晚個幾年 競爭者就有可能追上了
01/27 22:59
→
IBIZA
我相信AI算力未來還是會繼續突破 但好不好賺就是
01/27 22:59
→
kobebrian
很明顯現在AI就不可能等你個幾年啊 大家馬上抄答案
01/27 22:59
→
kobebrian
那誰又能贏?還是要看模型
01/27 22:59
→
IBIZA
另一回事
01/27 22:59
→
IBIZA
為什麼不可能?
01/27 23:00
→
IBIZA
看一下網際網路的歷史吧
01/27 23:00
→
IBIZA
那個不是叫等幾年
01/27 23:00
→
kobebrian
本來就不可能 因為大家一起抄一份答案那就是一樣
01/27 23:00
→
kobebrian
所以更不可能等 就是要繼續拼
01/27 23:00
→
IBIZA
NVDA的成長率下降 原本的營業目標晚個幾年達成
01/27 23:00
→
strlen
就是步調不能慢才更要加碼投資啊....慢幾年
01/27 23:00
→
IBIZA
結果就是像網際網路當時的cisco一樣
01/27 23:01
→
strlen
慢幾個月就死人了 怎麼可能慢幾年 X
01/27 23:01
→
kobebrian
2000年的網路早就已經框架服務模型都建立好了 跟現
01/27 23:01
→
kobebrian
在AI差遠了
01/27 23:01
→
IBIZA
當年其實就是網路泡沫 短時間內大家降低資本支出
01/27 23:01
→
IBIZA
其實也沒有幾年的時間
01/27 23:01
→
IBIZA
2000年模型都建立好?
01/27 23:01
→
strlen
巨頭成本降下來 開始賺錢了 更有本事買更多算力吧
01/27 23:01
→
IBIZA
google都是2004年才有的 更不要說後面的一堆應用
01/27 23:01
→
kobebrian
比起現在AI 2000年初期的網路已經是很多人覺得好用
01/27 23:02
→
kobebrian
的模型了
01/27 23:02
→
IBIZA
2000年沒有gps結合網路地圖
01/27 23:02
→
strlen
其實要再造2000年盛況 就是需要更多的DS時刻吧
01/27 23:02
→
kobebrian
是沒有 但基本的網路連線在當時已經不會有人說「幹
01/27 23:02
→
kobebrian
怎麼這麼不好用」
01/27 23:02
→
strlen
一開始網路超貴的 誰要玩?都馬有錢人在玩
01/27 23:02
→
strlen
後來越來越便宜 網路費大眾可接受 才一堆人搶進
01/27 23:03
→
kobebrian
現在是你花20美刀然後罵 靠北怎麼這麼笨 難用 退訂
01/27 23:03
推
puritylife
應該說DS指出另外一個方向吧
01/27 23:03
→
IBIZA
google框架服務在2000年當時有類似的只有mail吧
01/27 23:03
→
strlen
當所有人都進來後 會再炒一波到高點 然後重摔
01/27 23:03
推
andy810306
那是貴跟慢不是難用,大家一開始就都知道網路好用
01/27 23:03
→
kobebrian
AI現在是貴不說 還他媽超難用 那個模型有夠爛
01/27 23:03
→
strlen
AI這兩年 基本就因為成本太高 根本沒幾隻加入吧
01/27 23:03
→
IBIZA
不會 其實2000年之前很多人不知道網路能幹嘛
01/27 23:03
→
strlen
現在DS幫大家降成本 大家可以進來玩了 才會再造達抗
01/27 23:04
→
andy810306
而網路堆到4G後再怎麼堆效應不大,沒人會嫌網路太
01/27 23:04
→
andy810306
慢,但你願意多付多少錢買超過100M的網速?
01/27 23:04
→
kobebrian
到時候大家服務框架架好 就是要拼模型了 現在反正
01/27 23:04
→
kobebrian
大家模型都是垃圾
01/27 23:04
→
strlen
不然2000年網路上只有10間公司 8間巨頭 會泡沫?
01/27 23:04
→
kobebrian
大公司也一定會下來拼 那除非硬體上限到了 不然誰
01/27 23:05
→
kobebrian
敢不拼
01/27 23:05
→
strlen
現在遠遠不到4G吧?大概3G都還沒到
01/27 23:05
→
strlen
看看4G多普及了 AI有普及嗎?
01/27 23:05
→
IBIZA
不認為 短期內巨頭應該會降低資本支出 著重於改善
01/27 23:05
→
IBIZA
演算法
01/27 23:05
→
kobebrian
對 現在市場需求高但供應商拿得出手的模型 誰覺得
01/27 23:05
→
kobebrian
「堪用」
01/27 23:05
→
strlen
一般人拿到AI根本也不曉得要幹麻
01/27 23:06
→
IBIZA
2000年那時候其實也沒有甚麼拿得出手的網路服務
01/27 23:06
→
IBIZA
可能只有Yahoo跟mail?
01/27 23:06
→
strlen
你可以用手機直接叫AI幫你訂外送麥當勞嗎?
01/27 23:06
→
z23061542
短期要拉開差距 是要買更多吧
01/27 23:06
推
andy810306
現在的AI比較像是用郵差送封包,堆算力就是在用更
01/27 23:06
→
andy810306
多的郵差送封包,新的演算法就是直接用光纖送封包
01/27 23:06
→
strlen
你我都夠老了 拜託一下 當年2000年滿街達抗網站齁
01/27 23:06
→
kobebrian
當然你要跟我說所有巨頭一致決議先不搞模型了 都先
01/27 23:07
→
kobebrian
降支出 不要拼死拼活 那短期股價回700 800 那剛好
01/27 23:07
→
kobebrian
撿好撿滿
01/27 23:07
→
IBIZA
現在買更多 不是拉開差距 是浪費錢
01/27 23:07
→
strlen
現在已經滿街都是AI公司了嗎?
01/27 23:07
→
IBIZA
現在的確滿街都是AI應用公司啊 阿貓阿狗都說自己是
01/27 23:07
→
IBIZA
AI
01/27 23:07
→
kobebrian
你怎麼知道是浪費錢?當初台積電買EUV 三星沒買 台
01/27 23:07
→
kobebrian
積電浪費錢嗎
01/27 23:07
→
strlen
結論就是現在AI遠遠不夠力 天花板還遠的很
01/27 23:07
→
strlen
DS可以加速突破天花板 但依舊遠遠不足
01/27 23:08
→
kobebrian
幹拜託 你我都知道那只是掛羊頭賣狗肉 真正有在做A
01/27 23:08
→
kobebrian
I模型的就那幾個
01/27 23:08
→
IBIZA
AI天花板的確還沒到 但短期內算力過剩
01/27 23:08
→
IBIZA
接下來就是有很多中型公司也有能力做 平台了
01/27 23:08
→
z23061542
你不買其他人買 演化算法就是比你快 不買嗎
01/27 23:08
→
kobebrian
巨頭們有資本有錢 一個突破口可能就甩開對方了 誰
01/27 23:08
→
kobebrian
敢賭?
01/27 23:08
→
IBIZA
微軟的AI資本支出是原本是宣布800億 meta是650億
01/27 23:09
→
strlen
大家都說我有在用 哪有阿貓阿狗說自己AI公司....
01/27 23:09
→
z23061542
算利過剩? 有這麼快喔
01/27 23:09
→
IBIZA
但接下來可能20億就能做到微軟的規模
01/27 23:09
→
IBIZA
甚至我不要做那麼大的平台 只要2-5億資本支出就好
01/27 23:09
→
strlen
直接比較一下AI公司數量跟當年達抗數量 還早得很
01/27 23:09
→
kobebrian
你還在家服務框架啊 現在如果真的大家都能輕鬆做到
01/27 23:09
→
kobebrian
這個 裡面的模型才會是決勝負的戰場
01/27 23:09
推
jenner787478
正解
01/27 23:09
→
IBIZA
裡面的模型就是用開源的DS改啊XD
01/27 23:10
→
mic73528
會浪費不就老美算法太廢了嗎 連硬解都做不到 優化屎
01/27 23:10
→
z23061542
沒又明確數據 都不能說算力過剩吧
01/27 23:10
→
kobebrian
那就還是很廢啊 你要比別人強就是燒錢
01/27 23:10
→
IBIZA
幾個月後就會有用開源的DS改出來 訓練半年的平台
01/27 23:10
→
IBIZA
出現
01/27 23:10
→
strlen
問題是你砍支出 那我馬斯克就維持原本支出 規模是你
01/27 23:10
→
IBIZA
很廢是很廢 他收費只要現在微軟的3%
01/27 23:10
→
kobebrian
大家都一樣的起跑點 別人拼你敢不拼嗎?賽局理論嘛
01/27 23:10
→
kobebrian
除非大家講好一起節省支出
01/27 23:10
→
strlen
10倍 更快突破天花板 你微軟臉書要玩嗎
01/27 23:11
→
IBIZA
誰說別人會拚?
01/27 23:11
推
q09701023
這種AI 不意外會有很多種 看要用哪一種
01/27 23:11
→
strlen
你承擔的對手不會跟你一起減少支出的風險嗎
01/27 23:11
→
IBIZA
你維持現在的資本支出 那算力短期會膨脹50倍
01/27 23:11
→
IBIZA
有這麼多需求嗎?
01/27 23:11
→
kobebrian
你覺得不會拼?拼一發可能就是台積電買EUV後的差距
01/27 23:11
→
strlen
中國政府自己都加碼一兆人民幣做AI支出了
01/27 23:11
→
IBIZA
不會拼 因為市場沒有那麼多算力需求
01/27 23:11
→
shomingchang
巨頭已經投很多了 還能投多少? 前無限? 看一下市值
01/27 23:11
→
strlen
新聞都出來了 你覺得美國投資者敢收手嗎
01/27 23:11
推
uller
訓練方式不同而已 幾百e的巨頭 也是會優化繼續突破
01/27 23:12
→
IBIZA
幾年後可能有 但幾年後的利潤就不是現在這樣
01/27 23:12
→
strlen
市場根本就還沒開發起來 需求根本沒起來吧
01/27 23:12
→
IBIZA
是啊 市場幾年後還會更高 但我剛剛就說了cisco
01/27 23:12
→
kobebrian
你也不知道會不會有50倍對吧 好用的東西 以現在AI
01/27 23:12
→
kobebrian
這麼不好用的情況 也不普及的情況下 做出來50倍根
01/27 23:12
→
kobebrian
本不誇張
01/27 23:12
→
strlen
AI現在就說商業化困難了 需求就隨著天花板上去啊
01/27 23:12
→
IBIZA
現在的營收也是2000年那時候的三四倍
01/27 23:12
推
andy810306
沒開發起來(X 沒有白癡會付費買AI(O
01/27 23:12
→
strlen
老黃也說過 還有機器人市場 機器人根本不work
01/27 23:12
→
kobebrian
而且你也要確定大家敢賭現在沒人能突破喔
01/27 23:12
→
IBIZA
50倍是前面有人算的 就算不是50倍 可能也有10倍
01/27 23:13
→
IBIZA
10倍miula估的
01/27 23:13
→
shomingchang
如果先投的注定是給後來者做嫁 你還要投多少?
01/27 23:13
→
strlen
機器人又是另一個需要算力的市場 而且還更早期
01/27 23:13
→
IBIZA
如果維持現在的資本支出 那算力就是暴增10倍
01/27 23:13
→
IBIZA
市場有這麼多算力需求?
01/27 23:13
→
z23061542
因為現在算力還不夠啊 所以要優化阿 縮短時間
01/27 23:13
→
strlen
是不是以為AI只有LLM?自動駕駛呢?醫藥科學呢?
01/27 23:13
→
strlen
DS這次只有針對LLM優化喔 多模態還是原樣耶
01/27 23:14
→
strlen
語音AI 圖像辨視AI 都遠遠不足 天花板在哪?
01/27 23:14
→
z23061542
優化也是要縮短訓練時間 所以好gpu不買嗎
01/27 23:14
→
shomingchang
巨頭要先說服股東們繼續大額投入吧
01/27 23:15
→
z23061542
現在根本不夠 真的夠早就商業化了
01/27 23:15
→
strlen
所以馬斯克搞機器人是傻了還蠢了?
01/27 23:15
推
kobebrian
1.你要先確定如果有公司在算力以上突破 他漲不到50
01/27 23:15
→
kobebrian
倍 或是10倍的收益 2.誰敢賭這幾年不會突破?DS這
01/27 23:15
→
kobebrian
也是一個月內發生的事 到時候可沒後悔藥吃 3.大公
01/27 23:15
→
kobebrian
司就屌在他資本大 以上兩點他們能燒錢做得比別人早
01/27 23:15
→
kobebrian
Intel 三星當初就不跟台積電一樣拼EUV 結果爆了
01/27 23:15
→
strlen
需要算力的領域太多了 有太多東西還需要優化突破
01/27 23:15
→
strlen
微軟800億現在20億就能達到目標 780億當然會去發展
01/27 23:16
→
strlen
其它領域的AI啊 你不發展 那馬斯克就搶走了
01/27 23:16
推
mirota
老馬都說了DS大概有五萬個H100
01/27 23:17
推
limingche
量變引發質變叫做湧現,GPT已久出現過了
01/27 23:17
→
strlen
分一點支出給其它領域的AI也是一件好事 LLM吃太多了
01/27 23:17
推
kobebrian
但對老黃來說 能每個地方都跟他求晶片是最好的
01/27 23:17
→
strlen
多模態是一個大坑 機器人更是坑中之坑
01/27 23:17
→
strlen
然後中國也瘋狂在發展機器人 美國輸得起嗎?
01/27 23:18
→
strlen
現在麻煩的是 你敢收手 競爭者馬上補上喔
01/27 23:18
→
kobebrian
少一個就少一個讓他喊價的空間 但總之我不認為大公
01/27 23:19
→
kobebrian
司敢在這個節骨眼放棄模型的算力 因為你無法確定別
01/27 23:19
→
kobebrian
的巨頭不會在這一兩年突破…突破之後還要突破 因為
01/27 23:19
→
kobebrian
AI真的太草創了
01/27 23:19
噓
bike3905
奇怪,不是一堆人說抄的,現在有需要研究嗎?
01/27 23:19
推
kobebrian
沒人否定DS啦 他敢開源給大家用就是有料了 問題是
01/27 23:20
→
kobebrian
這一開源大家又在同一個起跑點了
01/27 23:20
→
IBIZA
現在LLM又不是只有語言模型, 結合推理能力, 所以才
01/27 23:20
→
IBIZA
會很多人把LLM當作通往AGI的半成品
01/27 23:20
→
kobebrian
就問為啥DS不要給自己人玩就好 可能也是希望AI能大
01/27 23:21
→
kobebrian
家一起來做大
01/27 23:21
→
IBIZA
而且就算自駕 也是需要LLM作為指令輸出跟輸入的
01/27 23:21
→
IBIZA
人機介面
01/27 23:21
→
IBIZA
現階段 大家用幾百億資本支出建設的基本上都是以
01/27 23:21
→
IBIZA
LLM為基礎的生成式AI
01/27 23:22
→
strlen
你講得完全沒錯 所以你認為現在LLM指令輸入輸出穩定
01/27 23:22
→
strlen
嗎?裝在自動駕駛上你安心嗎? XD
01/27 23:23
→
IBIZA
MoE有多少大資本支出在建設?
01/27 23:23
推
kobebrian
總之我覺得沒有大公司敢在這個節骨眼上降低對硬體
01/27 23:23
→
kobebrian
的追求啦 沒人敢賭 一個突破可能是60%的市佔率喔
01/27 23:23
→
IBIZA
我現在談的就只是這幾年的資本支出 還有股價
01/27 23:23
→
IBIZA
不會 大公司要考慮成本跟需求
01/27 23:23
→
strlen
推理能力基本上還是基於文字接龍 串接其它多模態呢
01/27 23:23
→
kobebrian
而且那個60%是各領域全方位的 誰敢賭這麼大…硬體
01/27 23:23
→
kobebrian
不足導致競爭力下降的慘案這幾年就有人親身示範
01/27 23:23
→
strlen
DS裡面完全都是優化文字接龍的部份 所以圖像分析還
01/27 23:23
→
strlen
是一團糟 國中幾何題都答不來
01/27 23:24
→
IBIZA
可以參考2000年 當年大資本投資的公司現在幾家活著
01/27 23:24
→
kobebrian
是啊 以DS也才一個月內就翻盤的東西 哪間大公司敢
01/27 23:24
→
kobebrian
保證不會這一兩年就有人突破了
01/27 23:24
→
strlen
所以deepseek還要花一年多優化多模態這部份嗎
01/27 23:24
→
IBIZA
AOL? 時代華納?
01/27 23:25
→
kobebrian
網路泡沫那時候的規模跟AI根本不能比 AI有在競爭的
01/27 23:25
→
kobebrian
公司跟市場飽和度差那麼多 做出好用的模型馬上吃下
01/27 23:25
→
kobebrian
來市場了 誰敢賭
01/27 23:25
→
IBIZA
沒錯 模型有可能繼續突破 那就更不該堆積算力
01/27 23:25
→
strlen
板上也有業內已經說了MoE也不適合做機器人的大腦
01/27 23:25
→
IBIZA
網路泡沫那時候也是很多大型ISP在競爭啊
01/27 23:25
→
IBIZA
最後合併 倒閉
01/27 23:25
→
strlen
這又是另一個坑 另一條路
01/27 23:25
→
strlen
所以要讓機器人能在工廠內按你指令行動 這不用算力
01/27 23:26
→
strlen
不用研發 也不用支出 還是這裡也能優化98%了?
01/27 23:26
→
IBIZA
其實 nvda=當年的cisco, 微軟 meta google就是當年
01/27 23:26
→
IBIZA
的AOL 時代華納 AT&T
01/27 23:27
→
strlen
你不做這塊 過幾個月中國又超過你了 你就完囉
01/27 23:27
推
kobebrian
我覺得是你想多惹 現在的市場需求飽和跟那時候還差
01/27 23:27
→
kobebrian
太遠
01/27 23:27
→
IBIZA
當年第一波的ISP, 最後都沒活下來
01/27 23:27
→
IBIZA
2000年也遠遠不到飽和啊
01/27 23:27
→
IBIZA
2000年時的網際網路真的只是剛開始
01/27 23:28
→
kobebrian
2000年網路公司的整體規模大多了
01/27 23:28
→
IBIZA
但當時的ISP就是過度投資資本支出
01/27 23:28
→
IBIZA
最後死光
01/27 23:28
→
strlen
當年2000年cisco PE是100倍 NV現在PE比三年前還低
01/27 23:28
→
IBIZA
其實現在AI應用公司也很多 也跟當年一樣 能賺錢的
01/27 23:28
→
IBIZA
不多
01/27 23:28
→
strlen
要變思科喔 慢慢等吧
01/27 23:29
→
IBIZA
現在打著AI應用招牌的公司多如狗
01/27 23:29
→
strlen
為什麼能賺的不多?因為就AI太爛啦
01/27 23:29
→
IBIZA
當年網路也是這樣啊
01/27 23:29
→
IBIZA
AOL提供的服務就是mail
01/27 23:29
→
strlen
天花板就是需要你突破才能符合需求 不然應用怎做不
01/27 23:29
→
strlen
起來?
01/27 23:30
→
z23061542
但是美國存活了 我們是做材料又沒差高階還是要用
01/27 23:30
→
IBIZA
而且那時候mail還是50MB之類的
01/27 23:30
→
strlen
就算r1這種等級 也還是不符合應用端 商業化困難
01/27 23:30
→
IBIZA
是 我也認為天花板幾年後會突破
01/27 23:30
→
IBIZA
就像當年2000年倒了一堆公司 2004年又起來一堆
01/27 23:30
推
kobebrian
現在真正有在提供服務框架並且有人願意花錢的就那
01/27 23:30
→
kobebrian
幾家 要倒也輪不到他們
01/27 23:30
→
IBIZA
很難說
01/27 23:31
→
IBIZA
當年大家也認為AOL 時代華納 AT&T 這麼大 怎麼倒
01/27 23:31
→
strlen
我覺得DS這種新創一直出來 說不定這一兩年就看得到
01/27 23:31
→
kobebrian
反正要倒也輪不到NV 台積
01/27 23:31
→
IBIZA
但只要有一家用DS架構的 能提供殺手級應用的
01/27 23:31
→
IBIZA
AOL 時代華納 AT&T就這樣倍google幹倒了
01/27 23:31
→
strlen
但要到大家都進來玩 DS才是開第一槍 之前都太貴了
01/27 23:31
→
IBIZA
當年google幹倒這三家 其實最早靠的是2G的mail
01/27 23:32
→
kobebrian
你沒有算力我很難想像還能突破啦
01/27 23:32
→
IBIZA
然後就是搜尋引擎
01/27 23:32
→
strlen
但玩的也只是LLM而已 其它領域還在地上爬
01/27 23:32
→
IBIZA
一切都還很難說
01/27 23:32
→
strlen
另一個應用端準備起飛的就是自動駕駛 這也還沒好
01/27 23:32
→
IBIZA
我是覺得還好開發出 DS是中國公司
01/27 23:33
→
IBIZA
如果是美國公司 那很可能就是這個時代的google
01/27 23:33
→
kobebrian
真的跌了就是進來繼續撿2330
01/27 23:33
→
strlen
沒有這麼誇張 DS基本上就是優化成本這部份而已 總是
01/27 23:34
→
strlen
會出現的 老黃自己去年都講過了 演算法一定會改進
01/27 23:34
→
strlen
他說超級摩爾定律不是說他自己硬體會進步 是全方面
01/27 23:34
→
kobebrian
怎麼可能跟google比
01/27 23:34
→
strlen
這演講訪談都在 老黃自己都很清楚一定會有人搞優化
01/27 23:34
→
strlen
但這是好事啊 GPT3也是大量優化才成的
01/27 23:35
→
IBIZA
當年google第一步其實也是優化搜尋引擎的演算法而以
01/27 23:35
→
strlen
不如果 沒有優化 一直都給巨頭寡佔 反而麻煩
01/27 23:35
→
strlen
然後大家都賺不了錢 客戶賺不了錢 最後還真的不買硬
01/27 23:36
→
strlen
體了 現在獲利有望 更好長賣
01/27 23:36
→
IBIZA
反正 我不覺得巨頭們有理由保持現在的硬體投資
01/27 23:36
推
kobebrian
的確 現在AI是難用到會退訂的 沒消費你再怎麼獨佔
01/27 23:36
→
kobebrian
都會泡沫
01/27 23:36
→
strlen
老黃也希望客戶大家都賺錢 你不希望客戶賺錢嗎 XD
01/27 23:36
→
IBIZA
幾個月後 他們優化的模型 如果還維持現在的硬體投
01/27 23:36
→
IBIZA
資 算力會暴增
01/27 23:36
→
strlen
有理由啊 就是FOMO仔 就這樣
01/27 23:37
→
strlen
不然你抽資砍單試試看啊 別人馬上買走
01/27 23:37
→
IBIZA
算力不足的情況下 巨頭會盲目追逐算力
01/27 23:37
→
strlen
中國那邊是因為被禁 不然DS自己多想買GB200啊
01/27 23:37
→
IBIZA
但算力暴增十幾倍 幾十倍的情況 我不覺得還會維持
01/27 23:37
→
IBIZA
想買是一回事 想買多少是另一回事
01/27 23:37
→
IBIZA
沒有不買啊 800億砍一半也是買
01/27 23:38
→
strlen
算力暴增更好突破天花板 更容易商業化 更好賺錢
01/27 23:38
→
IBIZA
沒那麼多需求怎麼賺錢
01/27 23:38
→
strlen
砍一半 馬斯克和臉書就通通收走啊
01/27 23:38
推
kobebrian
你確定好用的AI市場還會是現在這種規模嗎
01/27 23:38
→
IBIZA
微軟會說投資800億 應該也是考慮過需求
01/27 23:38
→
strlen
就跟你說就有這麼多需求齁....
01/27 23:38
→
IBIZA
我就說了 幾年後一定不是這個規模
01/27 23:39
→
kobebrian
現在是超級難用 公司在買之前還要審慎評估這個那個
01/27 23:39
→
kobebrian
選一個 不好用退訂喔 實際情況就是如此
01/27 23:39
→
IBIZA
現在網際網路也是2000年的幾百倍規模了吧
01/27 23:39
→
IBIZA
現在網際網路也是2000年的幾百倍規模了吧
01/27 23:39
→
strlen
我剛講多模態跟機器人 自駕 醫藥 這些都不是需求?
01/27 23:39
→
IBIZA
但初期那些公司現在如何?
01/27 23:39
→
kobebrian
是啊 但我要問的是巨頭能確定這幾年不會有突破嗎…
01/27 23:39
→
kobebrian
?他們彼此可沒講好要省錢
01/27 23:39
→
strlen
即使是LLM 再聰明個一倍我看也達不到需求
01/27 23:39
→
IBIZA
我相AI五年後需求可能翻倍
01/27 23:39
→
IBIZA
但現在講的是短期的資本支出
01/27 23:40
→
strlen
你要省錢OK啊 中國可沒有要省喔 人家投一兆勒
01/27 23:40
→
IBIZA
而這個短期的資本支出 就會給對手追上你的機會
01/27 23:40
→
kobebrian
現在的發展可不是等「幾年」 可能三個月後某一個天
01/27 23:40
→
kobebrian
花板被突破 市場需求就打開了
01/27 23:40
→
IBIZA
網際網路的例子就擺在那裏
01/27 23:40
→
strlen
五年後需求翻倍 你現在砍資本支出....
01/27 23:40
→
kobebrian
我也講過台積電的例子了
01/27 23:40
→
IBIZA
10倍的算力爆發 應該不是幾個月就能被突破的
01/27 23:40
→
IBIZA
台積電什麼例子?
01/27 23:41
→
strlen
這不就你講的 給對手追上...誰敢砍啊
01/27 23:41
→
IBIZA
五年後需求翻倍 你現在的算力都還夠用到五年後...
01/27 23:41
→
IBIZA
如果五年後只是翻倍的化
01/27 23:41
→
kobebrian
簡單來說你敢不敢賭?就是選擇嘛
01/27 23:41
→
IBIZA
我已經下注了啊 我基本上沒有大手平台的股票
01/27 23:41
→
kobebrian
對啊 你怎麼知道只會翻倍 現在市場規模很小欸
01/27 23:41
→
strlen
哪裡夠了...我就說 客服AI普及了嗎?
01/27 23:41
→
IBIZA
NVDA也只有很早買的
01/27 23:42
→
IBIZA
那到底五年要翻幾倍? 有50倍嗎
01/27 23:42
→
IBIZA
維持現在的資本投資 很可能算力是暴增50倍喔
01/27 23:42
→
IBIZA
需求有增加這麼多嗎
01/27 23:42
→
strlen
反正過兩天微軟財報就為講了 你看他會砍還是加碼
01/27 23:42
→
strlen
順帶一提 阿祖知道DS事件第一時間就說要加碼喔
01/27 23:43
→
kobebrian
現在隨便一個突破市場可能是5-10倍需求喔 畢竟現在
01/27 23:43
→
IBIZA
你看現在NVDA的股價 不就反映資本市場預期嗎XD
01/27 23:43
→
kobebrian
真的有在應用AI的公司你知我知都是少得可憐或覺得
01/27 23:43
→
kobebrian
不好用
01/27 23:43
→
z23061542
50倍還是不夠吧
01/27 23:43
→
IBIZA
5-10倍 那還是沒追上暴增的蒜力耶
01/27 23:43
→
z23061542
初期進步大家都很快
01/27 23:43
→
kobebrian
過一年翻5-10倍 兩年呢?三年呢?AI就很草創嘛
01/27 23:43
→
strlen
NV股價在DS前就在這區間跑半年了 都市值第一了
01/27 23:44
→
IBIZA
好啊 讓你三年追上50倍好了
01/27 23:44
→
IBIZA
三年時間不就是網際網路翻版?
01/27 23:44
→
strlen
3T公司要拉本來就要磨 跟以前狂拉10倍不同了
01/27 23:44
→
IBIZA
泡沫到出現google, 其實也就是三四年
01/27 23:44
→
kobebrian
三年50倍 到時候你再暴增算力嗎?人家單都排好了
01/27 23:44
→
IBIZA
其實網際網路的前例都在 自己看吧
01/27 23:45
→
kobebrian
反正我用台積電當例子 賭對就是先進製程90%市占率
01/27 23:45
→
kobebrian
賭錯就是intel拆分收購
01/27 23:45
→
IBIZA
一開始 巨頭們在高成本時代大量投資 突然紅海出現
01/27 23:45
→
kobebrian
也有可能反過來 賭錯了直接倒 但我覺得輪不到賣鏟
01/27 23:46
→
kobebrian
子的NV
01/27 23:46
→
IBIZA
兩三年後 頻寬跟硬碟成本大幅下降
01/27 23:46
→
IBIZA
然後高成本時代大量投資的巨頭死光光
01/27 23:46
→
IBIZA
cisco也沒倒
01/27 23:46
→
IBIZA
如果現在不需要這麼多算力 為什麼要現在佈?
01/27 23:47
推
kobebrian
網路當時就已經比現在AI的成熟度高了 至少一般人用
01/27 23:47
→
kobebrian
起來不會靠北到死
01/27 23:47
→
IBIZA
3 年後同樣算力的成本可能只有1/10
01/27 23:48
→
IBIZA
會喔 2000年其實大家就收收mail
01/27 23:48
推
ksjr
慢到爆炸阿哪有不會靠北到死==
01/27 23:48
→
kobebrian
你不現在佈局人家一下子突破你沒單你要怎麼爆算力
01/27 23:48
→
kobebrian
呢 沒人敢賭啊
01/27 23:48
→
IBIZA
頂多學生上bbs, web都還是很陽春的靜態資訊
01/27 23:48
→
IBIZA
其實大家都在下注了不是嗎
01/27 23:48
→
IBIZA
今天NVDA跌13%就是大家在下注了 怎麼會沒人敢賭
01/27 23:49
→
kobebrian
是啊 巨頭們下注 就看會是台積電還是AT&T
01/27 23:49
→
kobebrian
拜託三個月前吧 還有破百價 我是覺得別看這麼短
01/27 23:49
→
IBIZA
我之前選擇大量平倉 其實也是下注了
01/27 23:49
→
kobebrian
我NV持有價是還沒分割前的490 不多就是了
01/27 23:50
→
strlen
阿祖加大資本支出 然後今天創新高了勒 呵
01/27 23:50
→
strlen
你看微軟敢不敢砍支出
01/27 23:50
→
kobebrian
我覺得巨頭不敢砍 啊爆了就爆了 反正我不會下注服
01/27 23:50
→
kobebrian
務公司 頂多少賺
01/27 23:50
→
kobebrian
這種時候就是撿G 再怎麼樣五年後又是一條好漢
01/27 23:51
→
IBIZA
既然認為大家都不敢砍 那NVDA跌13%是?
01/27 23:57
推
NPID
是,我也是這樣想的
01/28 00:00
→
strlen
既然認為大家都在砍 那Meta創高是?
01/28 00:02
→
ksjr
棄硬體轉軟體阿
01/28 00:04
→
strlen
但是阿祖加碼資本支出 怎麼加碼的創高?
01/28 00:04
→
strlen
不是過剩要砍單嗎
01/28 00:05
推
kobebrian
我就說了三個月前還有破百價 那怎麼跌的?讓子彈飛
01/28 00:06
→
kobebrian
一夥兒
01/28 00:06
→
IBIZA
破百價好像又近了
01/28 00:43
推
ejnfu
通常恐慌性賣壓都是進場好時機,已加碼
01/28 00:44
推
jerry810113
泛用(x 專用合體(o
01/28 01:49
推
ProTrader
再說一次 智障型手機成本降再低到1/500結果還是相同
01/28 03:07
→
ProTrader
智障型手機最後都是會被智慧型手機淘汰
01/28 03:08
→
ProTrader
現在的DS在AI發展中應該還沒達到智障型手機的水準
01/28 03:09
→
ProTrader
也就是說未來還會有更多更完備的AI模型出現
01/28 03:09
→
ProTrader
上面推文中也提到AI範圍很大 DS只是某個領域有成果
01/28 03:11
→
ProTrader
所以現在說未來高階硬體變成垃圾沒人要還是太早
01/28 03:11
→
ProTrader
資料模型演算法硬體的進步都是相輔相成
01/28 03:12
→
ProTrader
比較值得討論的是現在大廠搶硬體獲得市佔的策略
01/28 03:14
→
ProTrader
是不是會調整改成穩扎穩打按部就班
01/28 03:15
→
ProTrader
如果大廠不搶硬體對於賣鏟子的廠商來說確實較不利
01/28 03:16
→
ProTrader
但這跟高階硬體變成垃圾沒人要還是完全不同
01/28 03:17
→
ProTrader
至於股價高檔急跌在多頭中是很常見的現象
01/28 03:19
→
ProTrader
台積電要說空頭至少等到700之下再談
01/28 03:21
→
ProTrader
就算很急著要看空最少最少也先等台積電破1000再說
01/28 03:21
推
jack206951
現在算力還是遠遠不夠,不然一堆自駕車幹嘛還用需要
01/28 10:23
→
jack206951
深度資訊的光達,直接視覺方案就好了
01/28 10:23