推文 (448)
推
ksjr
因為這新架構 google是不是又要重新設計TPU拉?
12/13 03:10
噓
iecju520
我看你根本不懂AI吧...
12/13 03:22
推
rayray0410
看到這ID就先推
12/13 03:24
推
L1ON
我在看openai倒數計時
12/13 03:27
推
ccneptunecc
放棄transformer架構是否意味著需要更多GPU?
12/13 03:41
推
kuku951
需要更多GPU就需要更多記憶體…
12/13 03:55
推
ng101281
一根戳破泡沫的針來了
12/13 04:03
推
kuku951
感謝分享,這東西真的挺牛的,說不定這會是未來AGI
12/13 04:08
→
kuku951
的先驅,順便回覆樓上,如果這東西是真的搞得出來,
12/13 04:08
→
kuku951
那就是戳破那些說AI泡沫的人
12/13 04:08
推
roseritter
硬體現實有餘裕的話,原本現在吹的天文級算力需求很
12/13 04:59
→
roseritter
難蓋出來
12/13 04:59
→
roseritter
改新玩法就能現實點
12/13 04:59
推
tigerzz3
好久沒看到mina大 預計何時開撿?還是保守看?
12/13 05:07
推
shead1983
這篇好驚人,感謝高高手分享內容,讀完後的感想是
12/13 05:08
→
shead1983
美光全力衝刺HBM,是不是慘惹?
12/13 05:08
推
aegis43210
現在的確是有AI泡沫,但目前要看是啤酒先裝滿或是泡
12/13 05:10
→
aegis43210
沫先消掉
12/13 05:10
→
aegis43210
不過邊緣運算中,未來NAND看起來會是最缺的
12/13 05:13
推
tigerzz3
今天這種盤 狗家不到1%真的太扯
12/13 05:14
推
kuku951
衝刺HBM怎麼會慘… 這個做法還真有可能解決HBM的困
12/13 05:15
→
kuku951
境 然後HBM的優勢在於頻寬跟速度 一定是未來最需要
12/13 05:15
→
kuku951
的
12/13 05:15
推
flyawayla
花一整個早上快速掃完,看起來運算沒減少反而更多,
12/13 05:53
→
flyawayla
不同頻率互相獨立,不獨立我猜就要用記憶體存參數,
12/13 05:53
→
flyawayla
也沒有看到討論訓練速度,通常沒有就表示一定更花時
12/13 05:53
→
flyawayla
間,心得是中立,畢竟都發一個月了,可以再等等看其
12/13 05:53
→
flyawayla
他團隊有沒有跟上
12/13 05:53
推
waitrop
當你看到論文的時候,早就有特定的TPU xpu 了
12/13 06:03
推
Morphee
先問一個問題 2017年 attention 出來之後
12/13 06:07
→
Morphee
你是否從技術押注中賺超過幾個億? 如果沒有
12/13 06:08
→
Morphee
那 Nested Learning 也只是一個數據很普的實驗
12/13 06:09
→
newwu
想想這運用到大規模,多客戶的時候,這真的會讓記
12/13 06:21
→
newwu
憶體減少嗎
12/13 06:21
→
newwu
*會讓記憶體使用量減少嗎?
12/13 06:21
推
waitrop
邊緣計算也會跟上nested learning ,也有相對應的T
12/13 06:26
→
waitrop
PU xpu
12/13 06:26
推
waitrop
會讓記憶體用量增加,但是不是hbm ,不能再多說了
12/13 06:28
推
fisher6879
呱呱呱,數學不會背叛我,不會就是不會,不過AI推論
12/13 06:29
→
fisher6879
的HBM需求下滑結論還是看得懂的,感謝mina大分享,
12/13 06:29
→
fisher6879
天網是不是又加速啦?啾命Rrrr
12/13 06:29
推
googstar
非goog的asic又要準備被輝達gpu揍爛了 改架構最能
12/13 06:31
→
googstar
適應的就輝達
12/13 06:32
推
losage
你應該要請open潤稿,g家唯一缺點就是不會說人話
12/13 06:33
推
steven853
所以結論是allin asic?
12/13 06:34
推
waitrop
沒錯,gb300的Rubin 三小的就是為了解決memory wal
12/13 06:34
→
waitrop
l ,這問題業界都知道,但是願意改架構改算法的公
12/13 06:34
→
waitrop
司,也就只有谷歌跟輝達
12/13 06:34
推
Ipluck
回過頭看M大2019第一篇文真的是含金量十足 當時
12/13 06:36
→
Ipluck
就看的這麼徹底真的厲害
12/13 06:36
推
bunjie
先推在看
12/13 06:37
推
audic
核心權重會隨互動漂移=不可重現、不可審計、極易被
12/13 06:38
→
audic
誤導,現實系統根本不敢上線,頂多停在論文
12/13 06:38
推
tsubasawolfy
這名字取得好…看到就大概知道他要幹嘛
12/13 06:42
推
ksjr
有拉今天下午當薪水小偷時有問copilot 不過這個也發
12/13 06:44
推
elliotpepe
先推一個,未來再回顧
12/13 06:44
→
ksjr
nested learning十一月初就發了 好像股價已反應?
12/13 06:45
推
Morphee
雲端跟edge會重分配吧 為啥會亂飄
12/13 06:47
推
googstar
真的通往agi只會讓整個ai產業算力需求持續飆升?
12/13 06:53
→
googstar
看來輝達真的太便宜
12/13 06:54
推
guanting886
感謝分享
12/13 06:57
推
afflic
2330有機會變成全球市值前三嗎
12/13 06:58
推
Morphee
AMD效率轉折受益者/Apple邊緣語義既得利益者
12/13 06:58
推
breathair
我只後悔都看對了,轉倉太慢還一堆QQQ,XD不過至少
12/13 06:59
→
breathair
早一步清掉TSM跟NVDA
12/13 06:59
推
tomtowin
重點是SRAM,就是買2330,感謝分享
12/13 07:00
推
deltawai
感謝
12/13 07:01
推
chives465
推M大,請問除了TSM,AVGO會建議買入嗎?
12/13 07:04
推
Morphee
想了一下 Hyperbolic若起來 NV還是比AMD有利
12/13 07:04
推
qwe78971
股票不講這個 所以短期內沒用 到時候早就換股了
12/13 07:06
→
Morphee
看軟體是否續補topology-aware跟memory-flow API
12/13 07:08
推
billionerx10
看來自研asic可能會是一條非常不明智的路 架構一改
12/13 07:16
→
billionerx10
整個無用
12/13 07:16
推
hduek153
分享推
12/13 07:18
推
kottas
好文
12/13 07:19
推
jay412210
我2330是最大贏家
12/13 07:24
推
abyssa1
要放SRAM 那就回到CCW 說的 產能遠遠不夠
12/13 07:28
推
GinginDenSha
推,呆灣房子買起來,呆民財富持續噴射
12/13 07:30
推
littlelaba
一句話 做多還做空啦
12/13 07:32
推
whyhsu
好
12/13 07:35
推
suzuke
Nested Learning 推論即訓練聽起來很美好,但是你
12/13 07:39
→
suzuke
要知道現在的推論只要做「前向傳播 (Forward Pass)
12/13 07:39
→
suzuke
」,運算量相對小。Nested Learning在推論時,內部
12/13 07:39
→
suzuke
還要做反向傳播 (Backward Pass)或梯度更新,每生
12/13 07:39
→
suzuke
成一個字,計算量可能變成原本的 2-3 倍。再來訓練
12/13 07:39
→
suzuke
穩定性極差,也還不能平行化,這些問題沒解決前,
12/13 07:39
→
suzuke
它想要成為LLM的聖杯取代Transformers 還太早
12/13 07:39
推
Morphee
從Attention到ChatGPT也差不多五年 合理的時間尺度
12/13 07:40
推
gcarrot
我也是11月底清了GOOG, 買入NVDA, 現在有點痛..
12/13 07:45
推
Morphee
樓上你講得也是我問的問題 2017年你看到Attention
12/13 07:45
→
Morphee
樓樓上才對 也可以說出類似的論點 Attention要成為
12/13 07:45
推
Morphee
AI聖杯還早 NLP還不成熟等等
12/13 07:48
推
n555123
推
12/13 07:48
推
mamorui
菇菇之前有提過,今年下半年正式進入聖杯終戰(我
12/13 07:51
→
mamorui
個人預計三年時間) ,市場通常第二年上半場會開始
12/13 07:51
→
mamorui
醞釀分勝負的前奏
12/13 07:51
推
aspirev3
邊緣裝置爆發 還跟七巨頭有關嗎
12/13 07:51
推
jimjim951357
感謝分享
12/13 07:52
推
ejnfu
所以要買哪支? Google NVDA都已有了
12/13 07:52
噓
kkes0001
搞笑,革命性論文要多少有多少,重點是實作,trans
12/13 07:52
→
kkes0001
former 到llm 中間隔多久你知道嗎
12/13 07:52
→
kkes0001
在這邊留個言當紀錄,幾個月後再來看看肯定還是原
12/13 07:52
→
kkes0001
樣
12/13 07:52
推
overpolo
真的感覺天網近了...
12/13 07:54
推
timtdsas
真股板女神推推
12/13 07:55
推
Morphee
Attention/Transformer上位速度算非常快了
12/13 07:56
→
Morphee
但是還是對投資技術的慧眼要求很高 敢在2022年底前
12/13 07:58
→
Morphee
重押的 還是有一個很強的嗅覺
12/13 07:58
推
breathair
聽起來,GOOG,AVGO,TSM,AAPL是不錯的組合?
12/13 08:01
→
lokagh
這種突破表示未來可降低ai電力需求?
12/13 08:01
推
Morphee
現在比較煩惱是谷歌有Attn論文被OpenAI反超的經驗
12/13 08:04
→
Morphee
上頭可能不準發有料的文章了
12/13 08:05
噓
kkes0001
那只能說你要嘛不是這個學術界的要嘛AI頂會論文看
12/13 08:08
→
kkes0001
少了,革命性論文說多不多,說少也不少,但真正能
12/13 08:08
→
kkes0001
走出實用這道坎的是少之又少
12/13 08:08
推
dodobaho
M大看壞記憶體?
12/13 08:09
推
jacky5946
謝謝大神分享乾貨
12/13 08:09
推
darkangel119
想到發明藍莓機的電影 黑莓 將資料壓縮讓通訊塔的
12/13 08:09
→
darkangel119
乘載量暴增
12/13 08:09
推
joe2
論文啊….個人是不信
12/13 08:09
推
breathair
聽起來懶人重壓TSM無敵XD
12/13 08:11
推
Morphee
應該是說資本投入的方向性 崁很多阿 理論 實驗 工程
12/13 08:12
→
Morphee
不是看幾篇論文衝過去單押 方向感阿
12/13 08:13
推
loopdiuretic
先推不然別人以為我看不懂
12/13 08:15
推
qscNERO
推 謝謝分享
12/13 08:19
推
pc007ya
神 感謝分享,NVDA盤兩個月還下跌哭了 2330 GUC放
12/13 08:21
→
pc007ya
抽屜傳家了
12/13 08:21
推
beavertail97
所以要出清NVDA的意思?
12/13 08:22
推
AndyMAX
出清蒜粒小隊
12/13 08:28
推
lovealgebra
習近平要統治世界了
12/13 08:30
推
calqlus
mina桑都修過來了...大盤真的牙敗了...
12/13 08:32
推
believefate
結論 還可以炒股到2026 沒事
12/13 08:36
推
FireStarman
作者都買NVDA了還有人說出清NVDA?
12/13 08:40
推
GX90160SS
績效跟鬼一樣
12/13 08:41
推
mudmud
Entropy Control
12/13 08:41
推
dongdong0405
這讓我想到早在RAG開始火了之後我就跟同事說RAG這東
12/13 08:42
→
dongdong0405
西早晚會被取代
12/13 08:42
推
axr
推 看來無腦堆tsm安心睡了
12/13 08:48
→
bnn
總覺得聽你的描述蛋白質剛進入第一層摺疊
12/13 08:48
推
bensonla
推,買2330就對了
12/13 08:49
推
jen1121
2330 NVDA APPL,三檔續買
12/13 08:52
→
Risedo
都顛覆性了 AGI還要2030嗎
12/13 08:55
→
MumiPyonPyon
說要取代transformers的文章年年都有
12/13 08:58
推
Eide
我大谷歌天下無敵
12/13 09:01
推
leotw
Tsm: 片上sram需求goog: 最高效模型+最低運算成本
12/13 09:03
推
allenmusic
好專業文 感謝
12/13 09:05
推
a39208491
推
12/13 09:10
推
barrytwu
2330+NASDAQ無腦多!
12/13 09:12
推
wangyl
有料
12/13 09:13
推
Smile365Day
應該是要出清做HBM的記憶體廠商
12/13 09:13
→
Lowpapa
這篇論文跟我想的一樣
12/13 09:21
推
AJEN1202
感概自己書讀太少看不懂
12/13 09:21
推
Lasvegas
推
12/13 09:23
推
g0t24568
Mina大995
12/13 09:29
推
stonerr
感謝分享
12/13 09:29
推
vvnews
問AI AI卻回答HBM需求反而會暴增 請問那裡有問題QQ
12/13 09:29
推
lasekoutkast
重點是掌握權力的那些政治人物
12/13 09:31
→
lasekoutkast
產業的發展跳脫不了人的管理
12/13 09:32
→
breathair
你整篇喂進去,不要自己問比較準,AI有答案了
12/13 09:32
→
lasekoutkast
那些掌握權力的政治人物決定AI發展的快慢
12/13 09:32
推
abyssa1
繼續卡dram bandwidth才會讓NVDA上不去
12/13 09:35
→
abyssa1
路線沒改的話 到時候dram比顯卡還貴
12/13 09:35
推
lasekoutkast
泡沫的產生歸根究底就是在理論尚未成熟前就一窩蜂
12/13 09:35
→
lasekoutkast
的投入資金
12/13 09:35
推
abyssa1
Mina為什麼你的ip 在日本 出國玩還這麼認真研究喔
12/13 09:37
推
aixiiae2005
M大可以直接講標的嗎= =不然2030你又要發文說2025發
12/13 09:38
→
aixiiae2005
的文沒人看得懂了...
12/13 09:38
→
aixiiae2005
這樣2030也可以回來稽查XD
12/13 09:39
→
ndk2675m
新架構的產品,由誰生產@@?
12/13 09:40
噓
bigwhiteeat
哥 不能說中文嗎….
12/13 09:41
推
Humanbeings
這篇含金量超高,已經顛覆對未來AI的想像,感謝分享
12/13 09:41
推
lajeremy
感謝分享 讚歎Ptt法人
12/13 09:42
推
lasekoutkast
產業的發展還要考慮現金流
12/13 09:43
推
liliumeow
聽起來更接近人類大腦 但如果這個架構加上超大記憶
12/13 09:46
→
liliumeow
體 有什麼不好 記憶好總是有地方可以派上用場 搞不
12/13 09:46
→
liliumeow
好是機器超越人類的地方
12/13 09:46
推
lusifa2007
好文推推
12/13 09:47
→
kao9458
這個team在ttt的前提下,水了好幾篇paper,寫的最
12/13 09:49
→
kao9458
好的是故事
12/13 09:49
推
qilar
安啦 transformer 不會死的
12/13 09:52
推
yuantai
燈別開那麼亮,很多人還有美夢不想醒
12/13 09:52
推
NekomataOkay
感謝信心加持
12/13 09:52
推
sustto
記憶體終究要回白菜價惹 PC又贏
12/13 09:55
推
asssstang
看不懂,但有料給推
12/13 09:56
→
abyssa1
記憶體要回白菜價 至少要到產能大量開出來 還很久
12/13 09:56
→
eriker
又不是O T 就比較好 這種線性模型早就一堆 transfor
12/13 09:56
→
eriker
mer跟暴力解沒兩樣 一定是最強的
12/13 09:56
→
kajika
HBM之後崩潰反轉也不會是這個原因啦
12/13 09:57
推
webberya
我看懂關鍵字了,鐵打的2330買起來就對了
12/13 09:57
→
guanting886
https://i.imgur.com/wocWLF9.jpg
12/13 09:57
推
mamorui
公司財不揭露 嘻嘻 狗狗比這篇論文發表 可能有新
12/13 09:58
→
mamorui
的才會發表
12/13 09:58
→
guanting886
https://i.imgur.com/6tMy3tE.jpg
12/13 09:58
→
guanting886
https://i.imgur.com/C91UnKk.jpg
12/13 09:58
→
guanting886
https://i.imgur.com/vLN708H.jpg
12/13 09:58
推
smallmin36
好專業!只能推了
12/13 09:58
推
assassinzero
這篇重點:如果nested learning可行,記憶體的美夢
12/13 09:58
→
assassinzero
就會破碎
12/13 09:58
→
guanting886
https://i.imgur.com/oKQy1h8.jpg
12/13 09:58
→
eriker
而且資訊越多變爛機率更高 gpt用起來就是這樣 真正
12/13 09:58
→
guanting886
https://i.imgur.com/PgyuWVA.jpg
12/13 09:58
→
eriker
有用的通常就是最近的
12/13 09:58
→
ojh
高手 這下nv真的要崩爛 只能抱孤狗了
12/13 09:58
→
guanting886
https://i.imgur.com/33oxCY0.jpg
12/13 09:59
推
jerrychuang
google不是在2024年就提出Nested Learning的概念了.
12/13 09:59
→
jerrychuang
.其他家應該多少有研究了吧..雖然GOOG還是絕對領先
12/13 09:59
→
jerrychuang
啦
12/13 09:59
→
guanting886
https://i.mgur.com/2OyJ0Nb.jpg
12/13 09:59
→
guanting886
https://i.imgur.com/2OyJ0Nb.jpg
12/13 09:59
推
mamorui
公司財最後不再揭露時 AGI就準備完成
12/13 10:00
推
nidhogg
先無腦台積電再看誰打贏?
12/13 10:00
→
eriker
長文的任務跟短文是明顯不同的 如果trasmformer在記
12/13 10:00
→
eriker
憶體可行下都還是最強
12/13 10:00
推
goodjop
尊重專業 推,但懂再多的人 短線還是會看錯
12/13 10:05
→
goodjop
何不長抱 刪APP即可?
12/13 10:06
→
goodjop
如果再2020年就有NVDA 已經是25倍的獲利
12/13 10:08
→
ojh
科技變化很快 孤狗推tpu出來 長抱nv刪app的全死
12/13 10:09
→
goodjop
真的嗎? 很多人都還是賺錢 死在哪?
12/13 10:10
推
MinJun5566
我信mina大
12/13 10:10
→
goodjop
你的言論 讓人容易記住ID 而且越來越容易記住了
12/13 10:11
推
marke18
謝謝分享~~
12/13 10:11
→
loveadu
NV65收,2奈米現在誰用?
12/13 10:15
推
cosmite
:
12/13 10:17
→
karcher
搞AI快變搞哲學了,這有助於營收?
12/13 10:18
推
brightest
看起來nested 頻寬需求只會更大 如果CIM起不來 HBM
12/13 10:18
→
brightest
需求只會更大 所以關鍵反而是CIM的創新而不是neste
12/13 10:18
→
brightest
d
12/13 10:18
→
faultless
看起來谷歌玩的方式才是未來的主流
12/13 10:19
推
as6633208
scaling law增速>>放緩>>找到更好的算法>>scaling l
12/13 10:19
→
as6633208
aw增速 LOOP
12/13 10:19
→
as6633208
不需質疑scaling law,除非你相信人類科技停滯
12/13 10:20
推
plaay
現在還沒有nested learning 劃時代發明的感覺
12/13 10:21
推
a1234567289
Scaling law不是聖經捏
12/13 10:22
推
as6633208
質疑scaling law大概就是覺得人類科技現在就是頂了
12/13 10:24
→
as6633208
,不會再更好,破台了,你覺得可能嗎,宇宙那麼大尺
12/13 10:24
推
jerrychuang
應該是HBM下降,但一般LPDDR上升.因為不需要一直搬
12/13 10:24
→
jerrychuang
,而且餐數量下降
12/13 10:24
推
stanleyiane
推~
12/13 10:25
推
as6633208
宇宙那麼大尺度,你覺得人類文明就這樣見頂了,人生
12/13 10:25
→
as6633208
真無趣
12/13 10:25
推
guanting886
定期定額買進,做好隔代沖
12/13 10:27
推
jian0202
先推
12/13 10:28
推
a1234567289
你對scaling law的理解是整個文明算力需求會上升
12/13 10:29
→
a1234567289
但這玩意說的是隨著模型規模增長 他就會表現得更
12/13 10:29
→
a1234567289
有智慧
12/13 10:29
推
bonjour87
你的最後假設是記憶體會因為需求擴廠.結論會崩盤?
12/13 10:30
→
bonjour87
但現在看到的是記憶體寧願裁掉消費性也不擴產.
12/13 10:30
→
a1234567289
文明能量 算力需求或許會上升 但這和模型說的scal
12/13 10:30
→
a1234567289
ing law是兩件事
12/13 10:30
推
Comtw
我看不懂 是不是注定當韭菜了
12/13 10:31
→
a1234567289
另外 地球尺度夠大了吧 從第一個生命誕生到現在 生
12/13 10:31
→
a1234567289
命體的智慧走的一直是更有效率而非更大
12/13 10:31
推
kei1823
美光究竟是不是先知
12/13 10:33
推
as6633208
單細胞生物也很有效率,始終了展不了科技,就是要堆
12/13 10:37
→
as6633208
,有效率只是堆更快,還是要堆
12/13 10:37
推
rayisgreat
mina大大回來了!先推先推!
12/13 10:38
推
a1234567289
我只是認為架構永遠優先於規模
12/13 10:39
推
TIPPK
99公公
12/13 10:40
推
kuosos520
all in TSMC or GOOG NVDA TSMC AAPL?
12/13 10:40
推
jatj
2樓噓的好懂 發表一下低見如何
12/13 10:42
推
yuen1029
講到人家看不懂就贏了
12/13 10:50
→
tinybunny
想買鴨 但看到macd就先等惹
12/13 10:50
推
afacebook
2年我看大家也是說transformer完蛋了 是mamba得天下
12/13 10:51
→
afacebook
可是現在主流還是都用Transformer
12/13 10:51
→
afacebook
看起來真的很厲害 不過在看看
12/13 10:52
推
Noberman
只有中國要擴廠 你哪邊資訊看到其他要擴的?
12/13 10:54
推
schula
優文推推真有趣,言簡意賅,感謝信心加持
12/13 10:56
推
BBKOX
買半導體ETF應該不會輸吧
12/13 10:57
噓
s942816
你不如說量子電腦統一世界
12/13 10:59
→
a9564208
最後針對邊緣裝置跟雲端的論述,是不是代表通訊又噴
12/13 11:00
推
afacebook
我看起來他跟qkv結構沒甚麼關聯ㄟ 他是一種新的梯度
12/13 11:00
→
afacebook
度更新方式
12/13 11:01
→
afacebook
論文確實很厲害 不過跟記憶體好像沒啥關聯
12/13 11:01
推
FULLHD1080
記憶體那邊省下來的錢,會轉去計算晶片,這樣講大家
12/13 11:02
→
FULLHD1080
懂了嗎
12/13 11:02
推
woker
不要吵買google就好
12/13 11:07
推
josephpu
推
12/13 11:08
推
lovemost
計概還老師了….努力回憶中
12/13 11:08
→
ookimoo
軟體,硬體會發展,需求不會像你想的那樣提升,top
12/13 11:15
→
ookimoo
player手上的錢也是要從投資變回收,聽不懂也沒辦
12/13 11:15
→
ookimoo
法
12/13 11:15
推
overpolo
怎麼會沒關聯 同等級算力用的記憶體變少 所以資源
12/13 11:15
→
overpolo
要先轉去撐高算力 之後算力高了變成存儲能力遇瓶頸
12/13 11:16
→
overpolo
就要再把資源拿去擴充記憶體 這是個正向的景氣循環
12/13 11:16
推
joey2k14
所以買NVDA、TSM、GOOG、AVGO、AMD、APPL對吧
12/13 11:17
推
aegis43210
大規模路線肯定是會有用的
12/13 11:17
推
woker
買半導體etf好了 基金會自動幫我們研究
12/13 11:22
→
strlen
要怎麼證明紀憶體不重要了?
12/13 11:25
推
FULLHD1080
以fab而言,記憶體御三家營收會典範轉移到TSMC,然後
12/13 11:27
→
FULLHD1080
我的AGI一定要比你強,所以開始瘋狂捲算力
12/13 11:27
→
FULLHD1080
現在大家在捲小孩子的學歷,以後大家改捲誰家的機器
12/13 11:30
→
FULLHD1080
人比較聰明比較能打
12/13 11:30
推
flightmoon
跟AI聊完,如果要在NL以及BCI上投資,AI建議TSM、
12/13 11:42
→
flightmoon
GOOG、ISRG
12/13 11:42
推
FULLHD1080
https://i.imgur.com/jc7HXbf.jpeg
12/13 11:44
推
koushimei
就是台積電繼續吃肉 韓廠挫賽
12/13 11:47
推
f0915034335
看不懂但先推再說
12/13 11:49
推
JasonTatum11
就是N變log N 這不是大一就學過的東西嗎
12/13 11:56
推
abyssa1
記憶體需求不會下降 只是增速回到線性而已
12/13 11:58
推
mamorui
趨勢是AI用記憶體扶正 除非谷歌成功顛覆硬體界「
12/13 12:03
→
mamorui
算力愈高 記憶體永遠不夠用」的基礎觀念
12/13 12:03
→
mamorui
計概的東西是最難撼動的
12/13 12:04
推
cloud1030
感謝大大的分享 與我想的差不多
12/13 12:06
推
feeling5322
感謝大大無私分享
12/13 12:11
推
ynanlin
從一個學習AI新架構的角度,我把minazukimaya大的
12/13 12:12
→
ynanlin
意見和Google nested learning paper放到NotebookL
12/13 12:12
→
ynanlin
M上,先做了這份Deep Research報告,大家可以看一
12/13 12:12
→
ynanlin
下 (http://bit.ly/497jV9T)
12/13 12:12
推
ab4daa
快搞死記憶體吧 想組電腦了
12/13 12:13
→
dream12305
小看華爾街財技
12/13 12:16
推
longlyeagle
結果下一世代最後還是靠Google...
12/13 12:24
推
BBKOX
還沒到最後的物理AI,一切都難說
12/13 12:25
→
BBKOX
半導體ETF買起來
12/13 12:25
推
SuperBig78
所以nested learning架構的出現會加速AGI的出現嗎?
12/13 12:28
推
bonbon789852
看不懂但是感謝分享 大GG天下無敵
12/13 12:30
推
eatlion
感謝大大無私分享
12/13 12:30
推
ctes940008
要爆了嗎?
12/13 12:33
推
for767
有什麼好刺激的?記憶體已經好幾次這樣了
12/13 12:37
推
jorden
感謝分享 終於懂目前AI模型語言一堆限制的邏輯了
12/13 12:37
推
bring777
領先技術的,現在誰新手機沒用AI ?
12/13 12:38
推
oops801011
推
12/13 12:43
推
SilverRH
GSIT先躺一票人進去了
12/13 12:47
推
pmes9866
老鐵牛逼 我要好好複習我的數學了
12/13 12:49
推
loopdiuretic
那台積要回房間喝酒了嗎 奪門而出啥時回來?
12/13 13:12
推
s81048112
看完推
12/13 13:14
推
CCPenis
還真的是2330無腦多
12/13 13:19
推
BBKOX
重壓TSMX,再加上七巨頭槓桿ETF,應該可以應對後面
12/13 13:22
→
BBKOX
AI的發展
12/13 13:22
推
junior020486
甲骨文丸辣
12/13 13:22
→
BBKOX
囊括代工、算力、模型、應用
12/13 13:23
推
NoMomoNoLife
賀出桶!還馬上熱心分享QQ
12/13 13:23
推
ynanlin
關於接下來幾年學習推理運算所用的晶片,會朝更客
12/13 13:23
→
ynanlin
製化,記憶體需求與架構也將改變,由於NL是Google
12/13 13:23
→
ynanlin
開發也正積極落實應用,可想見內部有更多相應硬體
12/13 13:23
→
ynanlin
架構的研發,也有相對領先的優勢。粗淺的Deep Rese
12/13 13:23
→
ynanlin
arch報告第二則分享給大家看看(https://bit.ly/4rV
12/13 13:23
→
ynanlin
v1X3)
12/13 13:23
推
walkingtall
m大厲害!希望後續持續幫忙暗示(或明示XD)救一下
12/13 13:25
→
walkingtall
我們這些小菜雞XD
12/13 13:25
推
nikoyaka9527
推mina大,謝謝分享資訊
12/13 13:34
推
rayisgreat
前幾天才看到TSMC釋出的N7到未來A14的效能演進,再
12/13 13:37
→
rayisgreat
加上架構模型持續架化,兩者相輔相成實在很難想像未
12/13 13:37
→
rayisgreat
來的AI世界會有多可怕@@
12/13 13:37
→
rayisgreat
*持續進化
12/13 13:37
→
alanjiang
這是可以免費看的嗎www
12/13 13:38
→
rayisgreat
https://reurl.cc/eVM4xW
12/13 13:39
推
rayisgreat
再次感謝mina大大分享
12/13 13:41
推
bob1012
感謝分享
12/13 13:48
推
ACDC69
看不懂,先推
12/13 13:49
推
OuO333333
看起來像Transformer+RL?
12/13 13:58
推
mamorui
mina大一定知道數學猜想也在靠AI解決中,菇菇我等
12/13 14:01
→
mamorui
躺在科學家塵封盒子的做不下去的論文登場,AI的第
12/13 14:01
→
mamorui
三篇章聖杯是黑科技。
12/13 14:01
推
TaiwanUp
NL=控制理論 Transformer=引擎 HOPE=會變形的引擎
12/13 14:11
→
TaiwanUp
會變形的引擎在飛機來說很恐怖 但模型訓練不一定
12/13 14:12
→
TaiwanUp
熱力學定律還是至高無上 很難有什麼技術可比喻為之
12/13 14:14
→
TaiwanUp
熱力學定律是不可被比喻的
12/13 14:15
→
TaiwanUp
剛睡醒就看了好人名單文 刷了兩小時的手機
12/13 14:16
→
h22349
別想太多 一篇優化效率 現在ai就像是國土擴張,遲
12/13 14:22
→
h22349
早會有新算法,需要這些資源
12/13 14:22
推
FULLHD1080
AI的飛輪效應要來了,算法-硬體 相互改善,直到物理
12/13 14:25
→
FULLHD1080
化學的窮盡
12/13 14:25
推
linweida
睡醒看到Mina大的文必推! (mina怎麼好像不用睡覺)
12/13 14:30
推
ykjiang
SRAM太貴太佔die size且面向用戶,不用太低延遲
12/13 14:38
→
ykjiang
DRAM應該更適合
12/13 14:38
→
TaiwanUp
文明熵減是局部熵減 很難跟全域對偶 但是人致富關鍵
12/13 14:57
推
hotbeat
CUDA 才是那個聖杯 ,ASIC只能做edge的
12/13 14:59
噓
MoonCode
想太多了
12/13 15:01
推
hotbeat
怎麼看google還是最大贏家,跟台廠有結盟的基本上
12/13 15:08
→
hotbeat
都不用擔憂太多
12/13 15:08
推
breathair
再推一次!看完覺得自己對AI的發展拔高了不只一層!
12/13 15:15
推
TaiwanUp
宇宙和文明還是有對偶 但沒有野蠻和文明那麼明顯
12/13 15:23
推
afacebook
當初大家覺得Mamba能取代transformer 是MoE+mamba或
12/13 15:32
→
afacebook
其他的架構 當然不可能只有一層ssm的架構啊
12/13 15:33
→
afacebook
這東西感覺是一種特別的fine turing
12/13 15:34
→
afacebook
能不能成功 要再多做一點實驗
12/13 15:34
→
afacebook
現在主要還是覺得大模型比較強
12/13 15:36
→
afacebook
這是想要做些中模型 就能有很好的適應能力吧
12/13 15:36
→
afacebook
很特別 請google再多做一點實驗
12/13 15:37
→
afacebook
CMS這種更新方式 其實跟一般 先凍結一些層 然後慢慢
12/13 15:39
→
afacebook
打開 不是很像嗎?
12/13 15:40
→
afacebook
然道主要是那optimizer有貢獻嗎
12/13 15:41
→
afacebook
好像也沒這麼簡單 要再研究一下
12/13 15:43
→
TaiwanUp
NL像是聯合國憲章 HOPE是機構+流程 Transformer美國
12/13 15:52
→
TaiwanUp
Mamba就是另一國 但看起來沒有成氣候
12/13 16:01
推
misthide
總歸一句 2330是最大贏家 任何新技術都繞不開它
12/13 16:02
推
BBKOX
以為買了AI Pro就能一直使用Gemini思考型,結果還
12/13 16:10
→
BBKOX
是有次數限制…
12/13 16:10
推
afacebook
Mamba有沒有成氣候 還不知道吧....
12/13 16:24
→
afacebook
每次新架構出來 基本都會吹一下 要經過檢驗
12/13 16:26
推
afacebook
說實在 我個人是覺得沒有到當初看Transformer那種
12/13 16:28
→
afacebook
神奇感 就是等看接下來發展
12/13 16:29
→
PTTMAXQQ
感恩啊 謝謝分享專業知識 對我幫助蠻大的
12/13 16:40
推
sss966146
想問2019是哪一篇
12/13 16:50
推
h129875230
要五層參數 不就要一大坨人幫忙 fine tune嗎 這個
12/13 16:51
→
h129875230
五年內就出來 是不是有點樂觀
12/13 16:51
推
jonaswang01
我g天下無敵還有人有疑問?
12/13 17:12
推
suPerFlyK
只能推了
12/13 17:17
推
akanokuruma
意思是記憶卡現在風聲水起 隨著技術更新 擴廠=負債
12/13 17:29
→
akanokuruma
虧損 暴死
12/13 17:30
推
Bellucci
看不懂所以問AI, 它建議是Goog/AAPL/AVGO/QCOM/ARM/
12/13 17:35
→
Bellucci
TSMC/聯發科 , Nvidia有其護城河且他具備訓練功能不
12/13 17:35
→
Bellucci
至於死掉但要分散風險不重倉。
12/13 17:35
推
Bellucci
TSM是絕對防禦
12/13 17:38
推
darkangel119
AI回答我是SRAM IP 跟 ASIC 事核心受益者 咦?
12/13 17:40
推
Bellucci
https://i.imgur.com/vcaDUXg.jpeg
12/13 17:49
→
Bellucci
https://i.imgur.com/1tqlePE.jpeg
12/13 17:50
→
Bellucci
https://i.imgur.com/bMImfC4.jpeg
12/13 17:51
→
Bellucci
https://i.imgur.com/l4R5a7F.jpeg
12/13 17:51
→
Bellucci
我菜雞還是QQQ和mega 7就好,神仙打架我沒資格參加
12/13 17:52
推
joewang85
推
12/13 17:58
推
as6633208
行業護城河問gpt你會很慘喔,每間護城河都是在增加
12/13 18:06
→
as6633208
的要看的是未來布局
12/13 18:06
推
mudmud
Active Entropy Control Model
12/13 18:28
推
Bellucci
我沒問行業護城河欸我直接給論文它自己寫的
12/13 18:28
→
Bellucci
重點不在第四張在前三張
12/13 18:29
→
Bellucci
反正AI沒回要買Nividia 是建議前三張的標的
12/13 18:30
推
lee198218
謝謝提供非常好的素材
12/13 19:00
推
breathair
此篇重點在未來AI世界的描繪,虛擬與現實的雙耦,虛
12/13 19:06
→
breathair
擬的入口(GOOG,APPL),物理的極限(TSM,CEG)
12/13 19:06
→
lavign
通用型怎麼什麼都不精怎麼和ASIC比
12/13 21:03
推
PTTMAXQQ
你各位還是想想最終消費者會選擇從哪個入口去付費A
12/13 21:16
→
PTTMAXQQ
I
12/13 21:16
推
sustainer123
這篇不是github還沒開源嗎?
12/13 21:28
推
avans
不懂Nested Learning如何降低vram用量,不過先推了!
12/13 22:49
→
njjroom
謝謝mina大的分享引起很多大大的討論,跪學中……
12/13 23:16
推
ksjr
asic每次換算法都要重新設計來取得最佳效能啊
12/13 23:39
推
ykjiang
這用TPU跑一定悲劇,GPU勉強可以,ASIC有得等
12/14 02:00
→
ykjiang
不過NL不會太快取代現有的LLM,即使硬體充分支援
12/14 02:01
→
ykjiang
每個人都雲端學習自己的AI model,學出來還都不同
12/14 02:02
→
ykjiang
太不可控了
12/14 02:02
→
ykjiang
可以考慮邊緣端的應用,不過風險還是很高,容易被告
12/14 02:03
→
JKjohnwick
太唬爛,這要甚麼時候商轉,甚麼時候價格降下來
12/14 13:43
→
JKjohnwick
如果可行的話,採購第一個轉過來買這個
12/14 13:44
推
mtm
這是股版目前最有料的一篇
12/14 14:59
推
mtm
9月的時候要減碼TSM,現在要趕快補回來了嗎
12/14 16:20
推
eknbz
回來mark一下 這篇paper可能對我工作有幫助
12/15 03:22
推
verydolungbe
我看到了 BETA 與 VHS 之爭。還有人聽得懂我我嗎?
12/15 07:23
推
verydolungbe
http://i.imgur.com/Fy9qodr.jpg
12/15 07:41
噓
patvessel
範式變更越大tpu入土越快
12/15 09:09
→
patvessel
還在內插就不要講什麼熱力學都定律了
12/15 09:09
→
patvessel
聽這個跟聽推背圖差不多
12/15 09:09
推
nelso
M大就給推~ 雖然還是不太容易理解
12/15 14:39
推
a125wind
呱呱QAQ
12/22 11:27
噓
OxFFFFFFFF
亂講一通,如果你覺得2026記憶體會崩盤,那建議你
01/03 02:04
→
OxFFFFFFFF
身家去空
01/03 02:04
→
OxFFFFFFFF
聽了這個人的發文,把台積電賣掉的要不要過來這邊
01/03 02:10
→
OxFFFFFFFF
噓一下
01/03 02:10