推文 (179)
推
OGoTTe
抓到兇手了
03/25 22:40
推
chocoball
以後每年都推出新演算法 穩
03/25 22:42
推
sdbb
樓下waitrop
03/25 22:42
推
turndown4wat
GOOG也一起下去了
03/25 22:42
→
tomdavis
照抄deepseek的說法 唉呦省資源 硬體股要完蛋了
03/25 22:42
→
sdbb
樓下LDPC?
03/25 22:43
噓
Marshalkobe2
自己也下去 厲害
03/25 22:43
→
c928
谷狗,我活不了你們也給我下來
03/25 22:43
推
TureCooler
SpaceX都要IPO了,台股上呀
03/25 22:44
推
handfoxx
GOOG 怎麼也下去了
03/25 22:44
噓
heko77923
放屁 google自己也跌慘了
03/25 22:46
推
alonzohorse
看來只剩六分之一價格,牙套50,華崩20
03/25 22:46
→
heko77923
要是這麼神早就噴了
03/25 22:46
推
Evenpan
不是因為NVIDIA KVTC嗎?
03/25 22:46
推
KS571
哭啊 阿怎麼自己跟著下去
03/25 22:47
推
chachabo
狗狗式自殺=.=
03/25 22:48
推
itwt
亂講,是真的Google這樣要噴啊,一起下去耶
03/25 22:48
噓
matlab1106
這波能源危機會讓這些高耗能的被處理吧
03/25 22:51
→
bnn
公開演算法的話不會噴啊 別人看論文照抄
03/25 22:52
推
az0102
台積電利多
03/25 22:52
推
grayeric
記憶體 is over
03/25 22:55
推
DWR
只會用更多的參數 模型越來越大而已 記憶體實際上
03/25 22:56
→
DWR
不會減少的
03/25 22:56
推
harpuia
爽啦,狗狗不爽自己下去,也把其他人一起拉下去
03/25 23:00
推
PerfectWorld
笑死論文都公開了要噴什麼? 一堆沒念過研究所是不
03/25 23:01
→
PerfectWorld
是?
03/25 23:01
噓
EDFR
OVERBOOKING
03/25 23:02
→
strife
那用原本的大小不就效能更高 sorry 我有美光 干
03/25 23:02
推
dannpptt
估狗傷敵一千自損八百
03/25 23:02
推
bs167512
一場AI大戲,繼續看它們怎麼演
03/25 23:03
推
dennis50253
救救南亞科
03/25 23:04
→
receivable
我以為是SORA停止的消息,存圖/影音比文字存儲需求
03/25 23:04
→
receivable
大多了
03/25 23:04
推
HarukaLM
google也跟著下去...
03/25 23:04
→
baka1412
https://i.imgur.com/CenWqyJ.jpeg
03/25 23:06
推
Barefoot24
GoogleAI吹那麼大,結果Gemini連個Excel都讀不出來
03/25 23:07
→
Barefoot24
,白癡
03/25 23:07
推
bcismylove
都2026了EXCEL PAY還沒普及
03/25 23:09
推
spencer222
不可能是這個啦 這篇論文2月5號就發了 主要目的是要
03/25 23:11
→
spencer222
用不足的緩存跑大模型 壓縮資料是要經過encode/deco
03/25 23:11
→
spencer222
de的 會影響運算速度
03/25 23:11
推
bs167512
真正會賺錢的東西沒人會告訴你,消息滿天飛的東西就
03/25 23:13
→
bs167512
是缺錢,叫大家趕快來投資
03/25 23:13
推
bala045
壓縮不就代表可以佈建更多 那跟需求下降有什麼關係
03/25 23:14
推
pornpig32
KVTC 是 NVIDIA 解決 AI 「記憶力太貴」問題的關鍵
03/25 23:16
→
pornpig32
技術
03/25 23:16
推
letyouselfgo
估狗不是有自研AI晶片嗎怎麼還在用H100 (諷刺
03/25 23:16
→
rooo2012
下跌不是因為中東金主的數據中心無法蓋 暫時需求沒
03/25 23:18
→
rooo2012
這麼多?
03/25 23:18
推
yyyyaaaa44
明天空南亞科會贏嗎
03/25 23:19
推
Samurai
這像是去年說deepseek算法進步,AI天花板已到一樣
03/25 23:20
→
Samurai
蠢
03/25 23:20
推
pornpig32
Google 做的 實驗時測試硬體是 NVIDIA H100 GPU
03/25 23:22
→
gladopo
那為什麼NV漲,老黃又可以COSTDOWN了嗎
03/25 23:25
推
cosmo7897
谷歌這次的突破好像是因為KV cache壓縮 推理速度變
03/25 23:25
→
cosmo7897
快且記憶體需求降低
03/25 23:25
推
eno03
記憶卡娃逃難潮開始了
03/25 23:25
→
ksuenjjr
Google自己也在跌
03/25 23:27
→
bndan
跟去年那個DEEPSEEK不同 就先不說從已完成的水桶撈
03/25 23:27
推
NEX4036
順勢壓下去收籌碼
03/25 23:28
推
holysong
下跌找理由,照歷史cpu cache跟主機板的記憶體只會
03/25 23:28
→
holysong
越來越多
03/25 23:28
→
bndan
答案這件事..就節省效能本身是讓整體能擴大使用能量
03/25 23:28
→
bndan
所以當然不會改變NV 台G 等賣鏟子一條龍的情況
03/25 23:29
→
OxFFFFFFFF
這什麼野雞算法
03/25 23:29
→
holysong
然後下一代的模型又變更大了
03/25 23:29
→
bndan
但記憶體不同 本來假設 AI大基建瓶頸是記憶體好了
03/25 23:29
噓
NEX4036
現在不就V了
03/25 23:30
→
bndan
現在可以用1/6的記憶體量能建AI基建 這時瓶頸應該要
03/25 23:30
→
OxFFFFFFFF
不管算法有多牛只要使用率越高就會越缺貨
03/25 23:30
推
jean0914
好好笑的鬼故事
03/25 23:31
→
bndan
變成缺GPU了..應該說記憶體終究是配件 主要的還是看
03/25 23:31
推
holysong
我的感覺是只要1/6的cache,一樣的效率
03/25 23:32
→
bndan
GPU搭配...更不用說如果本來AI基建瓶頸就是GPU的情
03/25 23:32
→
OxFFFFFFFF
會跌的原因就是 前陣子股票漲太多會跌而已不用找什
03/25 23:32
→
OxFFFFFFFF
麼爛理由
03/25 23:32
推
robinlee
省愈多用更多啊,殺這個超怪
03/25 23:32
→
bndan
況 那再縮成1/6 記憶體跟本會變成供>>需了..除非GPU
03/25 23:33
推
otsuka123
ds是蒸餾啊 所以回來 但谷狗大神就難講了
03/25 23:34
→
bndan
製造速度"提升"的比記憶體快..但問題是GPU的生產難
03/25 23:34
推
holysong
雲供應商一樣還是主機板的記憶體插滿
03/25 23:34
→
bndan
度遠大於記憶體 而且像這類頂端IC生產還是台G獨霸的
03/25 23:34
推
xm3u4vmp6
欸原本5090 32g算法六倍 等效192g 很爽欸
03/25 23:35
→
bndan
情況..記憶體再屌也是好幾家能產..在這情況記憶體怎
03/25 23:35
→
bndan
可能擴產比GPU慢 = =
03/25 23:35
→
xm3u4vmp6
DDR 記憶體會更賣爆 因為一堆人想自組
03/25 23:35
推
waiting101
長期還是有需求…他們只是省 不代表不繼續買ㄚ ㄅ
03/25 23:38
推
BlairWang
goog 把mu 搞下去後 自已也下去了
03/25 23:40
噓
ice80712
欸不是 谷歌自己先破底
03/25 23:40
→
bndan
長期有需求 == 用PC來假設好了 假設CPU生產量永遠是
03/25 23:41
→
bndan
瓶頸 那其他配件例如 記憶體 主機版 機殼等等 需求
03/25 23:41
→
bndan
上限其實就被鎖住了..不管當地多缺PC拿去玩大資訊基
03/25 23:42
推
ppuuppu
qq狗狗 霸脫
03/25 23:42
→
bndan
建 需求上限就是看CPU生產量阿= = 又不會忽然變成一
03/25 23:43
→
bndan
台電腦1個CPU然後裝4張主機版+4個機殼之類的 =_=
03/25 23:43
推
wei683
演算法目前有辦法快到擋得了全世界的需求嗎
03/25 23:44
推
lnonai
上下文需求幾乎是無窮盡的,只要還有KV 快取需求H
03/25 23:46
→
lnonai
BM就是多
03/25 23:46
→
lnonai
這也會加速邊緣AI的發展
03/25 23:46
→
OxFFFFFFFF
算力是越多越好 跟PC還有手機需求是不一樣的
03/25 23:47
→
bndan
算力當然是效率越高越好 越多越好 能做的事越堆越高
03/25 23:48
→
bndan
但記憶體不是 他是附件 終究會有效能提升的邊際效應
03/25 23:50
→
bndan
遞減 而這個演算法更是這邊際再縮小6倍
03/25 23:50
推
bs167512
別再想記憶體的事了,油都沒了,還再記憶體
03/25 23:54
→
BoyceChu
等於同樣規格下,可以做更多事
03/25 23:56
推
afacebook
壓縮不是一直都有在做嗎
03/25 23:57
推
KY1998
看股價說故事,這跟洩金河有啥不同??
03/26 00:00
→
OxFFFFFFFF
記憶體是AI瓶頸之一,非附加品,影響效能關鍵 演算
03/26 00:01
→
OxFFFFFFFF
法可優化但需求同步成長,難以降低記憶但的需求
03/26 00:01
→
OxFFFFFFFF
記憶體的需求
03/26 00:02
→
amd3dnow
cpu/gpu 就是要搭配記憶體...需求怎麼可能減少
03/26 00:02
推
bloodzzero
Zip問世有降低硬體需求?
03/26 00:03
噓
Tatsuya72
只想炒作缺貨就下去吧zzz
03/26 00:07
推
k128345
別說需求降低,但需求放緩呢?然後對於低階記憶體的
03/26 00:08
→
k128345
需求是不是會放緩更多,想確認這點。
03/26 00:08
→
ezorttc
塞滿好幾T 的片子能壓縮嗎?
03/26 00:11
→
ezorttc
Google 還要解壓縮,效能不就落後一節
03/26 00:11
→
allenbret
雜訊
03/26 00:12
推
HiuAnOP
99狗狗99我!
03/26 00:13
→
mtmmy
開發者大概會覺得 可以讀更多上下文太棒了
03/26 00:20
→
mtmmy
而不是減少用量
03/26 00:20
噓
jay3u7218
就漲多了....扯那麼多幹嘛?
03/26 00:23
→
liangnet
節省記憶體,多出來的記憶體繼續壓榨做更多事。誰
03/26 00:26
→
liangnet
會嫌記憶體太多的。
03/26 00:26
→
liangnet
在軟體開發裡,有時會使用更多記憶體來換取最好效
03/26 00:33
→
liangnet
能。有時會用壓縮犧牲效能換取節省記憶體。
03/26 00:33
→
amd3dnow
ai處理流程最佳化跟需求降低是兩回事....
03/26 00:33
推
goodbad
咕嚕咕嚕
03/26 00:33
→
liangnet
無論如哪種,記憶體都是多多益善。
03/26 00:33
→
k798976869
學yo叔繞過記憶體就能跑AI
03/26 00:38
→
re365339
造福終端而已,基建端只會買更多
03/26 00:54
推
jumilin927
記憶體崩!
03/26 00:56
推
j0987
推
03/26 01:00
推
Jaspercool
不是阿 狗哥你跟著跌欸
03/26 01:01
推
jason61105
相片至今儲存效能變好 所需容量還是暴增
03/26 01:11
推
joygo
現在有ai之後什麼都不要說的太死
03/26 01:16
推
ansinlee
這個就像改車子的電腦 讓馬力變大,但是對硬體的規
03/26 01:35
→
ansinlee
格要求 並不會因此減少,只是讓買不到或買不起最新
03/26 01:35
→
ansinlee
的ai伺服器 也能有不錯的馬力輸出
03/26 01:35
→
OxFFFFFFFF
大家都有AI了 去花個兩分鐘討論一下就知道到底記憶
03/26 01:40
→
OxFFFFFFFF
體需求會變多還變少
03/26 01:40
推
randy890924
Jevons Paradox了解一下
03/26 01:44
推
sunrise1748
結果谷歌自己也跌破均線
03/26 01:51
→
g9911761
這條演算法價值多少
03/26 01:53
→
lise1017
微軟最搞笑 當年嗆谷哥說什麼要搶瀏覽器 廣告市場
03/26 01:55
推
wettland5566
就只是新的演算法可以把原來記憶體減低為6分之一的
03/26 01:55
→
wettland5566
用量而已,媽的沒有寫過程式啊,因為AI中要用到大
03/26 01:55
→
wettland5566
量的記憶體,節省記憶體是必然的,這根本就不影響
03/26 01:55
→
wettland5566
記憶體股好不好
03/26 01:55
→
lise1017
結果自己的商業套裝軟體反而被抄家
03/26 01:55
推
wettland5566
怎麼會有人把它解讀成因為這項技術出來記憶體的採
03/26 02:01
→
wettland5566
購量就變六分之一好像不是這樣吧
03/26 02:01
→
weiman0702
省下來的資源就會被更大的模型補充上==
03/26 02:04
→
peterors
明天能亮幾個燈讓我撿嗎~~
03/26 02:15
推
sim3000
跌下來就是撿 情緒反應
03/26 02:23
→
budaixi
不是海力士ADR嗎
03/26 02:30
推
Belial1991
gemini錯誤還是挺多的 優點就免費
03/26 02:35
推
mutsutakato
我的媽呀 一堆文組 人家是說鍵值記憶體縮為6分之一
03/26 03:25
→
mutsutakato
不是整體記憶體縮為1/6 搞笑嗎?
03/26 03:25
→
mutsutakato
這只是讓搜尋速度更快一點而已啦
03/26 03:26
→
mutsutakato
鍵值快取就只佔了整體記億體的一小塊而已
03/26 03:35
→
mutsutakato
怎麼會把他想成以後牙科出貨量變1/6? 笑死我也
03/26 03:36
推
ravelson
之後上漲,就會發新聞說此技術不影響記憶體需求,
03/26 06:21
→
ravelson
詐騙真的是永恆不死的產業,總有人喜歡被騙還幫數
03/26 06:21
→
ravelson
錢。
03/26 06:21
推
Tenging
那就更需要了不是嗎
03/26 07:06
→
Tenging
1+1>2
03/26 07:06
推
richaad
https://i.mopix.cc/i2Ct2Z.jpg
03/26 07:13
→
richaad
一年前就發表的技術,根本找理由殺多而已
03/26 07:13
→
fallinlove15
別亂找理由耶 不就開財報後被玩
03/26 07:22
→
dslite
不就是pooling?
03/26 07:55
→
angusyu
Google自己都在下跌是三小
03/26 08:30
噓
yiyi0916789
不是,google自己跟著跌是哪招
03/26 09:55
推
z83420123
就故意找理由啊 XD
03/26 10:10
推
joy2105feh
放個產品在家股價也下去
03/26 12:16
→
fmp1234
重回以前想方設法降低記憶體使用量
03/26 13:26
推
eknbz
這當利空我還真不信
03/26 13:52
→
tw19930419
唬爛 演算法永遠都在更新 有人因為這個跌爛喔
03/26 14:57
推
cfesun
嚇唬人用的,每次大跌都說原因,然後又漲回來
03/26 20:41