先別管晶片廠怎麼蓋
先來看一下老馬之前晶片設計怎麼翻車的
先貼個tesla dojo 2砍掉的新聞
https://techorange.com/2025/08/08/tesla-dojo-shut-down/
技術細節參考
https://electrek.co/2022/08/24/tesla-deep-dive-presentations-dojo-ai-supercomputer/
https://chipsandcheese.com/p/hot-chips-34-teslas-dojo-microarchitecture
他的架構是這樣
用354 riscv core組成一個die
再用25個die組成一個tile
最後tile組成運算節點
但這樣有個問題
他設計的功率密度太高 需要上水冷
然後die size很大 又要考慮壞點容錯
die to die也要考慮path失效的容錯
但不是只有晶片良率的壞點
高熱長期運轉本來就會經常掉點
尤其是這種大規模運算叢集
比如meta這篇
https://engineering.fb.com/2024/06/12/data-infrastructure/training-large-language-models-at-scale-meta/
練LLM基本上都在和節點失效搏鬥
神經網路的整個訓練流程
只要一個bit翻轉都有可能把整個訓練殺死
(梯度下降算法,錯誤會隨梯度傳播到整個模型)
他的技術只有考慮靜態失效
也就是練到一半突然壞一個core是無法處理的
(因為他的軟體根據晶片壞哪裡,去編譯出繞過壞點的程式
壞點必須事先知道)
不管你dojo 2算力多少,訓練流程跑不完,就是不能用的
我只能說Tesla還是太天真了
下次記得不要找印度人當主管
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.34.98.192 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1774335376.A.C90.html
推文 (61)
推
jaricho
還給我火星 不要退成月球
03/24 14:57
推
zaqimon
節點失效 不能叫AI去debug嗎 反正現在AI很厲害
03/24 14:58
推
mynumber55
靠腰原來是晶片太爛,我以為是成本幹不贏老黃
03/24 14:58
推
aloness
不要找印度人當主管是真的…
03/24 15:00
→
aloness
甚至當下屬都不要,印度人真的是來幫台灣人減壽的(
03/24 15:01
→
aloness
活活氣死
03/24 15:01
推
qaz27966
專業說明推
03/24 15:02
推
cloud7515
印度人接下來要征服日本了
03/24 15:02
推
hosen
專業推
03/24 15:03
推
jceefailurer
重壓台積,穩贏
03/24 15:04
→
hosen
總是有人以為設計只要堆料就好
03/24 15:04
推
joygo
印度人 很適合老馬其實 都是喊大然後無限延期
03/24 15:04
→
dieorrun
但是印度人的創意我是不懷疑的 像之前的AI無人商店
03/24 15:06
→
dieorrun
靠的是真人遠端當店員 這種創意我真的沒有
03/24 15:06
推
aloness
老馬做的最起碼會看到他朝著目標做失敗的樣子,印度
03/24 15:09
→
aloness
仔是不朝目標做也一樣失敗給你看
03/24 15:09
→
j32072
看起來完全沒問題 期待雪茄漢堡產線
03/24 15:11
→
VicLien
特斯拉搞特規還是可以啦 跟三星拿貨也是堪用 自駕
03/24 15:13
→
VicLien
車先鋪好衝衛星 等資本進來鬼轉老黃也不是不可能
03/24 15:13
→
VicLien
反正誰要上太空目前很難繞過馬
03/24 15:13
推
s800525
搞這個為了衝SPACEX IPO價格吧
03/24 15:14
推
cowaksor
翻小車已經不稀奇了 要翻世界級的大車
03/24 15:15
→
Flyroach
無人XX靠的是後方遠端搖控不是很多都這樣玩嗎
03/24 15:17
推
s800525
在嘴無人工廠前,特斯拉先把上海廠搬回去美國吧
03/24 15:21
→
s800525
連特斯拉一半產能靠中國,還在那畫大餅
03/24 15:22
推
Usmall857
等合併SPACEX就會轉彎了 呵呵
03/24 15:27
推
SkyPlus
他的自傳就有很多畫大餅失敗的例子,不過也有工程師
03/24 15:28
→
SkyPlus
這三小KPI,事後卻成功的案例
03/24 15:28
→
SkyPlus
只能給時間證明這次是SpaceX還是boring company了
03/24 15:30
→
SkyPlus
^(工程師"覺得")
03/24 15:30
推
PTTMAXQQ
本來以為能移民火星
03/24 15:31
→
PTTMAXQQ
想不到變成在月球蓋工廠QQ
03/24 15:31
推
Xargon0730
不要太粗暴
03/24 15:37
推
DDhow
跟印度阿三合作過就知道他們有多爛
03/24 15:47
推
TISH12311
嗯嗯 世界首富翻100次車都不會有事吧
03/24 15:50
→
cleanx
只是要炒股票
03/24 15:50
→
JKjohnwick
總有人覺得代工很簡單
03/24 15:52
推
hectorbibby
好,特斯拉 空爆它
03/24 15:53
推
donod
人家有AI+機器人 這些問題給AI+機器人 輕鬆突破^^
03/24 16:01
推
DellSale999
相信老馬 不相信的褲子都被沖掉好幾條惹 產線吃薑母
03/24 16:05
→
DellSale999
鴨
03/24 16:05
推
darkangel119
相信老馬 火星算什麼 十年後去仙女座星雲觀光
03/24 16:28
推
dkfs789
不管你信不信反正特粉都會信
03/24 16:29
推
linleex
火箭跟ai比晶圓難那麼多都能成功了
03/24 17:29
推
create8
難怪dojo被砍
03/24 17:41
→
haopig
馬粉真的很狂,居然覺得火箭比晶圓難很多
03/24 18:03
→
fallinlove15
最後可能只有能吃漢堡有達成 改開速食店之類的 那
03/24 18:07
→
fallinlove15
用機器人沒問題
03/24 18:07
→
aegis43210
設計晶片這方面,臺灣有創意、世芯、聯發科…等公司
03/24 18:30
→
aegis43210
可以花錢省事,但這些公司只想自己亂搞,自然容易失
03/24 18:30
→
aegis43210
敗
03/24 18:30
推
somanyee
ptt最不缺懂一些硬體/系統痛點的人,寫七成專業、
03/24 18:37
→
somanyee
三成情緒的唱衰文
03/24 18:37
→
fallinlove15
也不缺只會用信仰回應別人質疑的人
03/24 18:46
→
haopig
ptt最不缺什麼都不懂只會喊神功護體的教徒
03/24 18:56
→
southes
火箭幾十年前很多國家就有
03/24 19:06
→
southes
門檻又不高
03/24 19:06
→
twinmick
老馬本來就失敗的業務也不少,但是造神嘛當然都歌頌
03/24 21:21
→
twinmick
成功的,而且沒辦法老馬成功的還都是能吸目光的..
03/24 21:23
推
cookies12
-.-Ai只能用現有的資料訓練 你沒有的東西怎麼訓練?
03/25 01:46
→
cookies12
另外AI對系統架構的實行性根本沒有感覺 都瞎掰
03/25 01:46