新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是得靠 NVIDIA
科技新報 作者 林妤柔 2025年08月14日 15:22
https://tinyurl.com/24gqjw6w
中國人工智慧(AI)公司 DeepSeek 在嘗試使用華為晶片訓練新模型失敗後,延後新一代
模型的發布,這也凸顯北京推動取代美國技術的困難。
知情人士透露,DeepSeek 在 1 月發布 R1 模型後,受到官方鼓勵,改採用華為昇騰(
Ascend)處理器,而非 NVIDIA 系統。
然而,在使用昇騰晶片進行 R2 訓練過程中持續遇到技術問題,因此改回 NVIDIA 晶片進
行訓練,僅在推理(Inference)階段使用華為晶片。知情人士透露,這是模型發布從 5
月延後的主要原因,導致 DeepSeek 在競爭中落後。
所謂「訓練」是模型透過大量資料集中學習,「推理」則利用已訓練好的模型進行預測或
產生回應。由此可知,中國晶片在關鍵任務上仍落後美國競爭對手,這也是中國追求半導
體自給自足所面臨的挑戰。
外媒《金融時報》(FT)指出,北京已要求中國科技公司必須為訂購 NVIDIA H20 晶片提
供正當理由,藉此推廣華為、寒武紀(Cambricon)等國產替代方案。
業界人士認為,與 NVIDIA 產品相比,中國晶片存在穩定性問題、晶片間連線速度較慢,
以及軟體水準較差等劣勢。
據悉,華為曾派出一支工程師團隊前往 DeepSeek 辦公室,協助利用其 AI 晶片開發 R2
模型。但即使如此,DeepSeek 仍無法在昇騰晶片上成功完成一次訓練。不過,DeepSeek
與華為合作改為將模型在推理(Inference)階段能相容於昇騰晶片。
知情人士透露,DeepSeek 創辦人梁文峰在內部表達對 R2 進展不滿,並努力投入更多時
間打造更先進模型,以維持公司在 AI 領域的領先地位。R2 發布延後的原因還包括更新
模型所需的資料標註時間比預期更長,根據中媒報導,該模型有望在未來數週內發布。
加州大學柏克萊分校 AI 研究員 Ritwik Gupta 認為,將昇騰用於訓練這方面,華為正在
經歷「成長痛」,但預期它最終會適應,「我們今天還沒看到用華為訓練的領先模型,不
代表未來不會發生。這只是時間問題」。
心得/評論:
今天這個新聞很多
用Google搜尋了一下,一堆 https://ibb.co/Rp38wm4T
中國最近以為自己又長大了,開始抓 Nvidia H20 問題
其實如果你了解中國,大部分都是政治問題,不是H20有問題
H20最多就一個定位系統 主要在抓H20是不是出現在不合理的地方 追蹤買家
說H20有後門 我只能說是天大笑話
真正有後門的產品都是中國的產品
H20不可能有後門,中國的說法是政治說法
以為自己長大了 其實還是幼稚園
現在終於爆出 DeepSeek 用華為昇騰訓練不出來==> 真是笑死
然後前一陣子 我看到一個消息
中國在吹 華為昇騰384超節點 超越 Nvidia了
中國把這個吹上天,你們自己去查,我看了也是大笑
你們有興趣的人自己去搜尋,吹上天了 真可笑
https://tinyurl.com/2bjjcc7n
如果華為這麼行
Nvidia 股價早就崩了
中國這種吹牛的習性 沿至於自卑
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.24.200.151 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1755186930.A.85E.html
※ 編輯: winall (114.24.200.151 臺灣), 08/14/2025 23:58:55
推文 (58)
推
nakayamayyt
蒜粒只有不夠用買不到
08/14 23:58
推
holysong
遙遙領先~遙遙領先
08/15 00:10
噓
ep301177
有在看中國社群就知道,開始在洗黃仁勳是中國人,
08/15 00:12
→
ep301177
讓中國民眾接受買NV了
08/15 00:12
推
mainsa
我還以為華為那個就吹好玩的 沒想到中國真的有公司
08/15 00:13
推
hirorei
八翻
08/15 00:13
→
mainsa
會去用那種東西 說起來也是很愛國了
08/15 00:14
→
mp32283228
阿哈哈哈 不是說DS很厲害中國晶片很厲害 你看看你
08/15 00:15
推
ntr203
所以ds到底是不是用nv的低階晶片?
08/15 00:17
噓
jinkela1
真正有後門都中國產品?你要不要去對德國Angela
08/15 00:17
→
jinkela1
Merkel講
08/15 00:17
推
s213092921
「根據聯博投信 (Bernstein) 預測,輝達在中國的 AI
08/15 00:25
→
s213092921
晶片市佔率將從 2024 年的 66% 下滑至今年的 55%」
08/15 00:25
→
s213092921
,這些市占跑去哪裡好難猜啊
08/15 00:25
推
holysong
中國政府為什麼要封鎖特斯拉?因為他們也這樣要求中
08/15 00:25
→
holysong
國電動車
08/15 00:25
推
shiki1988
吹完這個繼續吹比亞迪 不意外
08/15 00:31
→
shiki1988
中吹的邏輯大概都是
08/15 00:31
推
g0t24568
難怪中國政府要出來喊 不然華為ai晶片整個掛
08/15 00:45
推
eriker
用華為真的是愛國人士 沒有各種方便的cuda跟torch支
08/15 00:49
→
eriker
援 純手刻的世界
08/15 00:49
→
CAFEHu
亞馬孫核心怪盜:口嫌體正值
08/15 00:50
推
rahit
有些模型有為昇騰等中國晶片特別調整
08/15 01:03
→
rahit
但排標配還是N家gpu
08/15 01:03
→
rahit
在AI的世界N卡目前是Windows的地位
08/15 01:04
→
HiuAnOP
科技日報不可信!什麼野雞雜誌?
08/15 01:10
推
ansinlee
彎道超車,彎進海裡了
08/15 01:10
→
newwu
應該是對自己的手刻能力很有信心吧
08/15 01:21
→
newwu
畢竟之前就去改Cuda 更底層的code加速,結果還是太
08/15 01:21
→
newwu
難了
08/15 01:21
推
ariadne
昇騰384最奇葩是體積超大,號稱媲美NVL72。結果NV
08/15 01:31
→
ariadne
一個機櫃,昇騰384要16個機櫃才能媲美,還是常當機
08/15 01:31
→
ariadne
跑不完自瀆式的媲美。佔地跟耗能明顯遙遙領先的多
08/15 01:31
→
qwe78971
繞不開cuda 來什麼晶片都一樣
08/15 02:00
推
gamesame7711
SMR跌好慘 發生什麼事惹
08/15 02:14
→
bloodyiris
手刻怎麼可能不行呢
08/15 02:29
推
lPla
中國或成最大贏家
08/15 02:58
推
mopa
技術壁壘那麼容易突破,就不會有今天的輝達了
08/15 06:18
推
jorden
中國又贏了
08/15 06:32
推
PoloHuang
DS真的難用
08/15 07:39
推
ezorttc
抵制NV 晶片
08/15 07:52
推
zo6596001
除非大學生人手一台華為晶片的電腦,不然NV還會壟
08/15 08:21
→
zo6596001
斷一段時間
08/15 08:21
→
zo6596001
下一個成功的也不會是華為,AMD還比較有可能。
08/15 08:22
噓
rancilio
講的好像你有用過H20和華為芯片一樣
08/15 08:24
→
zo6596001
以小公司幫忙面試的經驗,研究生訓練AI幾乎都用Cud
08/15 08:39
→
zo6596001
a
08/15 08:39
→
zo6596001
我們想換成AMD還找不到工程師
08/15 08:40
→
tenka92417
知情人士
08/15 08:51
推
bella1815
中吹不知道預測只是預測嗎?等發生了再來洗地吧
08/15 09:20
噓
maniaque
笑死....H20 還要追蹤啥買家? 全世界只剩下大陸
08/15 10:37
→
maniaque
會買這種次級品....
08/15 10:37
→
maniaque
要加定位追蹤,好歹也是 H100 or B200 吧.....
08/15 10:38
→
maniaque
要是明知道只剩下大陸會買,還加上追蹤器也沒告知
08/15 10:40
→
maniaque
那你認為在隱匿的前提之下,背後會做什麼比定位更
08/15 10:40
→
maniaque
令人想不到的事情,也不難理解吧
08/15 10:41
→
maniaque
怎? 換個國家搞後門定位,就有了大義???
08/15 10:41
推
NexusPrime
畢竟是中共小粉紅無腦吹,笑死
08/15 12:50