ETtoday新聞雲 2025年03月25日 16:10
DeepSeek 公布最新V3模型 意圖超越 OpenAI
DeepSeek 昨日(24)針對其「DeepSeek V3-0324」模型悄悄發布了更新,雖非外界預期
的R2 模型,但仍然有不少亮點。
V3模型無預警地在本週的 Hugging Face 上發布,此次更新聲稱能夠「有效且準確地解決
現實世界中的挑戰」。今年一月,DeepSeek 一度超越 ChatGPT,成為蘋果美國應用程式
商店中最受歡迎的免費軟體。V3 模型是一款強大的混合專家(MoE)語言模型,擁有
6710 億個總參數,其中處理每個 token(即每個單詞或符號)時,模型會動態選擇並啟
動370億個參數來進行計算,這種方法使得模型能夠在保持高效運行的同時,利用大量參
數來提高預測的準確性和性能。在預訓練之後,V3 進行了知識蒸餾,從 DeepSeek-R1 模
型中提取知識,這一過程進一步提升了模型的性能和應用能力。
本次更新展示了 DeepSeek 在技術創新方面的持續努力,並預示著未來 AI 技術將更加高
效。隨著競爭的加劇,DeepSeek 的進步無疑將對全球 AI 產業產生深遠影響,更突顯了
這家中國 AI 新創公司保持領先競爭對手的意圖。
https://www.ettoday.net/news/20250325/2931329.htm
穩了?
昨天DeepSeek更新V3模型 雖然非預期的R2模型
V3擁有6710億個參數處理單詞或符號 模型會動態啟動370億個參數計算
V3使用知識蒸餾從DeepSeek R1提取知識 提升模型的性能和應用能力
--
https://i.imgur.com/hW5h5gU.gif https://i.imgur.com/kJV8Xpi.gif
https://i.imgur.com/mus9aa2.jpeg https://i.imgur.com/xsoSdOK.jpeg
https://i.imgur.com/Rq7dbDm.jpg https://i.imgur.com/3JFrFUW.jpg
https://i.imgur.com/fpRblKK.jpeg https://i.imgur.com/xxuciis.jpeg
https://i.imgur.com/sYpst6n.gif https://i.imgur.com/DEKfHhV.jpeg
https://i.imgur.com/90i6C8z.jpg
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.218.53.138 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1742890703.A.C0F.html
推文 (126)
推
Gavatzky
科技上能跟美國抗衡的看起來只剩中國了
03/25 16:21
推
kuojames2580
中國或許發明打不贏美國 但一定能捲贏美國
03/25 16:22
→
lepidoptera
老黃:買越多 越便宜..
03/25 16:22
推
QooSnow
(一級棒!)
03/25 16:22
推
h0103661
反了吧,是美國能跟中國抗衡
03/25 16:22
→
hsu0612
開捲了 好爽
03/25 16:23
推
Lenney33
NV快沒呼吸了...99老黃
03/25 16:23
推
Jaline5566
中國AI就是吹
03/25 16:23
→
hsu0612
還可以更便宜
03/25 16:23
推
gk1329
不如預期 崩
03/25 16:24
→
gk1329
中國多印點鈔投資半導體鴨 坐等顯卡白菜價
03/25 16:26
→
b9513227
新加坡又偷買了嗎
03/25 16:26
噓
cityhunter04
越公布越虛弱…還要吹多久呢?
03/25 16:27
推
OhtaniHR
不然美國幹嘛頃全力封鎖 不給台積電代工也不讓他們
03/25 16:27
→
OhtaniHR
買先進的輝達 只要封鎖繼續中國基本上都很難追上
03/25 16:27
→
OhtaniHR
除非他們真能自己練出光刻機還追上台積電 但就算能
03/25 16:27
→
OhtaniHR
也是十年以上的事情了
03/25 16:27
→
stanleyplus
中又贏麻
03/25 16:27
推
hikai
https://i.imgur.com/mgXJGf2.jpeg
03/25 16:28
推
piece1
讚讚!卷起來...免費仔蹭就好..等便宜的顯卡
03/25 16:28
→
tsaiweili
好棒!消費者的福音!
03/25 16:28
推
c928
蒸餾再蒸餾,以後就看誰蒸餾比較濃
03/25 16:28
→
tsaiweili
難不成要花大錢去買沒啥用的XX?
03/25 16:29
推
tony1768
越吹90卡越漲
03/25 16:29
→
poeoe
真的是追著Open AI打欸 這麼狠嗎
03/25 16:30
噓
drpepperfish
心得除了「穩了」之外都是節錄文章內容,
03/25 16:31
→
drpepperfish
覺得你進桶比較穩
03/25 16:31
推
gbman
中文世界以後就DS主主導!英美Open AI CC
03/25 16:31
推
kotorichan
EUV有機會吧 如果是由華為主導負責
03/25 16:32
→
kotorichan
便宜治百病 拒絕使用壟斷付費的AI
03/25 16:32
噓
wwwcom71
有空生成這麼多圖不如好好研究心得怎麼寫
03/25 16:35
→
IBIZA
DeepSeek現在就是用不同模型之間在互相調教
03/25 16:36
→
IBIZA
他那個不是單純蒸餾而已
03/25 16:36
推
permanent27
又回答不出46
03/25 16:37
推
hamasaki7788
隨便了啦
03/25 16:37
推
sdbb
若能弄到GB300,豈不飛天
03/25 16:38
推
fatb
便宜真的治百病 各家公司都開始自己偷偷架DS玩
03/25 16:38
推
joe0934
中國只要靠便宜就贏了
03/25 16:38
推
newgo1776
TSMC:還不是要用我的晶片?
03/25 16:39
推
amazingwow
過氣了啦 nv需求依然猛
03/25 16:39
→
newgo1776
Nvidia:還不是要用我的晶片?
03/25 16:40
噓
zombiepigman
煩死了
03/25 16:40
→
zombiepigman
什麼都要卷
03/25 16:40
→
appledick
TSMC 還不是都要靠我
03/25 16:41
→
appledick
偷偷架???有三小好偷偷架的 北七喔
03/25 16:42
推
PoLyGyNy
費半又被嚇崩了
03/25 16:42
→
appledick
上層他媽的只要便宜又好用 管你是用三小
03/25 16:42
→
appledick
小娜瞬殺就這個喔?
03/25 16:43
推
suzu1
台灣又站錯邊,台股應該沒戲了
03/25 16:43
推
Lowpapa
反觀台灣
03/25 16:45
推
opoping123
費半gg
03/25 16:47
→
zxcv12300
用過很難用
03/25 16:48
推
Swave
孫正義是不是又要虧死了
03/25 16:48
→
reall860523
又是死媽DS利空
03/25 16:48
推
junior020486
好了啦,你偷買多少Blackwell系列的伺服器
03/25 16:49
→
junior020486
新加坡偷賣多少啦
03/25 16:49
推
junior020486
不bang新加坡,中國一直偷買一直爽
03/25 16:51
推
ola1a1217
樂觀其成
03/25 16:52
→
junior020486
Ban啦幹
03/25 16:52
推
realmd
DS問世後NV就沒站上之前的價格 晶片溢價賣不動了
03/25 16:52
→
jvor0719
淫麻了 好爽喔
03/25 16:52
→
junior020486
笑死,沒站上?前一陣子回到140叫做DS問世以後沒站
03/25 16:53
→
junior020486
上,你活在平行世界噢XD
03/25 16:53
推
jumilin927
崩崩崩
03/25 16:53
→
junior020486
中期回檔一個多月就一堆散戶在那邊:啊~算力過剩
03/25 16:54
推
EZTW0000
阿不是用不到這麼多硬體怎4090已經9萬
03/25 16:57
→
LMgogo
這家用gb200吧 目前gb200這拉基沒人要
03/25 17:00
推
ededws1
不就V3的小版本,等出V4或R2再說
03/25 17:00
推
pornpig32
蒸餾捲起來
03/25 17:07
推
leo1217000
過氣了吧
03/25 17:09
推
ts0045851127
中國ai不敢信
03/25 17:09
推
lucakooptt
又想圈錢
03/25 17:13
→
rbelldandy
美國總會有自實其果的時候,現在只能搶錢
03/25 17:14
推
GooglePixel
軟體帶動需求 硬體不會少
03/25 17:14
→
WTF55665566
拉進垃圾車
03/25 17:15
推
raxxar82
大家來拼降低AI成本了
03/25 17:15
推
kenbo
鬼故事連發
03/25 17:28
推
CYL009
美吹殖人出來透氣我就放心了 打臉準備ww
03/25 17:36
推
Jeff1989
沒有大場面QQ
03/25 17:38
推
uller
開源就是爽 等等回家載
03/25 17:39
噓
ken123321987
各位偉大的中國人 打倒美帝就在眼前 革命尚未成功
03/25 17:42
→
ken123321987
同志仍須努力 中國爸爸不會忘記彎彎的
03/25 17:42
推
Everybody99
過氣了吧 之前還出包
03/25 17:42
推
bigpan
人礦才是中國最強的地方
03/25 17:52
推
alau
蒸餾完畢
03/25 17:54
→
hydra7
徹底的蒸餾
03/25 17:54
推
kobebrian
啊美國就沒用讓人一直偷啊
03/25 17:54
推
odyssey
股版邊酸邊用DS?
03/25 18:07
推
jei01
把一顆大腦學習的精華去升級另一顆智商更高的大腦
03/25 18:08
→
jei01
要就怪open AI要做close ,遇到開源的DS只能打價格
03/25 18:10
→
jei01
戰了
03/25 18:10
推
hero613
Grok比較好用,尤其是一些道德底線的問題。
03/25 18:10
推
Lhmstu
穩,OpenAI最近出那個貴死人的東西真的沒用
03/25 18:12
→
kausan
蛤 gpt不是早看不到車尾燈了
03/25 18:19
推
jei01
Gpt是訓練成本太高,目前稍勝DS一些
03/25 18:26
→
jei01
但DS出世讓Gpt成本要回收很難,只能繼續燒錢
03/25 18:26
推
tw11509
中國本來就是卷死人的地方,但開源還真沒什麼好嫌
03/25 18:35
→
tw11509
的
03/25 18:35
推
syoritoo
已反應 下去吧
03/25 18:37
推
jboys75
以後科技公司徵人都找待過酒廠的
03/25 18:38
推
s213092921
DS V3新模型效能相當Claude 3.7,重點是免費開源隨
03/25 19:00
→
s213092921
便用
03/25 19:00
→
s213092921
恭喜Google可以下去了
03/25 19:01
→
s213092921
https://reurl.cc/2KrVga
03/25 19:01
→
visadanny
I dot car 用過其他模型 再回頭用deepseek 就會發
03/25 19:15
→
visadanny
現ds慢死了 優點只有便宜而已
03/25 19:15
推
tkc7
卷死你
03/25 19:22
推
k1k1832002
說真的GPT是真的難用,不說DEEPSEEK,用Claude3.7都覺
03/25 19:26
→
k1k1832002
得效用比他強(單論資料整理)
03/25 19:26
推
stocktonty
難怪這幾天又拉資服
03/25 20:03
推
ruei1999
感恩DS,不然Gemini,openAi,grok也不可能那麼快把一
03/25 20:10
→
ruei1999
堆花錢貨給免錢玩lol
03/25 20:10
推
jei01
你想用快的DS,那你可以自己建計算中心魔改DS
03/25 20:15
→
jei01
都開源給你了,你厲害就不必用他的算力
03/25 20:15
推
k1k1832002
不買個DGX SPARK嗎 (x
03/25 20:19
→
fmp1234
V3火箭
03/25 20:39
推
CaTkinGG
因為文字的關係 台灣以後好用的AI服務應該要靠中國
03/25 21:05
→
CaTkinGG
持續發展
03/25 21:05
噓
TaiwanUp
不要仰望惡鄰居
03/25 21:24
→
c00jsw00
剛剛使用真的編程能力強大
03/25 22:44
推
smart1989
意圖都出來了
03/25 23:11
推
wahaha711233
26捲起來,消費者舒服,米國佬吃屎
03/26 10:01
推
slothman
根本超廢 卡起來
03/26 10:44
→
mdkn35
Zzz
03/26 12:20
→
bigtree03
越來越卷
03/26 13:12
噓
carking49
這寫的太差了,明明就超越了還意圖,唬爛都不會
03/26 18:33