[新聞]DeepSeek-R1 模型升級新版本，推理能力接 - PTT 文章瀏覽

作者pl132 (pl132)

標題[新聞]DeepSeek-R1 模型升級新版本，推理能力接

時間Fri May 30 15:47:33 2025

原文PTT 原始連結 ↗

DeepSeek-R1 模型升級新版本，推理能力接近 o3、Gemini 2.5 Pro https://tinyurl.com/2bkshvbp 中國 DeepSeek（深度求索）釋出 DeepSeek-R1-0528 模型新版本，使其免費開源模型在推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。 DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3-Base 為基礎，在後訓練（ Post-Training）過程投入更多算力，提升新版模型思考深度與推理能力，有助於提升數學、科學、商業及程式設計等複雜推理任務上的表現。 DeepSeek-R1-0528 在數學、程式設計及通用邏輯等多個基準測試取得優異成績，並在整體表現上接近如 OpenAI o3、Google Gemini 2.5 Pro。相較於舊版 DeepSeek-R1，新版模型在複雜推理任務的表現有所提升。例如 AIME 2025 測試，因推理過程中加強思考深度，新版模型準確率由舊版的 70% 提升至 87.5%。同時，DeepSeek 蒸餾 DeepSeek-R1-0528 的 CoT（Chain of Thought）後訓練 Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。這款 8B 模型在數學測驗 AIME 2024 僅次於 DeepSeek-R1-0528、超越 Qwen3-8B，並與 Qwen3-235B 相當。DeepSeek 認為，DeepSeek-R1-0528 的 CoT 對於學術界推理模型的研究和工業界針對小模型的發展皆具意義。 https://is.gd/b5sIbD 與先前版本相同，DeepSeek-R1-0528 採用 MIT 授權條款，並上傳至開源機器學習社群平台 Hugging Face，開發者能夠自由修改甚至進行商業部署。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.146.20 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Tech_Job/M.1748591261.A.B02.html

推文 (41)

推 lespacino z,,,，，喔，，我，，,, 122.121.26.5 05/30 16:38

噓 r4989872 繼續吹吧有open ai根本就不需要這 101.10.8.231 05/30 17:03

→ r4989872 坨 101.10.8.231 05/30 17:03

推 Homeparty 之前幻覺大概70%，現在大概20%以下 101.9.36.148 05/30 17:28

噓 cityhunter04 難用的東西，又慢不能問的一堆 114.24.105.45 05/30 17:50

噓 NEWinx 然後？會畫圖了嗎？ 1.172.81.21 05/30 17:50

噓 mercurycgt68 比人家慢推出性能還沒超過喔不是很 114.136.203.135 05/30 18:17

→ mercurycgt68 秋？ 114.136.203.135 05/30 18:17

推 abbei nobody car 無人車 36.228.12.5 05/30 19:17

推 a731977 MIT我是真的服，META還要自己的LIC 101.10.75.231 05/30 21:31

推 s213092921 http://i.imgur.com/JbgdyHM.jpg 223.138.41.35 05/30 21:37

噓 inunoya 難用 111.249.204.150 05/30 22:16

→ wbw 8964 114.136.131.216 05/30 22:23

推 CoNsTaR 這裡的風向和 reddit 也差太多 111.82.27.182 05/30 22:35

推 CoNsTaR 現在的風向不是 deepseek 才是真正 111.82.27.182 05/30 22:38

→ CoNsTaR 的 open ai，open ai 應該叫 closed 111.82.27.182 05/30 22:38

→ CoNsTaR ai 嗎 111.82.27.182 05/30 22:38

推 eruption0214 開源 42.75.156.40 05/30 22:44

推 godog 70 vs 68 中美AI的差距又縮小了難 118.231.161.73 05/30 22:55

→ godog 怪黃說中國AI沒有輸美國一直緊跟 118.231.161.73 05/30 22:55

→ godog 在後 118.231.161.73 05/30 22:55

推 havochuman 風向啥的能吃嗎就問你平常用哪個 122.11.212.141 05/30 23:10

→ havochuman 該不會是deepseek八嘻嘻 122.11.212.141 05/30 23:10

推 jhjhs33504 現在開源的都是試玩版不知哪時才能 1.162.84.180 05/30 23:56

→ jhjhs33504 內建在本機系統裡?不然搞得好像韭菜 1.162.84.180 05/30 23:57

噓 fantasyhorse 使用率這麼低還好意思吹 36.225.50.168 05/31 00:20

→ iPadProPlus 過氣 111.71.213.108 05/31 01:34

噓 ohohohya 蒸餾人家永遠無法超車 111.80.36.174 05/31 03:43

→ ohohohya 沒差繼續燒錢就跟電車暴雷一樣 111.80.36.174 05/31 03:44

噓 oboesoul 台灣只有藍白粉在推.. 101.10.156.113 05/31 09:17

噓 gary861226 樓上言論大可不必 101.10.217.214 05/31 09:24

推 squelch 嘻嘻我用deepseek 42.70.129.182 05/31 15:56

→ teddy 開源來說還是很屌了有錢的公司就自 27.53.160.57 05/31 17:45

→ teddy 己組設備架在內部了 27.53.160.57 05/31 17:45

推 zxp9505007 用OpenAI 又看不到Weight跟架構這 174.194.198.112 06/01 02:55

→ zxp9505007 點DS大勝 174.194.198.112 06/01 02:55

噓 CCNCCN 繼續吹 203.74.156.121 06/02 00:12

推 jobintan 不得不說，我原本用ChatGPT，後來 43.252.167.94 06/03 09:25

→ jobintan 都大多使用DeepSeek。 43.252.167.94 06/03 09:25

推 dpew 一開始全世界都很驚奇，時間長了， 223.136.144.110 06/03 13:34

→ dpew 就知爛的可以 223.136.144.110 06/03 13:34