原文標題:
Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2
發布時間:2025/01/24
記者署名:機器之心
原文內容:
「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」
DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。
最先陷入恐慌的,似乎是同樣推崇開源的 Meta。
最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到,國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌,因為在前者的低成本高歌猛進下,後者無法解釋自己的超高預算的合理性。
原文如下:
這一切始於 DeepSeek-V3,它在基準測試中就已經讓 Llama 4 落後。更糟的是那個「擁有 550 萬訓練預算的不知名中國公司」。
工程師們正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。這一點都不誇張。
管理階層擔心如何證明龐大的生成式 AI 組織的成本是合理的。當生成式 AI 組織中的每個「領導」的薪資都比訓練整個 DeepSeek-V3 的成本還要高,而我們有好幾十個這樣的「領導」時,他們要如何面對高層?
DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息,但這些很快就會公開。
這本來應該是一個以工程為重點的小型組織,但是因為很多人想要參與進來分一杯羹,人為地膨脹了組織的招聘規模,結果每個人都成了輸家。
https://i.imgur.com/hKZ6h5W.png
貼文中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發佈於 2024 年 12 月 26 日和 2025 年 1 月 20 日。
其中,DeepSeek-V3 在發佈時提到,該模型在多項評測成績超越了Qwen2.5-72B 和Llama-3.1-405B 等其他開源模型,並在性能和世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。
不過,更引人注目的是,這個參數量高達 671B 的大型語言模型訓練成本僅 558 萬美元。具體來說,它的預訓練過程竟然只用了 266.4 萬 H800 GPU Hours,再加上上下文擴展與後訓練的訓練,總共也只有 278.8 H800 GPU Hours。相比之下,Meta 的 Llama 3 系列模型的計算預算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓練 DeepSeek-V3 至少 15 次。
https://i.imgur.com/mJn5POl.png
而最近發布的 DeepSeek-R1 效能更猛 —— 在數學、程式碼、自然語言推理等任務上,它的效能比肩 OpenAI o1 正式版。而且模型在發布的同時,權重同步開源。很多人驚呼,原來 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 則認為, DeepSeek 現在已經處於領先位置,美國公司可能需要迎頭趕上了。
https://i.imgur.com/NLhp4Nj.png
看到這裡,我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事,他們「開源之光」的地位岌岌可危。
有人指出,其實該慌的不只 Meta,OpenAI、Google、Anthropic 又何嘗沒有受到挑戰。 「這是一件好事,我們可以即時看到公開競爭對創新的影響。」
https://i.imgur.com/gQ5fHDH.png
還有人擔心起了英偉達的股價,表示「如果 DeeSeek 的創新是真的,那麼 AI 公司是否真的需要那麼多顯示卡?」
https://i.imgur.com/HIFcTx6.png
不過,也有人質疑,DeepSeek 究竟是靠創新還是靠蒸餾 OpenAI 的模型取勝?有人回覆說,這可以從他們的發布的技術報告中找到答案。
https://i.imgur.com/HIFcTx6.png
目前,我們還無法確定貼文的真實性。
不知道 Meta 後續會如何回應,即將到來的 Llama 4 又會達到怎樣的表現。
心得/評論:
Meta工程師在TeamBlind(一個匿名的職涯討論區,需要經過公司Email驗證)爆料中國的DeepSeek對內部影響很大
DeepSeek R1訓練成本550萬美元 可能比一個Meta大頭的年薪還便宜
DeepSeek 這件事情也不光是中國自己在吹噓
看了一下 Twitter/Reddit 美國AI工業界、學術界反響非常大
DeekSeek 的母公司幻方量化產出 DeepSeek 的故事也在 Twitter 廣受討論
https://i.imgur.com/NLhp4Nj.png
DeepSeek R1 開源+論文公開應該會推進一波AI界的發展
DeepSeek 後續發展值得關注一下
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1737717185.A.FD4.html
DeepSeek 訓練成本低+跑起來的成本極低(硬體需求)
自己實際使用體感不覺得他贏 OpenAI
不過以成本場景來說真的是巨大的創新
美國知名的 AI 分析機構 Artificial Analysis
對 DeepSeek 的成本分析
https://i.imgur.com/0GRkj6Q.png
DeepSeek R1 程式碼、論文都開源+公開了
https://github.com/deepseek-ai/DeepSeek-R1
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:25:15
網景公司創始人(美國公司;世界第一個廣泛使用的瀏覽器)
Facebbok、eBay、HP 董事會成員
風投
Marc Andreessen
幫你整理了重點
https://i.imgur.com/SmUbN8M.png
Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world.
DeepSeek 翻譯:
https://i.imgur.com/5zX1uf2.png
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:39:47
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 19:45:10
哥
我沒有看到任何所謂Meta工程師沒辦法reproduce的資料來源@@
可以請你提供一下嗎
AI製造供應鏈台灣應該還是掌握得牢牢的
AI模型目前看起來是真的沒料
幾乎都是拿別人的成果fine-tune、扶不上牆
這紅媒吧?
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:32:09
https://i.imgur.com/mJn5POl.png
尷尬
他在說Meta用LLAMA 3的訓練成本可以訓練DeepSeek-V3 15次
much better model
這大概國中英文
要不是你語言能力有缺陷
就是真的很純的中黑
是你的英文能力有缺陷。
我建議你別搞笑了
這真的在扯中黑的腿
連國中英文都不會
還想在這邊大談
還嗆我去讀英文原文
中黑搞不好都不承認你是隊友
如果你是中黑這會顯得除了無腦黑中國沒有什麽思辨能力=.=
那個英文能力在這邊大談
強烈建議看看eriker的推文真的超好笑
可以質疑的
不過哥你的行為真的相當反智
跟中國人民說祖國疫苗No1差不多 只是顏色不一樣而已
都是避著眼睛只相信自己相信的
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 20:49:43
你公司如果在做AI模型研究/工程的
這幾天全公司上下應該都在研究這個
※ 編輯: Lushen (36.229.55.152 臺灣), 01/24/2025 21:53:14
推文 (1185)
推
pmes9866
中又贏
01/24 19:14
→
agassi001
股價該跌了吧
01/24 19:15
推
wts4832
too good to be true
01/24 19:15
→
moom50302
贏了贏了都贏了
01/24 19:15
推
Plumpy
贏麻了
01/24 19:16
噓
s1612316
花大錢還輸別人 是設備的問題還是人的問題
01/24 19:16
推
kenbbc12321
ai本來就可以減少運算,達到一樣的效果
01/24 19:18
推
lpmybig
真實性先打問號
01/24 19:18
→
appledick
美國484真的滿廢的
01/24 19:18
→
appledick
難怪只能靠制裁來贏人了
01/24 19:19
推
lc85301
美國的時代早就過去了
01/24 19:19
推
zhi5566
輸了就在砍人啊
01/24 19:19
推
kuosos520
deepseek有開源,也有offline,鬼故事來了
01/24 19:20
推
aegis43210
因為西台灣為了管制,一堆問題不能回答,自然也不算
01/24 19:20
→
aegis43210
錯誤
01/24 19:20
推
KrisNYC
DS就開源的 輸了就算了 裁部門 丟模型
01/24 19:22
→
furbyyeh
硬體需求果然是吹的
01/24 19:22
→
KrisNYC
拿DS去從頭開始而已
01/24 19:22
推
stlinman
降本增效 遙遙領先 中國人可以贏兩次
01/24 19:22
推
rrazer
中又贏 ,遙遙領先
01/24 19:22
推
momochacha
沒空 阿祖現在忙著舔川普
01/24 19:22
→
KrisNYC
你就當作花錢蓋了個蚊子館又拆掉 GDP增加了 就這樣
01/24 19:22
→
KrisNYC
寫一大篇不知道想幹嘛
01/24 19:22
推
Lowpapa
美國早就輸慘了
01/24 19:23
推
godog
看到某族群崩潰狂酸的樣子 就覺的好笑 哈哈哈
01/24 19:23
推
aegis43210
只要慶豐帝仍在位,美國就不會輸
01/24 19:24
推
iamsosmart
中國贏了,台積電嚇哭了,輝達沒有用了,美國七大
01/24 19:24
→
iamsosmart
科技股都淚奔了
01/24 19:24
推
huabandd
整理重點好嗎
01/24 19:25
推
ImHoluCan
亞洲專門搞詐騙的
01/24 19:26
推
poeoe
中國本來在軟體就算強的 還能加班加到爆
01/24 19:26
推
strlen
不就魔改技術很猛?不然當年GPT3怎麼不是中國開發
01/24 19:27
推
winsonpz
看智障聳動標題就知道是中吹假新聞
01/24 19:27
推
zpeople0116
歐美日常,幹輸人翻桌
01/24 19:28
→
winsonpz
然後又一堆壯世代在那瞎講胡吹
01/24 19:29
推
ImHoluCan
美國人很天真,很容易被詐騙,看看小米保時捷,那
01/24 19:29
→
ImHoluCan
真的是保時捷嗎
01/24 19:29
推
spa41260
算力過剩,丸子
01/24 19:29
噓
pagenotfound
上次在那邊吹中國突破5奈米的公司 已經屍骨無存了
01/24 19:29
推
matlab1106
又要像電車一樣輸了就翻桌嗎?
01/24 19:29
噓
ck326
中吹日常,吹了半天強國還在通縮
01/24 19:30
→
ImHoluCan
對岸要是真的,早就大吹特吹
01/24 19:30
→
asjh612
沒有外媒新聞? 怎麼只有中國跟twitter來源
01/24 19:30
→
mic73528
遙遙領先 雙贏就是中國贏兩次
01/24 19:31
推
Blastodern
彎道超車吹了三十年還在超,這個彎道到底有多長啦
01/24 19:31
→
Blastodern
,笑爛
01/24 19:31
→
idernest
https://i.imgur.com/gH3UxJB.jpeg
01/24 19:32
→
ImHoluCan
小米蘇7=美國老邏輯=保時捷怕拉沒拉,但真的擺上台
01/24 19:32
→
ImHoluCan
面真的是保時捷嗎
01/24 19:32
推
Dix123
已經都開源了 怎麼還有人反智阿...
01/24 19:33
推
jacktypetlan
完蛋 算力過剩 overbooking 台G NV攔腰斬都不夠
01/24 19:33
→
jacktypetlan
NV至少1/4膝蓋斬 歐印放空 台股一萬二見
01/24 19:33
推
kotorichan
美國再挖角或制裁 就好
01/24 19:34
推
bella1815
看到某族群自嗨的樣子就覺得好笑
01/24 19:34
推
INIKS
美國創意,中國實作,中美如果真正合作,早就登陸火
01/24 19:34
→
INIKS
星了,可惜國家這個沒用的概念依然存在,地球村遙遙
01/24 19:34
→
INIKS
無期
01/24 19:34
→
ImHoluCan
當初嘴台積電,也大力挖台積電的大將,對啊晶圓廠
01/24 19:34
→
ImHoluCan
可以生產啊,但真的能ㄧ直突破?
01/24 19:34
推
ck326
開源又怎樣?笑死
01/24 19:35
推
poeoe
開源就是全世界的人都能直接驗證 這也不是中國自己
01/24 19:35
→
poeoe
在吹啦
01/24 19:35
推
z23061542
OK收到 以放空美台股 大力ALL IN鹿谷
01/24 19:35
→
asjh612
開源又怎樣 原po也沒覺得他贏openai啊
01/24 19:35
→
ImHoluCan
詐騙集團,當然不能犯低接錯誤,你能看到的當然要
01/24 19:36
→
ImHoluCan
給你看你想看的
01/24 19:36
推
kotorichan
沒三小路用 中國直接武統是最有用的
01/24 19:36
→
asjh612
自爽又贏 跟 開源 哪門子關係?
01/24 19:37
→
ImHoluCan
笑死中國要是真的能搞出來,當初中芯肯定能搞出來
01/24 19:37
→
asjh612
每個llm都在吹自己很強 實際體驗就是那死樣子
01/24 19:37
→
a12838910
中國軟體很強啊 抖音 小紅書 台灣?
01/24 19:38
推
andy810306
台灣給那狗屎薪資想要找誰寫軟體?笑死
01/24 19:38
→
aloness
這本來就是 在等待程式架構進化,縮減算力
01/24 19:39
推
jasonfun44
老早都去AWSGCP租就好,做LLM跟本不會賺錢
01/24 19:39
→
aloness
舊的程式架構自然需要突破天際的算力
01/24 19:39
推
ImHoluCan
對岸是小米蘇7保時捷,然後吹說你開保時捷嗎?
01/24 19:39
推
ck326
台灣軟體很爛啊,應該說台灣沒有軟體,所以呢?
01/24 19:40
推
Dix123
簡單來說 AI的這個嶄新的領域配上開源 本來就很容易
01/24 19:40
→
Dix123
做出超強的突破了 不一定是中國 美國隨時也會趕上
01/24 19:40
→
jasonfun44
馬斯克也是吹
01/24 19:40
推
poeoe
這其實也是好事 如果能讓需要的算力降低 那能省很多
01/24 19:40
→
poeoe
電
01/24 19:40
→
Dix123
你遙想個人電腦和網路剛開始的時候 駭客橫行的時候
01/24 19:40
推
bj45566
股板無腦中黑:不管啦,中國只會抄襲而已而已啦,一
01/24 19:40
→
bj45566
定是偷美國的!原始碼都公開在網上了?不可能!看得
01/24 19:40
→
bj45566
到的人一定是眼睛孽障太重,我什麼都看不到!(嘶喊)
01/24 19:40
→
aloness
中國軟體工程師戰力本來就不差
01/24 19:40
→
Dix123
當你還在用數據機玩天堂的時候 可能想過幾年後馬上
01/24 19:41
→
ImHoluCan
對岸很多都是抄美國,卡卡西董嗎? 小米蘇7吹成保
01/24 19:41
→
ImHoluCan
時捷
01/24 19:41
→
Dix123
變月租吃到飽?
01/24 19:41
推
ixiuxiudan
別急
01/24 19:41
→
asjh612
怎會熱血親中的人在高潮啊
01/24 19:42
→
ImHoluCan
對岸只會卡卡西,但真的有那個創意與技術? 接下來
01/24 19:42
→
ImHoluCan
真的能持續?
01/24 19:42
推
s90002442
完蛋 今天股價砍爛
01/24 19:42
→
kevinmeng2
拿meta這垃圾比較就好像拿intel跟台積電比
01/24 19:42
→
peter98
META再裁個15%工程師吧
01/24 19:44
推
jinx5566
突破AI臨界點了?
01/24 19:44
噓
raymonde
ai 是不是關門放狗
01/24 19:45
→
aaa95308
樓上把軟體跟半導體製造放在一起比較的...好喔
01/24 19:48
推
bj45566
說 Meta 是廢物的好像完全不知道 Meta 在 AI 開源碼
01/24 19:48
→
bj45566
界是抗霸子 wwww 而且 DS 贏的也不只是 Meta Llama
01/24 19:48
推
t0314796
報告 所以會影響到什麼?想抄答案!
01/24 19:48
推
jiansu
這個成果是中國其他公司都震驚吧 開源很好 科技不
01/24 19:49
→
jiansu
應該分國界 競爭也不分你我 生死看淡 不服就幹
01/24 19:49
噓
ken123321987
美國狗下棋輸人就翻桌 等中國強起來一定算帳
01/24 19:49
推
BIGETC
一個專案五千萬能弄 五百萬常常也可以 科科
01/24 19:50
→
asjh612
不過仔細想想 這篇股點是什麼? meta利空?
01/24 19:50
→
BIGETC
不過五千萬弄大家都會很舒服 何必真的編五百
01/24 19:50
推
djbell
繼續裁員
01/24 19:51
推
boy1031
鋼鐵家電手機電車都能卷翻,美歐日,憑什麼AI不能
01/24 19:51
→
boy1031
卷,至少也要分走3成市場
01/24 19:51
推
amethystboy
便宜治百病
01/24 19:54
→
asjh612
還是這篇是台積nv利空 大家不需要那麼多運算資源?
01/24 19:55
推
super0949
Meta股價毫無反應
01/24 19:55
→
keyneslan
這樣如何對股東與投資機構交代
01/24 19:55
→
CYL009
用低階顯卡AI性能就能和用高階的比了 反正美國錢很
01/24 19:55
→
CYL009
多 嘻嘻
01/24 19:55
→
pieceioriX
為何高低成本的方案不能共存?
01/24 19:56
推
oldEn15
產能過剩要來了 啾咪
01/24 19:56
推
s1612316
五千億鎂 有多少會進口袋
01/24 19:56
推
bj45566
DeepSeek 最大的影響就是證明中國能用不到 1/10 的
01/24 19:56
→
bj45566
預算和更少、更便宜低階的 AI 晶片達成甚至超越美
01/24 19:56
→
bj45566
國頂尖 AI 公司(s)狂開資源做出的大語言模型效能
01/24 19:56
推
ggbi4zzz
中國黑開始胡言亂語
01/24 19:56
→
CYL009
現在深度探索全部開源給你 誰還要用高價裝備操作AI
01/24 19:57
→
CYL009
嘻嘻
01/24 19:57
→
CYL009
最近這幾天美國科技業真的瘋了 一直再找出為什麼可
01/24 19:58
→
CYL009
以這麼便宜成本弄出來ww
01/24 19:58
推
eriker
我怎麼看起來再說deepseek造假
01/24 19:58
推
uller
中國黑科技 猛了
01/24 19:58
→
eriker
meta試著用h100訓練了15個開源的deepseek結果數據都
01/24 19:59
→
eriker
不如paper宣稱的
01/24 19:59
→
shorty5566
既然都開源了接下來就看能不能照刻出來啊 現在吹這
01/24 20:01
→
shorty5566
麼早都不怕跟之前超導體一樣翻車嗎?
01/24 20:01
→
eriker
這根本就是沒辦法reproduce吧 meta工程師拿你程式碼
01/24 20:01
→
eriker
訓練這麼多次都拿不到你的結果
01/24 20:01
噓
qazwsx0128
笑死,就算成本降低需求只會更多,直到人手一個客
01/24 20:01
→
qazwsx0128
製ai
01/24 20:01
推
dongdong0405
哈哈哈中國進來卷
01/24 20:02
→
eriker
那正常人用更爛的gpu或是deepseek宣稱的h800不是也
01/24 20:03
→
eriker
不辦法訓練出來嗎
01/24 20:03
推
bj45566
拿 AI 比高階晶圓製造的真的笑死!中國在 AI 領域一
01/24 20:03
→
bj45566
直都能和美國爭霸,中國在 AI 頂尖會議的論文發表和
01/24 20:03
推
ck326
看起來是 nvda ,tsm 股價準備崩潰,什麼你說市場沒
01/24 20:03
→
ck326
反應?怎麼會?
01/24 20:03
→
bj45566
美國一直都是互有領先(之前中國 AI 強在 CV, PR,
01/24 20:03
→
bj45566
美國強在 LLM, NLP -- 但現在看起來美國的強項不太
01/24 20:03
→
bj45566
妙)
01/24 20:03
→
eriker
中國不意外 只能騙騙外行人
01/24 20:03
推
kingofsdtw
果然演算法是最重要的
01/24 20:04
推
shorty5566
而且看不懂為啥對nv是利空 如果是真的那那些csp用
01/24 20:04
→
shorty5566
現在已有的算力不是更猛 需求只會更多吧 發展越快
01/24 20:04
→
shorty5566
越好
01/24 20:04
→
eriker
之前就懶得認真看deepseek 結果一看根本在騙白癡
01/24 20:05
→
appledick
這讓我想到智慧型手機android平台 一開始的硬體不
01/24 20:06
→
appledick
夠強 真的是要靠各家用軟體調效來拼順暢度
01/24 20:06
噓
squeakywheel
就是美國抄襲中國啦 某族群最愛嘴的
01/24 20:06
→
appledick
後來硬體強到靠北 軟體就不用調效了 硬體隨便淦都爆
01/24 20:06
→
appledick
淦順
01/24 20:06
推
bj45566
無腦中黑已經進入催眠自己的最高境界了 wwww wwww
01/24 20:06
推
eriker
中國人應該沒想到這次翻船 meta真的拿他的h100檢查d
01/24 20:08
→
eriker
eepseek造假
01/24 20:08
推
ilGroundhog
搜尋一了一下DS在寫作編碼不如GPT但是推理媲美
01/24 20:08
→
asjh612
超越美國製造的llm言之過早吧 每個新的出來都說贏
01/24 20:09
推
bj45566
最近 AI 界最大的醜聞反而是 OpenAI o3 涉嫌在數學
01/24 20:09
→
bj45566
能力測驗上作弊喔,嘻嘻
01/24 20:09
→
ilGroundhog
重點是訓練便宜如果大規模訓練確實可能會顛覆AI市場
01/24 20:09
→
eriker
通常中國人ai論文喜歡造假說超越sota 但畢竟沒人會
01/24 20:10
→
eriker
這樣會浪費一堆算力證明造假
01/24 20:10
→
ilGroundhog
如果可以便宜泛用的話對NV就不是好消息
01/24 20:10
→
asjh612
然後講中國ai paper 之前就聽過中國的有些是吹的
01/24 20:10
推
joygo
正在用 只能說 好用
01/24 20:11
推
koll
那麼厲害何必害怕晶片制裁狂拉貨?用爛晶片就好
01/24 20:11
→
asjh612
講別人無腦黑中 自己才無腦親中 笑死
01/24 20:11
推
mcgrady12336
未來AI就中美有量能切入啊
01/24 20:11
→
eriker
但這次被meta抓到deepseek造假 好慘
01/24 20:12
→
joygo
最近剛好在玩google 的和這隻 互相
01/24 20:12
推
andy810306
某樓是不是在酸所有IC設計啊,應該用7奈米就好啊,
01/24 20:12
→
andy810306
一直想推先進製程幹嘛XDDD
01/24 20:12
→
JoeyChen
歸結是成本的問題對吧?
01/24 20:13
→
andy810306
是不是廢到只能靠製程來掩蓋廢物設計能力啊
01/24 20:13
→
eriker
不過我猜之後這種文會繼續洗 反正普通人也不懂ai
01/24 20:13
→
b9513227
你們慢慢吵 哥買tsm nv等看戲
01/24 20:13
推
bj45566
科技界名人包括 UC Berkeley 的 AI 教授都幫 DeepSe
01/24 20:13
→
bj45566
ek 背書說它是 AI 的 "breakthrough" 了,股板鍵盤
01/24 20:13
→
bj45566
俠覺得自己比那些專家還懂 wwww wwww
01/24 20:13
推
s213092921
Deepseek用閹割版H800就能做到,
01/24 20:13
推
shiowshay
真的超強,只是不知道為什麼他無法回答我1989年6月4
01/24 20:14
→
shiowshay
日有什麼歷史事件
01/24 20:14
→
asjh612
nlp更好吹sota 反正自製dataset 別人亂做 自己認真
01/24 20:14
推
asdf70114
終於要遙遙領先了
01/24 20:14
→
appledick
中黑病發作
01/24 20:14
推
SunRoy
英偉達的股價下跌 我就信
01/24 20:14
推
joygo
谷歌的很爛 問股票問題不敢回答 chatgpt比較大膽
01/24 20:14
→
appledick
哥布林不要只會網上酸 拿出東西比較有意義
01/24 20:15
→
eriker
怎麼不敢回答meta訓練15次 開源的deepseek結果數據
01/24 20:15
→
eriker
不如paper宣稱的?
01/24 20:15
推
sid3
有競爭是好事 今年韓媒也有新聞
01/24 20:15
→
asjh612
教授也會被騙啊 笑死 以為教授多懂 早就沒在做實驗
01/24 20:16
→
b9513227
我快笑死 問中國最新jdk版本是啥 跟我說17
01/24 20:16
→
eriker
這不是造假不然是什麼
01/24 20:16
→
asjh612
是不是沒讀過研究所阿 還吹教授
01/24 20:17
推
Gipmydanger
中國贏麻了,只好加大禁令了
01/24 20:17
推
s213092921
http://i.imgur.com/CYexcbJ.jpg
01/24 20:17
推
ilGroundhog
對台積應該沒很大的影響就算少了輝達的訂單還有其他
01/24 20:18
推
bj45566
是啦,中國發表在 AI 論文都是吹的、假的!要隨論
01/24 20:18
→
bj45566
文附上的原始碼也都是假的!那些全世界 AI 專家組
01/24 20:18
→
bj45566
成的審稿 TPC 都是一群白癡廢物,怎麼可能比股板鍵
01/24 20:18
→
bj45566
盤俠更懂 AI 是吧? wwww
01/24 20:18
→
eriker
還是meta工程師都廢物 有一堆h100 還訓練不好deepse
01/24 20:18
→
eriker
ek
01/24 20:18
推
andy810306
某樓自己能力差讀水貨研究所找廢物教授,以為美國
01/24 20:19
→
andy810306
教授跟你教授一樣廢,●●比雞腿,真的笑死
01/24 20:19
推
tomatobus
教授審論文不會去嘗試reproduce吧,除非他叫底下的
01/24 20:20
→
tomatobus
博士生去試
01/24 20:20
推
sa87a16
12億人口免費的運算怎麼輸
01/24 20:20
推
ilGroundhog
DS的初始模型是META的模型只是變得更有效率
01/24 20:20
推
bj45566
反正股板的無腦中黑覺得自己比所有業界、學界的知名
01/24 20:21
→
bj45566
專家都還要懂 AI wwww wwww
01/24 20:21
推
eriker
更好笑的是pytorch就meta的 開源還要比三小
01/24 20:21
→
tomatobus
如果meta工程師無法reproduce,那可能真的有什麼貓
01/24 20:21
→
tomatobus
膩。企業一定是最緊張的
01/24 20:21
→
asjh612
笑死 開始嘴別人教授喔 實際上就是這樣啦 國外也是
01/24 20:21
→
asjh612
AI paper一堆 真的沒人有空一篇一篇跟你對
01/24 20:22
推
s213092921
https://news.cnyes.com/news/id/5816770 人家早就
01/24 20:23
→
s213092921
預言了
01/24 20:23
推
bj45566
頂尖會議那些學界業界最知名的專家的審稿委員當然會
01/24 20:24
→
bj45566
試跑隨論文附上的原始碼啊 -- 萬一原始碼有錯只有你
01/24 20:24
→
bj45566
抓不出來,你直接名聲掃地好嗎
01/24 20:24
推
ilGroundhog
如果成功還是需要訓練模型 只是算力降低很多
01/24 20:24
→
s213092921
2千多塊閹割版的H800只要訓練兩個月就超越Meta chat
01/24 20:24
→
s213092921
GPT,美國可憐啊
01/24 20:24
推
eriker
中國在paper也喜歡造假硬體 明明用h100還說自己用h8
01/24 20:25
→
eriker
00或是3080
01/24 20:25
推
bj45566
美國一流大學教授就算是五六十歲都還在自己做研究、
01/24 20:26
→
bj45566
寫程式,井底之蛙覺得自己比 UC Berkeley 教授還厲
01/24 20:26
→
bj45566
害,哈哈哈哈
01/24 20:26
推
lepidoptera
便宜很好啊 大家股價修正一下 重新開始
01/24 20:27
推
ntr203
nv有什麼好怕的,越強的晶片不就代表可能做出越強
01/24 20:27
→
ntr203
的ai
01/24 20:27
→
appledick
反觀台灣在AI運算這一塊484完全沒了
01/24 20:28
→
appledick
NV沒啥好怕啊 軟體寫的好跟硬體強又不抵觸
01/24 20:28
→
shorty5566
真的 看不太懂對nv利空在哪 用現在最強的nv去算不
01/24 20:29
→
shorty5566
是更好更令人興奮嗎 而且入門門檻降低對整個ai發展
01/24 20:29
→
shorty5566
都是好事 集中在幾個大型csp才不好
01/24 20:29
推
s213092921
https://reurl.cc/G5O0Nd 內文提到Deepseek使用閹割
01/24 20:29
→
s213092921
版的H800顯卡,中黑趕快面對現實吧
01/24 20:29
→
s213092921
http://i.imgur.com/u8wpYYZ.jpg
01/24 20:30
推
lon0623
台灣人力有限,與其發展AI運算,倒不如找應用端
01/24 20:30
推
bj45566
無腦中黑已經無所不用其極在催眠自己一切都是假的 w
01/24 20:30
→
bj45566
www pathetic SORE losers !!!
01/24 20:30
→
appledick
中國一堆都是去拿Mac mini來跑meta的模型 便宜又可
01/24 20:31
→
appledick
以玩
01/24 20:31
推
h0103661
這完全開源,是假的早就被抓了吧
01/24 20:31
→
s213092921
中國用2048張閹割版H800顯卡訓練兩個月就能超車Meta
01/24 20:31
→
s213092921
及GPT,誰要花大錢買一堆NV最新顯卡?
01/24 20:31
→
lon0623
不覺得台灣的做法有什麼錯誤,又不是有上億人口
01/24 20:31
→
h0103661
還是要先跟研究生解釋什麼叫開源
01/24 20:31
推
eriker
你這篇的Lisan al …他說的就是這個意思
01/24 20:32
→
shorty5566
反過來說你用nv最強的顯卡去跑不是能進步得更快嗎
01/24 20:32
→
shorty5566
?還是你覺得ai的發展已經到盡頭了?
01/24 20:32
→
eriker
他不是說meta訓練了15次deepseek v3結果還是比他們
01/24 20:33
→
eriker
宣稱的差嗎
01/24 20:33
噓
ggian123
Don’t look up 大陸人還生活在水深火熱
01/24 20:33
→
shorty5566
挫勒蛋的絕對是那些開發模型的公司吧
01/24 20:33
推
lon0623
你覺得你想得到的NV想不到嗎?
01/24 20:33
→
lon0623
NV有他厲害的地方,不是只有算力
01/24 20:34
推
chanceiam
連繁體中文都不能回答的模型
01/24 20:34
→
eriker
所以meta驗證了deepseek放出來的程式碼跟模型 發現
01/24 20:34
→
eriker
他們造假
01/24 20:34
→
eriker
…. 建議你看英文
01/24 20:34
→
jjjj222
高鐵, 六代機, 核融合, LLM, 每天吹, 吹完就沒了
01/24 20:35
推
scitamehtam
deepseek我有用,真的蠻好用的
01/24 20:35
→
shorty5566
開發模型的公司即將進入紅海 倒是nv只怕大家都改用
01/24 20:35
→
shorty5566
asic,但是門檻降低以後小型玩家可以進場,那些小
01/24 20:35
→
shorty5566
型玩家也沒能力調教asic 還是要跟nv買通用gpu
01/24 20:35
→
jjjj222
功能也就是騙騙白痴.. 特別是中國白痴
01/24 20:36
推
ilw4e
就跟當初阿法狗一樣啊,deepmind搞出來後面一堆圍
01/24 20:36
→
ilw4e
棋AI小模型一下全出來了。純軟體你只是靠暴力解算力
01/24 20:36
→
ilw4e
堆,人家自然有優化後的更好解法,沒看openai也在回
01/24 20:36
→
ilw4e
頭做優化跟即時的深度運算
01/24 20:36
→
scitamehtam
我兩種都下載,都有用,後來都用deepseek
01/24 20:36
推
eriker
開始抹中黑了?
01/24 20:38
推
kotorichan
他能改用中芯晶片訓練更好
01/24 20:38
推
tsubasawolfy
不然老黃幹嘛賣那台掌中型的AI機
01/24 20:39
→
CLinna
國人捲出來的AI要打倒喝下午茶的工程師了嗎
01/24 20:39
推
poeoe
那個英文很明顯在說15倍啦……
01/24 20:39
推
s0920151048
這不能說中國好話
01/24 20:39
推
s213092921
http://i.imgur.com/4XDm3xB.jpg
01/24 20:39
推
eriker
造假就造假還在那護航
01/24 20:40
推
ilw4e
好像很多人誤以為AI是哪家先搞出AGI就贏了,現實是
01/24 20:40
→
ilw4e
就算搞出以後所有人知道該怎麼做很快就會用自己的
01/24 20:40
→
ilw4e
方法一樣能跟上,效率更好成本更低
01/24 20:40
→
tsubasawolfy
另外推特翻譯那個GOOGLE翻得沒錯
01/24 20:40
→
shorty5566
他訓練還是要基於nv的gpu 用中芯的怎麼訓練
01/24 20:40
推
tomatobus
笑了,原來尼的出處是那,還以為尼有什麼meta內部的
01/24 20:40
→
tomatobus
消息
01/24 20:40
→
tsubasawolfy
我覺得這比較像吹很久的edge AI踏出第一步
01/24 20:41
→
s213092921
http://i.imgur.com/1rLNqD2.jpg
01/24 20:41
→
eriker
那你抹中黑是怎麼回事?
01/24 20:41
→
appledick
好啦 假的啦 造假啦 中黑贏了 可以吧
01/24 20:41
→
eriker
這樣是ok的 我都在講deepseek
01/24 20:42
推
bj45566
無腦中黑在眾人面前證實了自己連簡單的英文都看不
01/24 20:42
→
bj45566
懂胡扯亂翻譯,嘻嘻 wwww wwww
01/24 20:42
推
poeoe
Meta訓練的預算拿來訓練Deepseek 都至少能訓練15次
01/24 20:42
→
poeoe
了
01/24 20:42
→
tonyshan
簡體的可以SKIP了
01/24 20:42
推
good5755
關鍵字:開源程式碼
01/24 20:42
→
appledick
meta 484太多冗員了啊
01/24 20:43
推
Fegnzi
那些反智的人看不懂開源是什麼沒辦法,逢中就反真的
01/24 20:43
→
Fegnzi
沒救
01/24 20:43
→
eriker
所以質疑deepseek造假就是中黑?
01/24 20:43
噓
distantblc
急了
01/24 20:44
→
eriker
只會做人身攻擊
01/24 20:44
推
scitamehtam
質疑? 不是不行吧,要合邏輯…
01/24 20:44
→
eriker
你在繼續
01/24 20:44
→
scitamehtam
不然不就變成抹屎?
01/24 20:45
推
littenVenus
這次中國真的會贏2次喔
01/24 20:45
→
appledick
deepseek如果不是中國研究我覺得你應該就不會質疑了
01/24 20:45
→
VicLien
中國的天賦點在紅海化 厲害了
01/24 20:45
推
bj45566
胡扯亂翻譯人家公開的英文說明(而且是用很簡單的英
01/24 20:46
→
bj45566
文)說是無腦都還太客氣了好嗎? wwww wwww
01/24 20:46
→
appledick
中國某些地方真的就是強啊 當然某些地方是不敢恭維
01/24 20:46
→
scitamehtam
先玩過再說..,我兩套都玩過,deepseek真的不錯
01/24 20:46
→
eriker
如果deepseek不是中國的還會這樣罵人嗎?
01/24 20:46
→
scitamehtam
小心釣魚,看他自己表演就好,建議啦
01/24 20:47
→
scitamehtam
沒邏輯的講話最大聲
01/24 20:47
→
eriker
我沒差 反正我不會罵人 我只評論deepseek
01/24 20:48
→
scitamehtam
最近這版衛兵執勤很認真,桶了幾波了,自己小心
01/24 20:48
推
epephanylo
(看戲
01/24 20:48
→
eriker
反倒是某些人小心
01/24 20:48
推
bj45566
評論?胡亂翻譯人家的英文也敢叫做評論?笑死人有
01/24 20:49
→
bj45566
夠好笑 wwwww
01/24 20:49
噓
Kazetachinu
一堆ai大老都中國人 哪天超車都不意外 軟體這種東西
01/24 20:50
→
Kazetachinu
限制沒有硬體這麼多
01/24 20:50
→
asjh612
不過這篇推文這麼火熱 沒半個人貼實例對話XDD
01/24 20:50
→
brella
垃圾新聞
01/24 20:50
→
asjh612
之前gpt在紅的時候 還有gpt幫忙回應的截圖
01/24 20:50
→
asjh612
覺得好的 可不可以務實點 去玩幾個例子貼來看看
01/24 20:51
推
yueayase
大驚小怪,這種前沿的技術,本來就是湖鄉合作,及互
01/24 20:51
→
yueayase
相競爭的
01/24 20:51
→
asjh612
讓我見識見識哪些是你們覺得好 哪些是回應差的
01/24 20:51
推
scitamehtam
https://i.imgur.com/22NxkZC.png
01/24 20:51
推
duriamon
deepseek有手機app啊!自己下載來用用看不就知道了
01/24 20:52
→
duriamon
?用email就可以註冊了。
01/24 20:52
→
yueayase
湖鄉=>互相
01/24 20:52
→
scitamehtam
剛好今天才在用..
01/24 20:52
→
scitamehtam
反倒是批評的?….
01/24 20:52
→
holebro
中國軟體強度上下限差很大 遇過一堆中國客戶連用AI
01/24 20:53
→
holebro
幫忙寫sql寫shell script寫yaml都不會= =
01/24 20:53
→
scitamehtam
我兩套都常用啦,我自己112csie,也有研究ai主題
01/24 20:53
推
kakiandkaka
笑翻,被反向
01/24 20:53
→
duriamon
樓上可以要他用正體中文回答。
01/24 20:53
推
s213092921
http://i.imgur.com/wsl43l7.jpg
01/24 20:53
→
s213092921
http://i.imgur.com/DUAvbcI.jpg
01/24 20:53
→
scitamehtam
倒是爬蟲後,發現一堆嘴的頭頭是道,結果背景令人
01/24 20:53
→
scitamehtam
驚訝XDDD
01/24 20:53
推
ezreal1315
這就是第一個開頭的和跟班的差距啊 第一個一定要砸
01/24 20:54
→
ezreal1315
大錢開發 後面的當然可以降低成本
01/24 20:54
→
asjh612
就是不想註冊阿... 試想會黑的怎會想用
01/24 20:54
→
scitamehtam
沒用過說的好像很熟一樣XDD 實事求是XDD
01/24 20:55
→
ezreal1315
哪個行業不是這樣 開拓者都是要付出最多的
01/24 20:55
推
s213092921
問題是開拓者能否一直保持領先優勢,看看Nokia跟Mot
01/24 20:56
→
scitamehtam
所以我說,爬蟲後的心得,就是推文自己小心,最近審
01/24 20:56
→
scitamehtam
查異己言論很勤勞的
01/24 20:56
→
s213092921
o蘿拉的下場
01/24 20:56
→
asjh612
http://i.imgur.com/LdGLuCI.jpg 看起來也有回答到?
01/24 20:56
推
NCUking
DeepSeek是猛在CP值超級高
01/24 20:56
推
TIPPK
台灣軟體公司好少
01/24 20:56
推
bj45566
連註冊都沒有就拼命在黑? wwww 人家台大資工親自
01/24 20:57
→
bj45566
試用還截圖給你耶
01/24 20:57
→
NCUking
OpenAI 目前還是領頭羊沒問題
01/24 20:57
噓
zebra101
笑死,人家明明在說META用了15倍的預算,更好的GPU
01/24 20:57
推
guanting886
我覺得一般用戶蠻鼓勵開發團隊都跳進甕被練蠱
01/24 20:57
→
zebra101
,卻訓練出了比DS更差的模型,英文到底怎麼讀的,co
01/24 20:57
→
zebra101
uld have看不懂嗎?
01/24 20:57
→
NCUking
台灣搞LLM只能玩微調套皮
01/24 20:57
推
ezreal1315
所以說 買大盤真安心啊 20年前市值前10公司跟現在
01/24 20:57
→
ezreal1315
比已經大洗盤
01/24 20:57
→
deangogi
所以上面eriker說的meta復現準確度 有原文嗎?
01/24 20:58
推
scitamehtam
我平常兩個都在玩啊,我沒說chatgpt不好吧?
01/24 20:58
推
duriamon
AI領域大陸那邊跟美國的差距本來就不大,有在關心AI
01/24 20:58
→
duriamon
相關研究的大概都知道在說什麼,尤其中文大語言模型
01/24 20:58
→
duriamon
就唯一只有大陸那邊的能打,反觀台灣研發的真的很爛
01/24 20:58
→
duriamon
,呵呵!
01/24 20:58
推
eriker
沒有 嘻嘻
01/24 20:58
推
symeng
暫時觀望
01/24 20:59
→
asjh612
你問他llm吹很厲害的 有多少在搞啊 誰有空每個都試
01/24 20:59
推
ezreal1315
我覺得不用太緊張啦 人家用H800真的能超越openai
01/24 20:59
→
deangogi
你說的如果是原po貼的那段翻譯 應該是你翻譯的問題
01/24 20:59
→
ezreal1315
我相信股價早就被灌下來灌爛了 那些大戶一定第一
01/24 20:59
→
ezreal1315
個跑的
01/24 20:59
噓
zebra101
那個eriker連最基本的英文都讀不懂
01/24 20:59
推
aac219oo
我看有很多人都不知道自己用的網站是用vue3寫的
01/24 20:59
推
w300204
costdown誰的比得過華人
01/24 21:00
推
NCUking
中國軟體實力本來就是天下第二了
01/24 21:00
推
abc21086999
https://i.imgur.com/fo3jbRR.png
01/24 21:00
→
abc21086999
中國特色社會主義式的AI
01/24 21:00
→
ezreal1315
或者是就算如此 巨頭也不會降低支出 怕被同行超越
01/24 21:01
推
Samurai
先不說是不是真的,但逢中必反那個鳥樣,酸別人砸
01/24 21:01
→
Samurai
錢研發有夠莫名其妙
01/24 21:01
→
asjh612
copilot claude gemini gpt llmam 每個新出的都sota
01/24 21:01
推
duriamon
還有人以為是costdown啊?不虧是台灣代工老舊代工思
01/24 21:01
→
duriamon
維,那些發展AI的人才經費花費成本真算下來哪裡cost
01/24 21:01
→
duriamon
down了?
01/24 21:01
→
abc21086999
Gemini thinking 答的就沒問題
01/24 21:02
→
abc21086999
https://i.imgur.com/bQT9dQz.png
01/24 21:02
噓
gstym
中國晶片都可以去買別人的晶片來磨改名字了==
01/24 21:02
推
scitamehtam
說真的chatgpt也能回答這題XDD
01/24 21:02
→
asjh612
搞不懂別人的問題點 還在以為我在黑中國
01/24 21:03
→
duriamon
台灣的老問題上次已經講過了,目前全世界先進的未來
01/24 21:03
→
duriamon
科技領域除了「我們有台積電」之外每一個能打的。
01/24 21:03
→
scitamehtam
但好笑的是,拿這題當評斷AI的標準XDD
01/24 21:03
→
asjh612
問題是 現在每個llm都吹自己最強 當我是llm測試員哦
01/24 21:03
→
scitamehtam
很顯然不是理工人吧XD
01/24 21:03
→
Mytsb2421
美國變成copy cat
01/24 21:04
推
iaminnocent
deepseek不採用預標數據集(也就是先由人類標記數
01/24 21:04
→
iaminnocent
據再給模型訓練)而是直接採用強化學習,自己訓練
01/24 21:04
→
iaminnocent
自己,並且透過他們的局部Token啟動機制,可以減少
01/24 21:04
→
iaminnocent
使用量,這也是為什麼Deepseek能夠大幅降低訓練成
01/24 21:04
→
iaminnocent
本的原因,不確定OpenAi 或是其他AI模型,為什麼沒
01/24 21:04
→
iaminnocent
有進行強化學習
01/24 21:04
→
scitamehtam
所以才說,爬蟲後,再看一次推文會很有趣啊XD 另,
01/24 21:04
→
scitamehtam
你知道ptt主機放哪?XD
01/24 21:04
推
Samurai
意識形態死腦筋沒救,拿六四事件當評斷AI標準XD
01/24 21:04
推
bella1815
https://i.imgur.com/0e69P5N.jpeg
01/24 21:05
推
s213092921
因為美國只相信大力出奇蹟那套,砸錢砸算力
01/24 21:05
推
Lenney33
成本更低 美國科技巨頭情何以堪
01/24 21:05
→
iaminnocent
但是這確實是對AI界投下震撼彈吧,不過OpenAI改用
01/24 21:05
→
iaminnocent
自主強化學習,不知道是否可以
01/24 21:05
噓
abc21086999
理工人又在打手槍自慰啊
01/24 21:06
→
abc21086999
會審查訊息的AI就算在某方面超越其他人也是不可能
01/24 21:06
→
abc21086999
普吉的
01/24 21:06
→
abc21086999
*普及
01/24 21:06
推
tw77769
阿姨的機會來了
01/24 21:06
→
iaminnocent
DEEPSEEK 的數據集也許確實有部份來自ChatGPT,但
01/24 21:07
→
iaminnocent
這並不影響他確實是一個蠻厲害的模型
01/24 21:07
推
bj45566
又有人硬要扯到晶片了。公開的論文告訴你實驗環境、
01/24 21:07
→
bj45566
算法流程、效能評比;原始碼放在大家都可以下載的 G
01/24 21:07
→
bj45566
itHub 上,這要怎麼作弊???
01/24 21:07
推
scitamehtam
就事論事,如果你說會不會普及,那就另外一題了,
01/24 21:07
→
scitamehtam
請另闢蹊徑吧
01/24 21:07
推
a558815
Deepseek 是真的有些東西啊
01/24 21:07
推
tsubasawolfy
OPENAI的O3就是RL壓 聖誕節前的13天倒數也有RL出現
01/24 21:08
→
tsubasawolfy
O3就是O1 RL來的 省去訓練成本
01/24 21:08
推
ggbi4zzz
美國人都害怕被中國ai超越,還有中國黑認為是在吹
01/24 21:09
→
ggbi4zzz
牛逼而已
01/24 21:09
推
minazukimaya
還好它開源 同樣的演算法創新讓資源更多的美國科技
01/24 21:09
→
minazukimaya
巨頭來用 以他們握有的訓練資源能產出更驚人的結果
01/24 21:09
推
s213092921
http://i.imgur.com/vaz7qmE.jpg 誰抄誰啊嘻嘻
01/24 21:10
→
eett811025
碼農996用肝跟你拼了
01/24 21:10
推
bread1110
這鯨魚真的邪門 花少少的預算幹大事 meta最好撐住啊
01/24 21:11
推
minazukimaya
但感覺AGI和技術奇點的時間又被提前了.......
01/24 21:11
→
s213092921
中國AI公司因為算力受限,只好動腦另闢蹊徑,走出一
01/24 21:11
→
s213092921
片天,高階晶片也是一樣的道理
01/24 21:11
噓
qazwsx0128
夠便宜我就自己訓練一個
01/24 21:11
→
minazukimaya
這才是最恐怖的吧 感覺2030年前就要奇點了
01/24 21:11
推
iaminnocent
那就對啦O3開始用RL的話,大概又會反超吧
01/24 21:12
→
fywei
真的好恐慌 zzz 嚇死人 只好再睡一下
01/24 21:12
推
nfsong
開源的 只能導入
01/24 21:12
噓
ishdtt598
跟文組講那麼多幹嘛 笑死
01/24 21:12
→
nfsong
論文都出了
01/24 21:12
推
eliteark
繼續吹起來 我要看到血流成河
01/24 21:13
推
LBJshit
傻鳥真的很傻很北七 一直那邊說DS造假 我還以為是真
01/24 21:13
→
LBJshit
的有什麼內幕勒。結果他媽的是英文太爛根本自己完全
01/24 21:13
→
nfsong
跟股票一樣 有錢人不會輸
01/24 21:13
→
LBJshit
搞錯 連下面有中文的正確翻譯也不看
01/24 21:13
→
nfsong
導入以後 3000e 的就更猛
01/24 21:13
推
cay86714
AI究極鬼故事!
01/24 21:14
→
nfsong
550萬就這麼猛 3000e的 6倍猛
01/24 21:14
推
iaminnocent
那個貼文確實是說Meta的訓練費用都可以訓練15次Dee
01/24 21:14
→
iaminnocent
pseek了
01/24 21:14
→
shorty5566
傻鳥真的北七 前幾天還看到黃仁勳去中國就瘋狂崩潰
01/24 21:14
→
shorty5566
的
01/24 21:14
推
duriamon
OpenAI的問題是核心科學家走了
01/24 21:14
→
gn7722
就跟現在的預算一樣
01/24 21:15
→
iaminnocent
O3我記得之前altman有貼出他的比較,好像比O1強不
01/24 21:15
→
iaminnocent
少,但是當然費用很貴,如果OpenAi把這個開源的機
01/24 21:15
→
iaminnocent
制拿來用不知道行不行
01/24 21:15
→
cay86714
如果這是真的那麼那些CSP之後的資本支出根本不用那
01/24 21:16
→
cay86714
麼高嘻嘻
01/24 21:16
推
g27834618
訓練費降低是利多啊 趕緊出殺手級應用才是正軌
01/24 21:16
推
littenVenus
老黃484蛋雕惹QQ
01/24 21:17
推
duriamon
訓練費代表所需的時間成本、算力跟電費等,自己想想
01/24 21:17
→
duriamon
看囉!
01/24 21:17
→
littenVenus
電力需求應該也不用那麼多吧
01/24 21:17
→
cay86714
不過這件事沒多久前國內投資圈就有一些人知道了,
01/24 21:18
→
cay86714
就看市場什麼時候反應了嘻嘻
01/24 21:18
→
iaminnocent
OpenAI比較像是他有很多資訊,當你詢問他時,他會
01/24 21:18
→
iaminnocent
依據他的知識庫中去找尋資料,並且給你。DEEPSEEK
01/24 21:18
→
iaminnocent
則是有很多專門的朋友,會依據問的問題,分配給適
01/24 21:18
→
iaminnocent
合的專門朋友去找資料回答(也就是不會全部Token調
01/24 21:18
→
iaminnocent
動,可以減少Token使用量)
01/24 21:18
推
beesee
訓練方式很華人
01/24 21:19
→
littenVenus
窩是上禮拜看節目聽一個物理學博士在分析
01/24 21:20
推
Samurai
老黃沒差吧,算力永遠不夠,相同算力能做的事情更
01/24 21:20
→
Samurai
多了,加速科技發展,是軟體公司要頭痛了,拼肝拼
01/24 21:20
→
Samurai
軟體效率拼不過華人
01/24 21:20
推
s213092921
國外有大神用兩台M3晶片的蘋果電腦搭載運行Deepseek
01/24 21:20
→
s213092921
邏輯模型XDD
01/24 21:20
推
usereminem
一堆人仇中仇到腦子壞掉了 可悲
01/24 21:20
推
yusanhu
厲害
01/24 21:21
→
littenVenus
DS是分區塊 各領域專門訓練
01/24 21:21
推
duriamon
沒錯,deepseek是MoA架構。
01/24 21:22
推
minazukimaya
演算法創新會反過來創造出新的算力需求啊 因為對智
01/24 21:22
→
minazukimaya
能的追求沒有上限 更高效的演算法=更快到奇點
01/24 21:23
噓
tw19930419
一堆低能中黑 看了就好笑
01/24 21:23
推
ilw4e
哈哈黑黑不知道一堆模型都會說他是chatgpt,因為監
01/24 21:24
→
ilw4e
督學習步驟最多人用的就是拿chatgpt當那個監督模型
01/24 21:24
推
s213092921
https://b23.tv/R7tEm3q
01/24 21:24
噓
cosmite
剛問了美國地47屆總統是誰,連這個都答不出來,資
01/24 21:24
→
cosmite
料庫還停在2023(模型為DeepSeekV3)
01/24 21:24
→
cosmite
https://i.imgur.com/XXmbi1v.jpeg
01/24 21:24
推
bj45566
OpenAI o3 是非開源碼啊,而且最近被揭露它表現最
01/24 21:24
→
bj45566
驚人的 FrontierMath 指標有作弊的嫌疑!相關的英
01/24 21:24
→
bj45566
文報導和討論不少,這裏給一個實例!
01/24 21:24
→
bj45566
https://tinyurl.com/yw55fcwk
01/24 21:24
→
cosmite
ChatGPT-4則沒有問題
01/24 21:25
→
cosmite
https://i.imgur.com/oGA0Blp.jpeg
01/24 21:25
推
fattyeddie
連ai都能卷 了不起我的國
01/24 21:26
→
bj45566
P.S. 那隻看不懂國中等級英文的中黑歡迎繼續跳出來
01/24 21:26
→
bj45566
吶喊丟人現世 wwww wwww
01/24 21:26
→
duriamon
因為deepseek不用運轉那麼多參數來產生回答,而Open
01/24 21:26
→
duriamon
AI的必須要,所以以電力消耗、算力消耗跟微型化來說
01/24 21:26
→
duriamon
都不利,但也不是代表這樣不好。我是覺得OpenAI自從
01/24 21:26
→
duriamon
變成Altman的玩物之後,進步幅度有限,反而吹噓成分
01/24 21:26
→
duriamon
增加了,呵呵!
01/24 21:26
推
minazukimaya
DeepSeek有價值的地方不是它自身模型有多強..
01/24 21:26
→
minazukimaya
而是他提出的創新可以被其他有更大訓練集和更多算力
01/24 21:27
推
KOKEY
差別在喝的茶葉或咖啡比較貴啦
01/24 21:27
→
minazukimaya
的公司複用
01/24 21:27
→
duriamon
強的是訓練的方式,裡面的秘密我相信應該沒有開源,
01/24 21:27
→
duriamon
呵呵!
01/24 21:27
推
bj45566
現在面臨作弊醜聞的反而是美國 & 世界最強的非開源
01/24 21:28
→
bj45566
碼 OpenAI o3
01/24 21:28
推
DCapple
又贏了又贏了,中国贏兩次
01/24 21:28
推
tw19930419
那叫做他沒有使用網路 不是他不會 問這種沒鑑別度的
01/24 21:28
→
tw19930419
蠢問題要證明什麼
01/24 21:28
推
Samurai
不要再搞笑了,他的資料庫到2023年根本就不是什麼
01/24 21:29
→
Samurai
缺陷,只差在有沒有網路搜尋最新資訊而已
01/24 21:29
推
minazukimaya
DeepSeek很公開啊 演算法和工程改進都寫在論文裡
01/24 21:29
推
littenVenus
那個博士認為 因為成本優勢 注定美國以外地區會傾
01/24 21:29
→
littenVenus
向DS 所以DS將是最後贏家
01/24 21:29
→
minazukimaya
真的是還好它夠公開
01/24 21:30
推
raygod
加大制裁
01/24 21:30
→
minazukimaya
不過它也是站在一堆前輩肩上 現在給人站肩膀 這就是
01/24 21:30
推
Samurai
意外的是DS竟然這麼大方公開研究方法
01/24 21:30
→
minazukimaya
科學研究啊
01/24 21:30
推
runacat
論文都出來了
01/24 21:31
推
QuuEgg
哇啊,削價競爭欸
01/24 21:32
推
bj45566
DeepSeek 如果在演算流程上沒有開創性的突破,美國
01/24 21:33
→
bj45566
業界大老絕對不會用 "breakthrough" 來形容啦,這
01/24 21:33
→
bj45566
個字義和 "cost down" 或 "內卷" 相差十萬八千里 -
01/24 21:33
→
bj45566
- 而且 " cost down" 是標準的台式英文
01/24 21:33
推
wchang
好到不可思議的好,就是假的
01/24 21:33
→
wchang
跟運動員吃禁藥一樣,不是apple 對apple
01/24 21:33
推
Mosskappa
Buy the rumor
01/24 21:34
推
tpkgo
讓子彈飛一會兒~~~~
01/24 21:34
推
minazukimaya
令人恐懼的反而是模型的效率一日千里 對齊的研究牛
01/24 21:35
→
minazukimaya
步慢行...
01/24 21:35
→
minazukimaya
根本是直通文明毀滅的最短路線XD
01/24 21:36
→
tonyshan
看起來就改進一個東西 就吹到天上去
01/24 21:36
→
minazukimaya
DeepSeek把人類文明的毀滅倒數時鐘又撥快了一格
01/24 21:36
推
tompi
DS API的費用是 o1 的1/30
01/24 21:37
→
minazukimaya
DeepSeek可不止改進一個東西 論文都有 白話技術文也
01/24 21:37
推
tsubasawolfy
不用擔心OPENAI 那個瘋子一心只想要真的AGI 就跟馬
01/24 21:37
推
bj45566
樓上是在說 OpenAI 的 FrontierMath benchmark 嗎?
01/24 21:38
→
bj45566
好到不可思議結果...
01/24 21:38
推
duriamon
沒辦法,讓AI對齊人類的道德沒辦法賺錢,呵呵!
01/24 21:38
推
mamorui
這個應該不怎樣吧 去年看太多篇宣稱更頂 驗證一下
01/24 21:38
推
tpkgo
中國很會利用別人的研究偷雞 先聽聽就好
01/24 21:38
→
mamorui
就沒戲了 @@
01/24 21:38
→
tsubasawolfy
斯克一心想上火星一樣 賽道不同
01/24 21:38
→
minazukimaya
有 至少在大膽創新+高效工程這兩方面是非常優秀的
01/24 21:38
推
wsung
已經玩了一整天的R1,真的不差
01/24 21:38
→
mamorui
去年一堆 現在不是很愛看中國出的論文 拿到長官面
01/24 21:38
→
mamorui
前介紹都容易被罵
01/24 21:38
推
bj45566
人家原始碼、論文跟效能測試結果都公佈了啊,請問
01/24 21:41
→
bj45566
樓上舉例一下哪個說自己更頂的有公開這些?好酸的
01/24 21:41
→
bj45566
葡萄 wwww
01/24 21:41
推
minazukimaya
中國一堆騙錢公司是事實 但DeepSeek和他們不一樣也
01/24 21:41
→
minazukimaya
是事實 這兩個事實又不衝突...
01/24 21:41
推
mamorui
不是啊 論文就是有新方法 數據更漂亮 但實驗效果
01/24 21:42
→
mamorui
跑了不佳 真的有啊
01/24 21:42
推
NTUCS
藍白糞高潮
01/24 21:43
推
bj45566
樓上中黑請解釋一下人家論文、原始碼都公開的情況下
01/24 21:43
→
bj45566
要怎麼「利用別人的研究偷雞」?只會無腦黑嗎?
01/24 21:43
噓
naushtogo
最近炒作很大,讓我們繼續看下去
01/24 21:43
→
mamorui
我找一下 我有標記過
01/24 21:43
推
s800525
說減少算力能達到一樣效能,那一樣算力不是能達到更
01/24 21:43
→
s800525
高效能?為何要以減少算力為前提?
01/24 21:43
→
NTUCS
論文公布了 但能 repro 嗎
01/24 21:43
→
bj45566
請問有哪個可信消息來源說「實驗結果不佳」?又在
01/24 21:44
→
bj45566
自己腦補嗎?
01/24 21:44
推
tpkgo
原始碼公開又不代表什麼 你是沒看過原始碼公開喔!!
01/24 21:44
→
NTUCS
你不是藍白糞幹嘛入座
01/24 21:44
推
mamorui
啊 像那個LLaMA-omni就是同事報告時直接露餡
01/24 21:45
→
s800525
說能事半功倍,那不能事倍功四倍嗎?
01/24 21:45
→
mamorui
開源就可以去repro
01/24 21:45
推
vtgc161
論文出來了,所以有人可以說明一下,他到底是不是拿
01/24 21:47
→
vtgc161
現有Ai模型為底去訓練的嗎
01/24 21:47
推
mamorui
要跑過才知道
01/24 21:47
推
bj45566
原始碼公開多久了?美國頂級業界學界大老也高度評
01/24 21:48
→
bj45566
價讚賞,台大資工板友也早就註冊測試覺得表現很好了
01/24 21:48
→
bj45566
-- 請問中黑還要怎麼樣才願意承認人家做出一個好東
01/24 21:48
→
bj45566
西???
01/24 21:48
→
mamorui
等哪天這個技術在公司一堆人講才是真的 我現在沒聽
01/24 21:48
→
mamorui
到就是了
01/24 21:48
推
duriamon
簡單來說就是最近有一個新的AI能力測驗,找了好幾位
01/24 21:49
→
duriamon
費爾茲數學獎得主來出超高難度題目,幾乎所有AI模型
01/24 21:49
→
duriamon
都回答得跟屎一樣,只有o3脫穎而出,大家正震驚Open
01/24 21:49
→
duriamon
AI的技術力時,被爆料出來因為這個AI能力測驗OpenAI
01/24 21:49
→
duriamon
有贊助能事先拿到題目作弊,Altaman的作為我是不意
01/24 21:49
→
duriamon
外啦!呵呵!
01/24 21:49
推
minazukimaya
你現在沒聽到要啟MoE項目 只是表示你公司不在最前沿
01/24 21:49
→
cclemon1231
對岸弱點還是0到1,但改造能力真的很強
01/24 21:49
推
bj45566
看來你待的公司比 Meta AI 還強 wwww wwww
01/24 21:49
推
sleepinggod
成本低,跟使用者收費就可以便宜
01/24 21:50
推
mamorui
因為老馬的之前也拿過高分。就看囉
01/24 21:50
噓
yunf
機器之心 是誰?
01/24 21:51
→
minazukimaya
現在最前沿的美國公司一定會啟新項目投入MoE方向了
01/24 21:51
推
good5755
分領域導出答案 假如問題是跨領域不就GG了
01/24 21:51
→
mamorui
沒有啊 大家也是會謹慎看結果 OpenAi在很多篇論文
01/24 21:51
→
mamorui
數據都平均佳 所以謹慎看待每一版表現囉
01/24 21:51
推
davis5566
說個事實 某些人就開始藍白粉壯世代的 這些爛貨
01/24 21:52
→
davis5566
還是早點被時代淘汰吧
01/24 21:52
→
mokipu
拉板凳看戲
01/24 21:52
推
dwood123
這說明小公司也可作出好的模型,那大家就會躍躍欲
01/24 21:52
→
dwood123
試,Al伺服器需求也會增加啊!
01/24 21:52
推
duriamon
其實MoA架構比較符合人類的思考方式,人類大腦功耗
01/24 21:52
→
duriamon
才30W參數量才4GB,演化的威能不是蓋的。
01/24 21:52
推
sleepinggod
台灣不應該發展中文語言模型,教授都嘛拿國家錢產出
01/24 21:53
→
sleepinggod
沒用的東西。直接全民學英文比較有效率
01/24 21:53
推
bj45566
duriamon 板友講的 OpenAI o3 在高難度數學測驗的涉
01/24 21:53
→
bj45566
弊醜聞我在樓上就貼了一個應為報導短網址了,現在 A
01/24 21:53
→
bj45566
I 圈內最被懷疑的反而是這個
01/24 21:53
→
good5755
而且重點是資料庫吧 目前以資料庫取得難易程度
01/24 21:53
→
duriamon
有Altman亂搞,OpenAI遲早會完蛋,我先預言在這邊,
01/24 21:54
→
good5755
對岸的13億免費資料庫真的比歐美簡單多了
01/24 21:54
→
duriamon
呵呵!
01/24 21:54
推
mamorui
我記得OpenAI數學不好吧
01/24 21:54
→
bj45566
*英文報導
01/24 21:54
推
tpkgo
Meta AI不錯 但現在使用者標竿是OpenAI
01/24 21:54
推
akwa
一堆井蛙還是不信 呵呵
01/24 21:54
→
bj45566
難怪你待的公司沒人在討論 DeepSeek,都 2025 年了
01/24 21:55
→
bj45566
還在講 OpenAI 數學不好,嘻嘻 wwww wwww
01/24 21:55
推
mamorui
對 OpenAI是標竿 因為大多比較數據出在別人的論文
01/24 21:55
→
mamorui
裡 GPT都平均拿到最佳 但數學是真的爛
01/24 21:55
→
bj45566
OpenAI 涉嫌作弊的是普通人一輩子都碰不到邊的 Fron
01/24 21:56
→
bj45566
tierMath benchmark !!!
01/24 21:56
→
duriamon
現在由於用於訓練AI模型所使用的開源資料已經幾乎耗
01/24 21:56
→
duriamon
盡,現在流行的是新型AI架構的研發以及超參數的蒸餾
01/24 21:56
→
duriamon
和分析,如何從已經有的超參數產生更好的產品才是顯
01/24 21:56
→
duriamon
學。
01/24 21:56
→
mamorui
我是沒有很常使用數學相關的沒錯。記憶停在數學爛
01/24 21:56
→
mamorui
沒錯
01/24 21:56
推
sweetantt
o3應該不久後就會出來了吧 而且免費用戶也有o3 mini
01/24 21:56
→
sweetantt
到時候就知道openAI有沒有吹牛了
01/24 21:56
→
duriamon
看那個整天吹噓的Sora我是不期待啦!呵呵!
01/24 21:57
→
bj45566
還在繼續幻想說 OpenAI o3 數學爛 wwww 人家輕鬆碾
01/24 21:57
→
bj45566
壓你好嗎!
01/24 21:57
噓
cityhunter04
叫美國時代過去之前,他科技還是屌打世界2-30年…
01/24 21:58
→
duriamon
新的架構我覺得會是比較有趣的發展,傳統的transfor
01/24 21:59
→
duriamon
mer已經差不多了。
01/24 21:59
→
duriamon
說是傳統不過也才2-3年的事,AI發展就是這麼競爭,
01/24 21:59
→
duriamon
呵呵!
01/24 21:59
推
mamorui
等很多paper報告看到比較時DS贏再說吧 最近兩個月
01/24 22:00
→
mamorui
沒時間看paper 小組報告都延期了 趕年末案子要GM
01/24 22:00
推
bj45566
OpenAI o3 的 AIME 2024 benchmark 分數是 96.7% 好
01/24 22:05
→
bj45566
嗎?
01/24 22:05
推
mamorui
o3不是12月才推出嗎 我剛好沒用 哈 以前很爛是真
01/24 22:07
→
mamorui
的
01/24 22:07
推
Tsukasa0320
很好啊 有威脅度才有理由打死
01/24 22:07
→
mamorui
那我就期待一下2025的各大paper囉
01/24 22:07
推
bj45566
OpenAI o3 現在被質疑的 FrontierMath benchmark 是
01/24 22:07
→
bj45566
絕大多數人一輩子都碰不到的高等數學
01/24 22:07
噓
k798976869
meta就是故意開源AI不給微軟賺的 還在演啥
01/24 22:08
推
bj45566
又在講笑話了,嘻嘻。OpenAI 在 AIME benchmark 早
01/24 22:09
→
bj45566
就超過大部分人的數學水準了 wwww
01/24 22:09
推
popo123456
丸子,台積和美股7巨頭都要暴跌
01/24 22:10
→
bj45566
難怪你的公司沒聽過 DerpSeek,嘻嘻 wwww
01/24 22:10
推
mamorui
教科書的數學是可以 邏輯陷阱還是會踩
01/24 22:10
→
mamorui
聖誕節才發布 不要急哇
01/24 22:12
推
DA3921999
只要中國的開發者還開源就不可能贏美國啦,美國穩的
01/24 22:12
→
lon0623
暴跌就想太多了,尤其台積本益比才二十幾
01/24 22:12
推
bj45566
開源的遠不只 Meta 一家,DeepSeek 是用少得嚇人的
01/24 22:12
→
bj45566
成本打平、打敗檯面上所有的開源大語言模型
01/24 22:12
推
shorty5566
NV盤前大跌-0.5% 蒸的丸子
01/24 22:13
→
abc21086999
為什麼有人要為了中國的AI很厲害感到自豪?
01/24 22:13
→
lon0623
你問中國用的晶片是不是台積做的
01/24 22:14
推
mamorui
我也不知道 而且我習慣謹慎多看幾版
01/24 22:14
→
lon0623
而且AI只是台積的一部分而已
01/24 22:14
推
MumiPyonPyon
Deepseek不是open的嗎@@
01/24 22:15
推
bj45566
因為 DS 狠狠打臉股板數不清的無腦中黑啊,嘻嘻 www
01/24 22:16
→
bj45566
w
01/24 22:16
→
bj45566
連 OpenAI 數學早就很強都完全不知道的人說自己「
01/24 22:17
→
bj45566
謹慎」 wwww wwww
01/24 22:17
推
bj45566
看到無腦的____ 被狠狠打臉就覺得爽快是人之常情吧
01/24 22:18
→
bj45566
wwww
01/24 22:18
推
loveyou9527
兄弟 聽我說 這個ds 有料
01/24 22:21
→
yunf
真的沒什麼好爭的 就看你能拿它來做什麼 有真的帶來
01/24 22:21
→
yunf
創造性的價值 那就是對你有利的
01/24 22:21
推
lon0623
料敵從寬也不是壞事阿,多多想台灣有什麼能介入的
01/24 22:22
→
yunf
黑貓白貓會抓老鼠的就是好貓
01/24 22:22
→
yunf
如果他再厲害不能為你所用也是沒用
01/24 22:23
噓
verydolungbe
支那XDXDXD 聽聽就好
01/24 22:23
→
yunf
謝遜拿了屠龍刀雙眼失明 頂多拿來砍樹
01/24 22:24
推
lon0623
中國景氣不好有時對科研反而有好處,逼人去研究
01/24 22:24
推
s800525
有更好的算法能產生更快投入市場,就會有更多廠商願
01/24 22:24
→
s800525
意堆更多硬體來搶佔市場,永遠沒人在嫌硬體效能過剩
01/24 22:24
→
s800525
的
01/24 22:24
噓
heart9677
想想半導體造假,先觀望一下好了
01/24 22:24
→
yunf
沒有不好好嗎 每天那麼多人張口就是要吃飯
01/24 22:25
→
yunf
吃的用的沒少過 只是沒有以前這樣亂花
01/24 22:25
推
k91011022
資料都被分析完 那就有可能走向預測了
01/24 22:25
推
mamorui
很快的。論文1、2個月內會有一堆去證明。
01/24 22:26
→
lon0623
連他們自己一堆人都在說景氣下行了,不用否認
01/24 22:26
推
s800525
這個方法好,那當所有人都用這方法,那最後不是還是
01/24 22:26
→
s800525
拚誰堆的硬體多?
01/24 22:26
推
knml
自己去用用看不就得了,免費
01/24 22:26
→
lon0623
要推廣給更多人用,還是要硬體阿
01/24 22:27
→
lon0623
甚至能普及的話,硬體需求更多
01/24 22:28
推
mamorui
是要看驗證數據 不同篇會用不同場景要解決的問題去
01/24 22:28
→
mamorui
驗證 我不可能自己去弄那個資料
01/24 22:28
推
s800525
現在反而怕應用普及不了到一般消費者,硬體需求反而
01/24 22:28
→
s800525
曇花一現,真能更快達到普及至消費端,硬體需求才真
01/24 22:28
→
s800525
的會井噴
01/24 22:28
推
ab4daa
$$$$$$$$$$$$$$$
01/24 22:29
→
Rickyyy
裁員滾滾,股價又可以噴噴
01/24 22:29
→
lon0623
這就跟省油車出來,汽車反而賣更好的道理依樣
01/24 22:29
推
js52666
小金庫被拆了
01/24 22:30
推
goal56
中國人比較卷 贏美國早晚的
01/24 22:30
推
lon0623
H800 GPU不也是NV的嗎?
01/24 22:31
→
yunf
半年整個指數漲了快¼你說經濟很差?
01/24 22:32
推
s800525
H800效果就很好,那用GB200不就飛天了?
01/24 22:33
推
minazukimaya
模型是科研 應用是商業 其實這兩件事關連不大~~
01/24 22:33
→
minazukimaya
商業上 還是擁有直接面對消費者布署能力和通路的巨
01/24 22:34
→
minazukimaya
頭們優勢最大
01/24 22:34
→
yunf
1990年到現在漲了10倍
01/24 22:36
→
thigefe
左等台積腰斬
01/24 22:36
推
s800525
港股一年來漲了26.20%,但5年來跌了28.21%,所以說
01/24 22:37
→
s800525
經濟不好沒問題吧?而且比疫情時期還低就更慘了...
01/24 22:37
→
yunf
那只是一個相對的概念
01/24 22:38
推
lon0623
中國政府都在催促國家隊進場買股了,這樣叫好?
01/24 22:38
→
yunf
一個人如果有10億 然後他現在剩下七億每天跟你說他
01/24 22:38
→
yunf
很窮 你要同情他嗎?
01/24 22:38
→
lon0623
他們本來就不是正常股市了,做空還會被政府抓
01/24 22:39
→
yunf
你可能沒有看過1990的大陸
01/24 22:40
→
lon0623
1990的人忍耐力一定比現在高很多好嗎
01/24 22:40
推
Paulsic
百萬輸出 tokens 16 元,輸出 API 價格只有 OpenAI
01/24 22:40
→
Paulsic
o1 的 3%。熟悉的味道
01/24 22:40
→
yunf
那時候他們就已經過得不錯了 只是沒有現在好而已
01/24 22:40
→
lon0623
1990過得不錯是平行時空嗎?
01/24 22:41
→
lon0623
現在一定比35年前好啦,但人民的需求也會上升
01/24 22:42
推
WD640G
好啦 中吹先給你高潮
01/24 22:42
→
lon0623
之前一直吹的解封行情,現在也沒了
01/24 22:43
→
yunf
有吃有喝 有得住 還要怎樣? 就是交通不發達 醫療技
01/24 22:43
推
jamesjklin
爛爆,deepseek錯誤百出
01/24 22:43
→
yunf
術不發達
01/24 22:43
推
mamorui
中國有些團隊paper提供無限量用很佛是真的 尤其gen
01/24 22:45
→
mamorui
多媒體 同事分享過 覺得挖paper最大好處
01/24 22:45
推
bj45566
1. 中國現在經濟差景氣不好;2. 中國中下層百姓過得
01/24 22:45
→
bj45566
比疫情前還苦;這些都沒錯,但是:3. 中國投入科研
01/24 22:45
→
bj45566
的經費持續增加;4. 中國 2024 年在頂尖科學和、工
01/24 22:45
→
bj45566
程期刊和頂尖 CS 會議的論文發表數持續突破新高 esp
01/24 22:45
→
bj45566
. Nature, Science
01/24 22:45
推
xkso
中國東西 先打3折
01/24 22:46
推
JWJerryyy
剛剛meta ath 看來不影響?
01/24 22:46
推
lon0623
景氣不好,會讓一些人才寧願去科研阿
01/24 22:46
推
mamorui
真得先打3折 QQ
01/24 22:46
→
shorty5566
蠢鳥也很笨 這東西明明對台灣也好
01/24 22:48
推
holysong
中國人很卷終獲勝?1990日本也過得不錯啊
01/24 22:48
→
yunf
這都他們自己控制的
01/24 22:48
→
shorty5566
要是解法一直是堆GPU 你堆得贏那些CSP大廠嗎
01/24 22:48
推
lon0623
中國民企要存活,基本上就是要走出海外
01/24 22:49
→
yunf
過度信用擴張的人才會有問題
01/24 22:49
→
shorty5566
有deepseek的發表 至少讓台灣還有入場券
01/24 22:50
→
lon0623
不然國內越捲就越不敢請人,繼續惡性循環
01/24 22:50
推
newyorker54
我只說一句如果真的那麼好,中國人完全不可能開源,
01/24 22:50
→
newyorker54
對標open AI就只是滿足自卑感自己吹吹。完全沒有原
01/24 22:50
→
newyorker54
創性的產品
01/24 22:50
噓
jasterlin
唬爛,沒底層光靠蒸餾要趕英超美
01/24 22:50
推
MrCool5566
怎麽一堆人看到中國就黑
01/24 22:51
推
lon0623
美國最大優勢其實還是強大的內需
01/24 22:52
→
lon0623
那些中國公司產出在好,不進歐美會被自己人卷死
01/24 22:53
推
narotic
都是中共同路人啦
01/24 22:54
→
newyorker54
大家還不夠瞭解中國人嗎?又狠又卷又不要臉,文革大
01/24 22:54
→
newyorker54
躍進死的人比二戰還多,把錯都推給毛澤東,那根本是
01/24 22:54
→
newyorker54
一個全體人民劣根性的完全展現結果,只怪一個人??
01/24 22:54
→
newyorker54
?
01/24 22:54
→
yunf
中國會沒有內需嗎? 而且四倍的人口
01/24 22:54
推
lon0623
問題是他們的對手也是中國公司啊 自己人卷死
01/24 22:55
→
newyorker54
有人還抹我是中國同路人,笑死!中國六代戰機有開源
01/24 22:57
→
newyorker54
嗎?但是中國人也不要偷著樂,六代機和老美十幾年前
01/24 22:57
→
newyorker54
就有的F22也不會有優勢,看有沒有五五波就偷笑了
01/24 22:57
推
bj45566
都被美國業界學界大頭稱讚是 "breakthrough" 了還在
01/24 22:58
→
bj45566
「完全沒有原創性」,笑死 wwww 講這句話的人根本
01/24 22:58
→
bj45566
不懂什麼什麼叫作原創性
01/24 22:58
→
yunf
原本就太肥了 nv的算力可能撐不起他們那種演算法
01/24 22:58
→
yunf
沒差就看誰先算出有用的東西
01/24 22:59
→
newyorker54
中國是變強了,是世界第二強國,但是民族劣根性永遠
01/24 22:59
→
newyorker54
去除不掉
01/24 22:59
→
bj45566
而且中國領先的 AI 公司的語言模型幾乎都是開源讓大
01/24 22:59
→
bj45566
家下載,遠不只 DS,一點常識都沒有 wwww wwww
01/24 22:59
推
Paulsic
看效能和背後的財務模式不覺得恐怖嗎
01/24 23:00
推
iaminnocent
Deepseek的模型有借鑒之處,美國人也不是白癡,學
01/24 23:00
→
iaminnocent
過來調整一下,馬上模型就降本增效了
01/24 23:00
→
bj45566
美國、歐洲大部分做 AI 研究的也是開源,OpenAI 反
01/24 23:00
→
bj45566
而是世界的少數例外
01/24 23:00
→
iaminnocent
真的OpenAI 真的反而是例外
01/24 23:01
→
newyorker54
老黃還稱讚華為手機不可思議,中國人不要那麼自卑好
01/24 23:01
→
newyorker54
不好?? 等到學界公認再來說吧
01/24 23:01
推
lon0623
說不定是美國人過太爽了,人事費用太高
01/24 23:02
推
lusifa2007
如果deepseek可以搞到gb200 不是更強 AI永遠需要N
01/24 23:02
→
lusifa2007
V
01/24 23:02
推
bj45566
現在 AI 還是離起跑點不遠的階段,當然最後美中誰
01/24 23:02
→
bj45566
贏不知道,更有可能是互有擅場
01/24 23:02
→
yunf
你看你能不能算出一個 比馬斯克更棒的火箭系統
01/24 23:02
→
lon0623
看一堆影片還說美國科技業過多爽
01/24 23:03
推
Paulsic
付費打不過open還有人要付錢
01/24 23:04
推
capser
推開源
01/24 23:04
推
minazukimaya
組織文化的問題 DeepSeek作得到但是華為騰訊百度沒
01/24 23:04
→
minazukimaya
作到 就說明了這不是中美差異 而是組織文化差異
01/24 23:04
→
yunf
https://tinyurl.com/283v9oe3
01/24 23:04
推
iaminnocent
Deepseek的強化學習模式,也是O3的訓練模式,所以
01/24 23:05
→
iaminnocent
等O3公布以後,大家應該又會來比拼
01/24 23:05
→
newyorker54
open AI算力爆棚錢又多,窮人用窮人演算法自己自嗨
01/24 23:05
→
newyorker54
!笑死。大腕花幾十萬玩明星一次,窮人打手槍打到扁
01/24 23:05
→
newyorker54
掉,還很得意說不花錢還射比較爽,哈哈
01/24 23:05
→
minazukimaya
要論軟工高手和996的強度 中國大公司比DeepSeek強多
01/24 23:05
→
yunf
的確是很爽 但是壓力也很大 而且整個人的思路都不一
01/24 23:05
→
yunf
樣了
01/24 23:05
→
minazukimaya
了 這幾年騙錢的中國AI公司也沒少過 DeepSeek能成功
01/24 23:06
→
minazukimaya
自然有其公司文化的獨特之處
01/24 23:06
推
epicurious
重點是沒有要比美國好啊,差一點點但便宜5倍,美國c
01/24 23:08
→
epicurious
sp廠capex砍下來供應鏈就崩了
01/24 23:08
推
bj45566
看某位美國一流名校女博士天天拍 YouTube 就知道美
01/24 23:08
→
bj45566
國高科技業一堆爽缺閒缺...
01/24 23:08
推
newyorker54
真正開源的是meta,DS也是拿人家的來改根據開源條款
01/24 23:10
→
newyorker54
本來就要跟著開源,中國人有那麼好死,講一個自己完
01/24 23:10
→
newyorker54
全無到有的原創產品開源的再來說自己人格很崇高,不
01/24 23:10
→
newyorker54
然看你中國人德行就是垃圾
01/24 23:10
推
lon0623
女博士薪水說不定比台積很多主管高了
01/24 23:10
推
bj45566
真的不用拿文革和大躍進來嘴什麼民族性,要不然美
01/24 23:11
→
bj45566
國的民族性是不是崇尚內鬥和蓄奴(-- 當時全歐洲由英
01/24 23:11
→
bj45566
國帶頭都禁止蓄奴了)?? ?
01/24 23:11
→
shorty5566
砍capex幹嘛 好的模型算法+算力不是更飛天= =
01/24 23:11
→
shorty5566
除非你覺得AI已經發展到盡頭了 不然算力永遠都不夠
01/24 23:12
推
lon0623
美國有些人事成本真的太高了,還有搞啥DEI
01/24 23:12
推
minazukimaya
對啊 算法改進了效率變好 第一直覺當然是再放大模型
01/24 23:12
→
shorty5566
好的算法+更強的算力那才是事半功倍 買越多省越多
01/24 23:13
→
minazukimaya
或是再加訓練集吧 對BigTech來說...
01/24 23:13
→
shorty5566
更何況新的ai server功耗算力那些都是屌打前帶
01/24 23:13
→
lon0623
其實美國有對手才是好事,不然DEI一定繼續囂張下去
01/24 23:13
→
shorty5566
而且直覺是 DS讓入門門檻降低 反而很多小公司能進來
01/24 23:14
→
shorty5566
這樣整個生態系才能蓬勃發展
01/24 23:14
噓
jonnysun
咦,AI本來就只有國人最顯發明的
01/24 23:14
→
shorty5566
多點開花絕對比集中在那些大CSP好啦
01/24 23:15
→
lon0623
小公司進來也是要努力的目標,而且他們更仰賴NV
01/24 23:15
→
shorty5566
不然以後只有中美能玩 那對供應鏈風險才大
01/24 23:15
推
bj45566
廿年前的中國和現在的中國就已經是兩個世界,那時
01/24 23:16
→
bj45566
候中國在頂尖科學、工程期刊的論文發表甚至還輸台灣
01/24 23:16
→
bj45566
(現在贏幾百倍),工廠只能做些紡織業、鞋襪雨傘、小
01/24 23:16
→
bj45566
燈泡 vs. 2024 年的中國連商用的 MRI, PET-CT 都會
01/24 23:16
→
bj45566
做了,成本是歐美產品的 1/10
01/24 23:16
推
minazukimaya
嗯...但說真的模型只是科研 還是很燒錢的科研
01/24 23:16
→
lon0623
NV打造的客製化模型是可以讓更多小公司入場
01/24 23:17
→
minazukimaya
說不定笑到最後的還是像Apple這種 掌握了通路的
01/24 23:17
→
yunf
所以你說他們經濟不好嗎?
01/24 23:17
→
minazukimaya
畢竟你科研再強 沒有接觸消費者的通路還是沒錢賺
01/24 23:17
→
lon0623
人家都說中國景氣不好了 就你在堅持
01/24 23:18
推
bj45566
果然無知就是力量 wwww LLM 最先開源的是 Google 好
01/24 23:18
→
bj45566
嗎 -- 那時候的 Meta 重心還放在元宇宙呢!
01/24 23:18
→
yunf
很可惜的就是他不是真的掌握通路通路是會變的錢是長
01/24 23:18
→
yunf
腳的
01/24 23:18
推
geniusw
中國人牛逼
01/24 23:19
→
yunf
就跟你說這就是一個話術 看你從哪一個時間點去看這
01/24 23:19
→
yunf
件事
01/24 23:19
→
lon0623
那跟景氣是兩回事,現在中國經濟問題是不敢僱人
01/24 23:20
→
lon0623
工作還要花錢去買的
01/24 23:20
→
yunf
甚至以後用分析人的語言或者是新聞這都是一個關鍵點
01/24 23:20
→
yunf
他只要使用的是比較詞就可以直接略過
01/24 23:20
→
yunf
就是一個試圖混淆含糊不清的概念
01/24 23:21
→
lon0623
你只看生產端,但景氣是要看市場的
01/24 23:21
推
bj45566
中國現在經濟不景氣、老百姓日子普遍變差和中國政
01/24 23:22
→
bj45566
府持續增加科研經費,中國在科技領域越來越強是可以
01/24 23:22
→
bj45566
並存的事實好嗎
01/24 23:22
推
lon0623
是可以並存沒錯啊,不過這些產出還是要出口才行
01/24 23:23
→
yunf
叫他們想想1990年的自己就不會覺得現在有多差
01/24 23:23
→
lon0623
世界上很多產出很好的國家,但找不到出海口,結果就
01/24 23:24
→
yunf
你看他A股指數 1990/12/31 才127.610
01/24 23:24
推
bj45566
中國要變成工業大國、科技大國是遠從江澤民時代就開
01/24 23:24
→
bj45566
始一直持續的規劃目標,小學生皇帝雖然在很多地方
01/24 23:24
→
bj45566
很蠢,在這個目標上仍然是蕭規曹隨
01/24 23:24
→
lon0623
是動用武力打市場,但現在不可行了
01/24 23:24
→
lon0623
所以這是美國的優勢,因為美國有大市場
01/24 23:25
→
yunf
到2025/01/24 3409.010
01/24 23:25
→
lon0623
不可能有人想再去過1990的生活啦,那會造反了
01/24 23:26
→
lon0623
叫你去我看你會不會鬧
01/24 23:26
→
yunf
打七折而已
01/24 23:26
→
yunf
那時候也能活 現在的人就是貪婪不知足
01/24 23:27
→
TaiwanUp
github.com/deepseek-ai/DeepSeek-V3/issues/12
01/24 23:27
→
lon0623
尤其是中國的1990,那時候返鄉探親的人說根本噩夢
01/24 23:27
→
lon0623
你罵不知足 那怎麼不乾脆停止發展就好了
01/24 23:28
→
TaiwanUp
GitHub上的DeepSeek Issue12有提到根本不是開源模型
01/24 23:28
→
yunf
所以你看中國經濟 是不是又有不一樣的深度
01/24 23:28
→
lon0623
同事有人爸爸是外省老兵,返鄉說那是什麼鬼環境
01/24 23:29
→
yunf
從你一開始說的經濟不好是不是又多了一個時空維度
01/24 23:29
推
hedonist
https://i.imgur.com/X4NPImz.jpeg
01/24 23:29
→
TaiwanUp
只是開放使用而已
01/24 23:30
→
yunf
這就是我說的他使用比較詞的時候 讓你產生了一個腦
01/24 23:30
→
yunf
補的概念
01/24 23:30
推
mamorui
DS的測試數據有非數學、邏輯、代碼的數據集嗎 看到
01/24 23:32
→
mamorui
幾個分享的都只有針對這類 想看點別數據集的實驗數
01/24 23:32
→
mamorui
據
01/24 23:32
→
yunf
https://tinyurl.com/23s52r6l 剛好看到這一篇 水軍
01/24 23:34
推
lponnn
希望是真的 幹趴好美
01/24 23:35
→
yunf
以後你在看新聞的時候看到他使用比較詞這種模糊的概
01/24 23:37
→
yunf
念的時候就可以立刻有所反應! 多練習幾次就知道很
01/24 23:37
→
yunf
好用甚至你還可以建立詞庫 什麼%呀都是一個可以被動
01/24 23:37
→
yunf
手腳的魔術數字
01/24 23:37
→
yunf
板上不是有一個計算機大師嗎 他就很喜歡提出一些他
01/24 23:38
→
yunf
自己都沒有驗證過的數據
01/24 23:38
→
yunf
你只要比他清楚 就不會被他唬爛 或者是你的基礎觀念
01/24 23:39
→
yunf
很好 也不容易被唬爛
01/24 23:39
推
greattower
真正被挑戰的是特斯拉,上述這些公司都還不是很接
01/24 23:41
→
greattower
近
01/24 23:41
→
yunf
這就是為什麼三歲小孩子好騙 因為他們不具備這些基
01/24 23:42
→
yunf
礎辨識能力 甚至要到鑑識能力
01/24 23:42
→
TaiwanUp
其實還是不建議貼這個網站的東西 宣傳度比較高
01/24 23:43
→
yunf
看記者署名就知道
01/24 23:45
→
yunf
就當笑話看看就好 沒有任何機構背書
01/24 23:45
推
ipadpro2
很像台灣的迂腐體制 一群大頭只會出張嘴領高薪 難怪
01/24 23:46
→
ipadpro2
沒效率
01/24 23:46
→
EDFR
遙遙領先 wwwwwwwwwwwwwww
01/24 23:48
推
skyyo
會不會deepseek裡面真的是工人智慧 真人線上選擇AI
01/24 23:49
→
skyyo
生成的幾個選項
01/24 23:49
→
yunf
等你老了就知道什麼叫做心有餘而力不足 再也不是那
01/24 23:49
→
yunf
個可以一天工作17~18小時的超人但那種戰鬥力所留下
01/24 23:49
→
yunf
來的成就感你還會記得這個時候你可能會找新鮮的肝來
01/24 23:49
→
yunf
補足那種感覺可惜你發現你找來了一堆天線寶寶
01/24 23:49
推
a123274
中國可以用美國的模型去訓練,當然成本低
01/24 23:50
→
yunf
他就跟你講說他是deepsick了
01/24 23:50
→
TaiwanUp
Meta本來就該緊張 也不用緊張 本來就沒賺魔改又如何
01/24 23:51
→
yunf
所有的人工智慧到最後都是為了等待救世主的出現而做
01/24 23:52
→
yunf
的準備
01/24 23:52
推
tchialen
背後是人體計算機 (誤)
01/24 23:54
推
aaronpwyu
這代表不只元團隊是小倫 AI團隊也是?
01/24 23:54
→
yunf
https://tinyurl.com/2y8tmcnt
01/24 23:54
噓
WillTheWise
重點不是怎麼train的,是用什麼資料train的
01/24 23:58
→
yunf
https://tinyurl.com/225wxbdt
01/24 23:59
→
yunf
https://tinyurl.com/2993eypv 簡單有用的知識
01/25 00:01
→
yunf
https://tinyurl.com/2cqn9qtv 希望大家是自己的大
01/25 00:07
→
yunf
腦成長不是機器的大腦成長
01/25 00:07
推
skyyo
我也不太信deepseek 目前試用觀察中 但必須要說連英
01/25 00:09
→
skyyo
文都看不懂還能堅持罵的一定是中黑
01/25 00:09
推
aria0520
meta的主力路線本來就不在LLM上 是lecun的世界模型
01/25 00:11
→
aria0520
deepseek這些都還是LLM LLM就是條死路
01/25 00:12
→
aria0520
文字接龍不可能接出AGI
01/25 00:13
推
lponnn
用了多少印度人 哈哈
01/25 00:13
推
aria0520
現在業界都在LLM耗費鉅資窮兵黷武 願意像meta這樣
01/25 00:16
推
s1527
怎麼一堆人都是用硬體類比軟體 錯誤的類比會讓自己
01/25 00:16
→
s1527
顯得是愚人
01/25 00:16
推
bella1815
Meta股價又創新高了,還真是恐慌呢
01/25 00:17
→
aria0520
分可觀資源給全新路線的幾乎沒有
01/25 00:17
→
aria0520
lecun一旦成功 那就會像當年OAI在GPT一樣拿到先發
01/25 00:18
→
aria0520
chatgpt出來之前 全都在搞bert 但oai堅持信念才走出
01/25 00:18
→
aria0520
LLM和scaling law的新路 追隨者們現在又歷史重演
01/25 00:19
→
aria0520
oai自身有能力的RD又都跑光 只剩一堆sales和PM
01/25 00:19
→
aria0520
整天在X上false hype, 所以我反而很看好meta
01/25 00:20
→
aria0520
zuck只要肯繼續放權放資源讓lecun探索world model
01/25 00:21
→
aria0520
那可真的會是有AGI潛力的理論模型
01/25 00:21
→
aria0520
meta的llm team的確是可能慌 因為本來他們就在和
01/25 00:23
→
aria0520
lecun的FAIR爭資源爭算力 這對lecun應該是好事
01/25 00:23
推
c41231717
來試試
01/25 00:27
推
spen2005
Eriker到底在供三小
01/25 00:29
推
lovepork
aria到底在講什麼?你直接回一篇吧?
01/25 00:30
推
wen880225
中國取得科技領先有可能,但中國科技領先不可能
01/25 00:31
→
yunf
https://tinyurl.com/272jwcrp 製造更多的問題
01/25 00:31
→
aria0520
講得太業內了嗎?XD
01/25 00:32
→
aria0520
隨手抒發一下而已 沒打算回一篇
01/25 00:34
推
godevilyu
不得不說中國軟體真的強..要不是硬體被制裁..
01/25 00:35
→
yunf
他就算有AGI要怎麼用還是個問題他到底是個瘋狂科學
01/25 00:36
→
yunf
家還是任性的小女孩?
01/25 00:36
推
coolmark01
中國的現況應該都只能想辦法彎道超車,尤其在硬體被
01/25 00:37
→
coolmark01
限制的情況之下
01/25 00:37
→
yunf
就跟老鼠一樣一直站在牛的頭上 然後快到終點的時候
01/25 00:38
→
yunf
再跳下來說他是第一
01/25 00:38
推
lovepork
我好奇,印度的軟體業不是很強?
01/25 00:38
→
lovepork
怎麼AI好像沒搞出什麼行頭?
01/25 00:39
→
yunf
所以你就要知道其實他們一直都在佈一個大局
01/25 00:39
推
ochyi
有人跟我一樣想到人礦嗎 ?
01/25 00:39
→
yunf
你想得到的別人都想過了 你想不到的別人都在默默進
01/25 00:40
→
aria0520
軟體跟AI不是同個概念 軟體有前後端有系統整合
01/25 00:40
→
yunf
行中
01/25 00:40
→
yunf
你看全球領導人物有多少人是印度人
01/25 00:41
→
lovepork
反而是軟體業不出色的中國人在AI竄出
01/25 00:41
→
aria0520
但本質上都是碼農 頂多演算法很強優化建構能力強
01/25 00:41
→
aria0520
AI需要的人本質上是研究員 看paper發paper
01/25 00:41
→
yunf
你再偷也沒有用 最後也只是別人故意給你偷的 就好像
01/25 00:42
→
aria0520
中美的AI論文量本來就不相上下 在這波浪潮前也是
01/25 00:42
→
c41231717
小玩了一下 自己玩起來的感覺是資料庫的限制比幾個
01/25 00:42
→
yunf
作業系統一樣故意讓盜版沒關係
01/25 00:42
→
c41231717
大頭AI的限制少 其實美國人有發現問題啦 不然阿川
01/25 00:43
→
yunf
別人只利用你的人力和資源 來完成這些東西
01/25 00:43
→
c41231717
怎會簽署鬆綁AI限制的法案 deepseek的品質還不錯
01/25 00:43
→
aria0520
說實在在LLM這條死路上誰衝的快不怎麼關乎大局就是
01/25 00:43
推
bj45566
印度軟體強?他們接的主要是中低階代工單(來自美國
01/25 00:44
→
aria0520
頂尖labs教授不要再讓學生去蹭LLM養出一堆產廢才是
01/25 00:44
推
Page122
真的屌 技術帝的勝利
01/25 00:44
→
bj45566
、日本) -- 你會覺得幫政府機構架網站的人軟體強嗎
01/25 00:44
→
bj45566
?印度的理工強者大部分都去美國英國了...
01/25 00:45
→
aria0520
真的 過去一年來這個弊端開始顯現了 new grad清一色
01/25 00:45
→
c41231717
輔助吧 AI雙面刃 如果拿來產虛假數據的話 基本上就
01/25 00:45
→
aria0520
都在搞LLM 研究主題不如過去十年的多樣
01/25 00:46
→
c41231717
變成毒藥了 但拿來分析實打實的研究數據是很有用的
01/25 00:46
→
bj45566
不過隨著印度慢慢崛起,未來很有可能看到改變 -- 印
01/25 00:46
→
c41231717
工具
01/25 00:46
→
bj45566
度的 Nature Index 成長的很快,目前已經遠勝台灣世
01/25 00:46
→
bj45566
界第九
01/25 00:46
→
aria0520
等所有公司都在這條死路封頂後我看這群何去何從
01/25 00:46
推
fukku100
DeepSeek r1 14b 的效果真的不錯
01/25 00:47
→
bj45566
「AI需要的人本質上是研究員 看paper發paper」 +1
01/25 00:47
噓
L1ON
機翻嗎?文章看得很痛苦 還好有原文
01/25 00:48
推
bj45566
aria0520 板友絕對是 AI 巷子內的
01/25 00:49
推
WWIII
空爆臉書
01/25 00:50
推
bj45566
現在 EE/CS 即使是難度最巔峰的 ACM STOC 都可以看
01/25 00:53
→
aria0520
是 有感而發XD
01/25 00:53
→
bj45566
見來自印度的論文了,在五六年前簡直不可思議... 印
01/25 00:53
→
bj45566
度在科研方面的投入明顯增加許多,成果也慢慢展現出
01/25 00:53
→
bj45566
來了...
01/25 00:53
推
bj45566
CS 之前從來沒有一個子領域論文研究和實戰能力像 AI
01/25 00:55
→
c41231717
印度仔這幾年很多有錢人啦 旅遊碰到都有感 小費都
01/25 00:55
→
bj45566
那麼緊密相連過
01/25 00:55
→
c41231717
給一百鎂的 嚇死人
01/25 00:55
→
yunf
印度種姓制度你可能遇到他第二等的那種
01/25 00:57
推
bj45566
(EE 則是一直都有,例如最明顯的 Info. Theory 領
01/25 00:58
→
bj45566
域論文研究 <-> 人類通訊編碼、影音壓縮的實戰技術)
01/25 00:58
→
yunf
暴發戶也是很多 你看委內瑞拉30年前和現在
01/25 00:58
推
li11223344
中國就Cost down專業啊..半價買到8成效能還是很吸
01/25 00:59
→
li11223344
引人吧
01/25 01:00
推
ypc1994
綠蟾蜍:台灣技術先進 AI沒發展只是沒錢
01/25 01:00
→
yunf
現在他們就是要你一直用A I一直要電 然後你就自己去
01/25 01:03
→
yunf
找電弄碳權 自己拔樹破壞生態系 最終就是一堆人生病
01/25 01:03
→
yunf
新型態的病菌正在悄悄地進入你的生活圈
01/25 01:04
推
bj45566
又再把 "breakthrough" 轉移概念到 "cost down" 了
01/25 01:05
→
bj45566
wwww wwww
01/25 01:06
→
yunf
https://tinyurl.com/29l9n6vp
01/25 01:06
→
Royalweger
那麼重要的是多空蛙,分別有哪幾支標的能參考的呢
01/25 01:06
→
yunf
https://tinyurl.com/257hnlzh
01/25 01:09
→
yunf
這裡絕大部分的人都不討論估值問題
01/25 01:11
→
yunf
這個東西有沒有發展對於企業或者是產業到底能增加多
01/25 01:12
→
yunf
少估值?
01/25 01:12
→
yunf
現在的A I也都還沒有開放這一塊
01/25 01:13
→
yunf
https://tinyurl.com/2b5ah7gq 終於看到有人分享這
01/25 01:15
→
yunf
個畫面
01/25 01:15
→
yunf
照理來說他結果怎麼形成的這個過程應該都是被嚴格控
01/25 01:16
→
yunf
管的
01/25 01:16
推
Aquarius126
台灣搞AI的都跑出國了吧
01/25 01:18
→
newwu
ㄜ 有人的英語閱讀能力...
01/25 01:21
推
iamdemonic
集體耍廢被發現了 我要笑死
01/25 01:34
推
event1408472
不用那麼多顯示卡了 台積電G
01/25 01:44
推
st950127st
贏麻了 先存著論文 明天看
01/25 01:55
推
pleasepo
人家程式都開源也可以接受國際驗證,這樣也叫吹?
01/25 01:55
→
pleasepo
當初韓國吹常溫超導體,結果沒有一間實驗室可以驗證
01/25 01:56
→
pleasepo
,這就是造假。
01/25 01:57
→
pleasepo
印度軟體強沒錯,但是都是受雇西方國家,加上沒有資
01/25 01:58
→
pleasepo
金,無法發展。
01/25 01:58
推
a731977
笑死,有人英文看不懂,哈哈
01/25 02:16
→
yunf
https://tinyurl.com/27wvjavq 沒關係有人幫你簡報
01/25 02:23
→
yunf
https://tinyurl.com/2yo2b54d 他跟你說什麼是原創
01/25 02:38
噓
ilycychien
快跌好不好 最看不懂在漲什麼的東西
01/25 02:58
→
yunf
https://tinyurl.com/268m4lq5 看起來好像是在教你
01/25 03:13
→
yunf
開飛機 可是重點是你又不是教練你怎麼知道這個細節
01/25 03:13
→
yunf
和步驟有沒有問題 這個就事實查核有趣的地方
01/25 03:13
推
hyperyoujo
大家這麼震驚幹嘛,這不就中國日常,這新聞只是說
01/25 03:27
→
hyperyoujo
明AI技術成熟的比較快而已,一個製成(包含軟體)
01/25 03:27
→
hyperyoujo
一向都是只要成熟了就沒有其他國家能卷贏中國了,
01/25 03:27
→
hyperyoujo
就這麼單純而已
01/25 03:27
→
yunf
https://tinyurl.com/24l8nboy 中國日常是這個
01/25 03:38
推
ezezpz
請大家快跑讓我撿便宜
01/25 05:02
推
vindiesl2000
美國ai本就是華西街炒股工具
01/25 05:46
噓
darktasi
中國或成最大贏家
01/25 06:12
推
lanszul
科技越發達,工業越全面,通縮才正常,只有沙雕才會
01/25 06:16
→
lanszul
信美國通膨那套理論,美國人現在都打兩份工才能生存
01/25 06:16
→
lanszul
,誰比較慘還看不出來嗎?
01/25 06:16
推
JT0624
不然美國為什麼要限制中國AI晶片 因為早就輸了
01/25 06:42
推
PttWaHaha
臺灣負責賣鏟子發大財,其他國家自己去捲AI…贏痲了
01/25 07:12
→
PttWaHaha
……
01/25 07:12
推
justin200428
白人怕輸 到時發核彈
01/25 07:26
→
justin200428
老黃太聰明了
01/25 07:27
推
Aixtron
AI幻覺
01/25 07:40
推
NgJovi
AI泡泡@@
01/25 07:43
推
supisces
利好meta,發現人力可以少一半,而且效能多好幾倍。
01/25 07:43
推
Lhmstu
meta 爽太久吧,冗員多
01/25 07:51
→
howardyeh
我認為只是臉書自己的問題,之前搞元宇宙就覺得他們
01/25 07:59
→
howardyeh
研發審核毫無章法,一堆普普的東西居然也敢拿出來大
01/25 07:59
→
howardyeh
吹特吹
01/25 07:59
推
k1k1832002
其實最大衝擊大概是原本認為落後五年甚至超過的人
01/25 08:01
推
k798976869
meta現金多啊 根本不急 靠賣詐騙廣告補血
01/25 08:01
噓
deepdish
幫翻譯:請給我黃金
01/25 08:04
推
Lhmstu
記憶中meta不是要裁員了嗎,考核後10%打算全砍
01/25 08:04
推
s213092921
一堆仇中酸民不願面對現實,你們得趕快習慣,今年中
01/25 08:19
→
s213092921
國科技會一堆井噴爆發^^
01/25 08:19
推
losage
冗員:幹幹幹,要被發現了
01/25 08:44
推
peter6666712
牢美白豬不行很久了 只能靠祖國人跟阿三撐著
01/25 08:54
→
peter6666712
現在老川還卡移民 我看五年內牢美要完
01/25 08:54
→
newwu
成本是不是那麼低還很難說,他們看起來沒有公開詳
01/25 09:02
→
newwu
細訓練細節
01/25 09:03
噓
jamesho8743
開源就不是抄?
01/25 09:05
噓
atlaswhz
每天都在贏
01/25 09:11
→
mamorui
幾何數學沒對 https://imgur.com/1EERwjX
01/25 09:22
推
a6976933
笑死 到時候發現根本不用這麼多鏟子 直接崩盤
01/25 09:23
→
FatFatQQ
https://i.imgur.com/wMkV5yP.jpeg
01/25 09:31
→
FatFatQQ
美國科研早落後了 還領先30年
01/25 09:31
推
topfree
..上面那位一直吵的英文能力真的有問題
01/25 09:36
推
hololive45P
不用大量顯卡+低硬體,怎麼辦到的,有點神奇
01/25 09:54
→
lineak
我覺得對各家是利多, 裁員人數上升。 導入的門檻
01/25 09:55
→
lineak
降低
01/25 09:55
推
mamorui
邏輯也錯 https://imgur.com/Ya72IbV
01/25 10:22
→
mamorui
等都會對了再說
01/25 10:23
推
clou
先保留吧 有沒有懂的鄉民可以說明低成本怎麼做到的
01/25 10:26
推
TaiwanUp
中國偽論文產量多而已 根本不堪檢驗
01/25 10:28
推
mamorui
他就是只做後訓練 燒錢的是預訓練
01/25 10:32
推
mamorui
借用李鴻毅老師的課程分類簡單讓一般人理解
01/25 10:36
→
mamorui
https://imgur.com/daj8Khb
01/25 10:37
→
mamorui
應該說是DeepSeek r1, 我不是說v3
01/25 10:41
推
scccc
沒事。美國會禁的
01/25 10:49
推
mamorui
然後測試gpt不是用4o、要用o3, 譬如DS v3可以對gpt
01/25 10:51
→
mamorui
4o, DS r系列是對標ChatGPT o系列
01/25 10:52
推
kotorichan
主打便宜上百倍,堪用啊
01/25 11:04
→
kotorichan
先求有就好 看能不能帶動中產晶片
01/25 11:05
推
TaiwanUp
八卦有篇論文被撤稿率 中國被撤幾乎是2-18名加總
01/25 11:17
推
mamorui
中國真的不少就是論文模型上HF不限次免費佛心給用
01/25 11:23
→
mamorui
,不過標竿還是gpt,所以再說吧
01/25 11:23
→
FatFatQQ
數據都是驗證過的 還再產量多 快笑死 文組是標案領
01/25 11:39
→
FatFatQQ
太多還在睡嗎
01/25 11:39
→
FatFatQQ
數據還是要現實世界驗證過的才能使用 你一直靠AI搞
01/25 11:41
→
FatFatQQ
不一定會跑出真的東西 AI+實用數據互相支持
01/25 11:41
→
FatFatQQ
才能一直快速迭代
01/25 11:41
噓
reasonal
中國人力成本可以各種壓低,國外怎麼可能複製
01/25 11:54
推
iansrc
讓子彈飛一會 美國科技業又不是紙糊的 很需要這種
01/25 12:04
→
iansrc
當頭棒喝
01/25 12:04
推
david54001
中國的肝也不蓋的
01/25 13:37
→
Tatsuya72
自掘墳墓,嘻嘻
01/25 13:39
推
Brioni
可以確定的是AI這塊中國領先整個亞洲
01/25 13:41
→
zer0319
所以是軟硬體商一起在洗估值嗎
01/25 13:48
推
kdh
分別問DS和GPT,中國適合民主嗎?DS會吹噓中國,GPT
01/25 15:15
→
kdh
回答較中性
01/25 15:15
→
yunf
便利商店是怎麼戰勝雜貨店的?
01/25 15:29
→
yunf
你們要知道量變後帶來的值變早就在估值裡
01/25 15:30
→
yunf
這就是為什麼他們吹牛不犯法
01/25 15:31
→
yunf
但東西卻差很多
01/25 15:33
→
yunf
時代就這樣轉換了 老店就這樣被捲死了
01/25 15:35
噓
kougousei
這種陷入恐慌文就別鬧了 之前google也陷入恐慌
01/25 16:15
推
toulio81
沒啥可信度,中國很多產品賣的都比成本還低
01/25 16:23
推
live1002
不過有沒有比較好,這串最好笑的是有人英文很爛
01/25 17:49
→
Jeff1989
阿祖:?
01/25 18:41
→
louis925
會不會 training 的時候,把各個 benchmark 答案也
01/25 19:29
→
louis925
一起 train 了?
01/25 19:29
→
ActionII
他們恐慌的原因不是被趕上吧,是發現對岸開始捲起
01/25 21:09
→
ActionII
來,他們的好日子要到頭了
01/25 21:09
噓
Brusolo
又來吹,這麼屌怎麼Meta昨天又創新高,中吹唬爛洨
01/25 22:27
→
gk1329
中國卷成世界贏家
01/25 22:34
推
bella1815
一堆狂喊美國輸了完了,做空了沒?
01/25 22:47
→
yunf
美股是沒有漲跌幅限制的
01/26 00:58
→
yunf
你根本不知道什麼時候會灌下來
01/26 00:58
→
yunf
亞馬遜直接清掉魁北克分部
01/26 00:59
→
wantsleep
低成本 只要接近大公司的效果 就夠了
01/26 02:11
推
ksjr
我問chatgpt他會不會被deepseek取代掉結果他給我
01/26 02:58
→
ksjr
答非所問開始說廢話 chatgpt是不是急了?
01/26 02:59
推
DREE
軟體可以複製可以抄當然進步快啊!!人力不值錢
01/26 07:20
→
TaiwanUp
太低級的問題ChatGPT會幫你潤飾掉 這才是大眾產品
01/26 11:36
推
lain2002
中國又贏了
01/26 15:38
推
penolove5566
做的事情不一樣吧,先做出來跟cost down
01/27 02:23
→
yunf
https://tinyurl.com/2c6upj4s
01/27 07:25
→
yunf
https://tinyurl.com/2y7qgafh
01/27 07:29
推
sg1987
一個月內翻船
01/27 14:59
→
skyyo
笑死 以上中黑ID完全講錯方向 是不是應該開集中下跪
01/27 17:27
→
skyyo
道歉討論串
01/27 17:28
推
tw19930419
回頭來看這篇真爽 有人沒讀書,就喜歡嘴硬
01/27 22:58
推
s213092921
朝聖經典,中黑哭暈在廁所
02/09 23:43
噓
dodoro1
in
05/03 16:59