[新聞] 李飛飛World Labs首款產品Marble登場！

作者jerrychuang ()

標題[新聞] 李飛飛World Labs首款產品Marble登場！

時間Thu Nov 13 22:06:05 2025

原文標題： ※請勿刪減原文標題李飛飛World Labs首款產品Marble登場！給一句提示就可生成3D世界，空間運算有何商業潛力？原文連結： ※網址超過一行過長請用縮網址工具 https://www.bnext.com.tw/article/85088/marble-world-model 發布時間： ※請以原文網頁/報紙之發布時間為準 2025.11.13 記者署名： ※原文無記載者得留空陳建鈞原文內容：由AI教母李飛飛共同創辦、著眼空間運算的新創World Labs，如今推出了首款商業化產品 Marble，用戶可輸入文字、圖片或影片，即可生成一個完整的立體空間。根據《TechCrunch》報導，距離World Labs宣佈完成2.3億美元募資大約一年時間，這間新創公司便發布了這款生成式世界模型產品。兩個月前，該模型以Beta預覽版的形式推出，現在也正式推出服務。一句話、一張圖生成小小世界，世界模型「Marble」正式上線 Marble的核心能力是讓使用者透過多模態輸入，將文字提示、照片、影片、3D佈局或全景圖，轉換為可編輯和下載的3D環境。李飛飛向媒體表示，世界模型是生成式AI時代的重大發展，「大型世界模型是釋放AI潛能的重要一步。」與其他生成式模型最大的差異在於，Marble是直接建立一個完整的3D環境，並且可供下載，而不是在用戶探索過程中即時生成的世界。World Labs 表示，這能減少畫面變形或不一致的問題，並讓用戶後續加工利用。 Marble的共同創辦人賈斯汀．強森（Justin Johnson）表示，這是一個「生成 3D 世界的一個全新類別的模型」。強森指出，Marble未來的一個方向是創意應用，聲稱該服務具備完善的編輯工具讓用戶反覆調整場景，其成果預計可以運用在遊戲、視覺特效和VR產品之中。不過，目前遊戲產業對AI的看法仍然好壞參半，近期一次遊戲開發者大會上的調查顯示，約有3分之1受訪者對AI如何影響遊戲產業抱持負面看法，較去年的調查高出12個百分點， AI生成內容的低劣品質、侵權等問題是許多從業人員不滿的原因。目前在Marble網站上，用戶可以瀏覽不同作者生成的大量3D世界，又或者透過輸入提示詞、上傳圖像影片自行創造心目中的虛擬世界。 Marble現在提供四種分層付費方案：免費方案：提供四次文字、圖像或全景圖生成。標準方案：每月 20 美元，包含 12 次生成，並支援多圖/影片輸入和進階編輯。專業方案：每月 35 美元，包含 25 次生成，提供場景擴展和商業權利。極致方案：每月 95 美元，包含所有功能和 75 次生成看好空間智慧成AI新領域，李飛飛為「世界模型」寫下定義且在World Labs推出首款產品之前，李飛飛發表了一篇宣言，聲稱空間智慧會是AI技術發展的下一個新領域。她首先點出了大型語言模型當前的限制，形容它們就像是身處黑暗中的語言大師，「能言善道卻缺乏經驗，博學多聞但沒有根基。」她指出，空間智慧徹底改變創造及體驗現實與虛擬世界的方式，顛覆敘事、創造、機器人技術、科學發現等眾多領域。尤其是機器人技術，她認為缺乏對物理世界的感知及理解能力，是機器人技術發展的最大限制，賦予機器人空間智慧將對眾多產業帶來深遠影響。不過世界模型目前仍是個相對模糊的新興概念。例如，Meta首席AI科學家楊立昆（Yann LeCun）認為它是AI發展的未來，但更側重於AI的自主學習與因果理解。而在她的宣言中，李飛飛則以三種核心能力為基礎，為世界模型下了明確定義。生成能力（Generative）：模型能生成多樣且合理的世界。世界模型能「自己生成」世界。生成的世界要在感知、幾何、物理上合理，並且多樣化。模型應該理解世界的過去狀態，並保持與現在的一致性。不論是虛擬空間還是真實場景，都能生成可觀察、可使用的世界狀態。多模態（Multimodal）：模型能從多種資訊理解世界世界模型能接收各種形式的資訊：圖片、影片、深度圖、文字、手勢或動作。它能把這些部分訊息整合成完整的世界狀態，像人類或動物一樣理解世界。也能用多種方式與人或代理互動，輸入和輸出不侷限單一形式。互動能力（Interactive）：模型能根據動作或目標預測世界變化。世界模型能根據動作或目標預測世界的下一步狀態。輸出會符合物理規律、語義、動態行為，保持前後一致。強大的模型甚至可以在目標驅動下，不只預測世界狀態，還能預測下一步行動。她在文章的最後寫道，空間智慧能提昇人們最為重視的生活品質。在空間智慧能力誕生在生物身上至今5億年，人類終於有機會將這項能力賦予機器，並造福世界各地的人們，「如果沒有空間智慧，我們對真正智慧機器的夢想是不完整的。」心得/評論： ※必需填寫滿30正體中文字，無意義者板規處分理組的世界模型要上了不過不知道效果如何? 但應該還是需要更大的算力更大的記憶體吧? 重點是演算法還是transformer? 還是還在尋找更佳的演算法? 還是理組模型只要理解不需要死背所以算力記憶體需求大幅減少? 不可能吧...... 等大神開示... 99NV 99MU 99BRCM -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.146.68 (臺灣) ※ 文章網址: https://webptt.cc/bbs/Stock/M.1763042767.A.DAB.html

※ 編輯: jerrychuang (118.160.146.68 臺灣), 11/14/2025 07:50:51

推文 (103)

推 odddriver 挖感覺很猛 11/13 22:07

推 DreamW 看成李發發 11/13 22:17

→ JoeyChen 上去看了那些作品它的用途是創建風格化的場景嗎？ 11/13 22:19

推 gk1329 做遊戲更簡單惹 11/13 22:20

推 northsoft 是說生這個要幹嘛？ 11/13 22:22

→ yesonline https://marble.worldlabs.ai/ 11/13 22:23

推 duriamon 沒什麼用的東西，這東西就只是個3D建模AI，跟她宣稱 11/13 22:25

→ duriamon 的什麼大語言模型的未來沒什麼半毛錢關係，就整天吹 11/13 22:25

→ duriamon 而已，笑死！ 11/13 22:25

→ yesonline 先讓投資者看到東西啦. 這樣後續才能繼續注資... 11/13 22:26

推 joshddd 技術細節沒有透漏嗎？ 11/13 22:40

推 tanby 3D世界建起來後接著就是包含物理特性後續延伸的 11/13 22:41

→ tanby 東西很多 11/13 22:41

→ ActionII 文字資料到頭了，開始理解視覺資料很正常吧 11/13 22:48

→ ActionII 可以理解3d 物理世界，比大語言模型更有用惹 11/13 22:49

→ truehero 世界模型產生模擬資料訓練機器人阿 11/13 22:56

推 Obama19 AI教母來了 11/13 22:59

推 cphe 看來AI泡沫就是笑話了 11/13 23:06

→ mokumoku 這說真的滿猛的 11/13 23:09

推 epephanylo 感覺對遊戲業是個好消息 11/13 23:09

推 guanting886 目前看起來像是擴散模型3D版後面的物理/物體結構 11/13 23:15

→ guanting886 Ai什麼的應該沒有生成出來相關參數看起來比較能 11/13 23:15

→ guanting886 輔助AR/VR開發的快速建模 11/13 23:15

→ guanting886 但整到遊戲去開發者可能更痛苦 11/13 23:16

→ guanting886 待教母補完後面那段 11/13 23:17

推 epephanylo 點了幾個演示，他根本沒建模 XD 11/13 23:19

→ epephanylo 就是搞了個蛋貼個圖假3D這樣只能當作概念溝通用吧 11/13 23:19

推 bj45566 還是希望多一點人才投入研發世界模型 11/13 23:22

推 Lowpapa Fake 11/13 23:30

推 madeinheaven 沒啥用 11/13 23:53

推 NCCUexpert 沒啥用，沒看出價值我太膚淺了嗎 11/14 00:11

推 odddriver 一個能做遊戲，一個給機器人用 11/14 00:18

→ odddriver 馬斯克做世界模型也是一樣概念，就是遊戲也能用 11/14 00:19

推 nfsong 教母 11/14 00:25

推 nfsong https://www.youtube.com/watch?v=8OhrVkDRN2Y 11/14 00:28

→ nfsong 一張圖生成3D 地圖 11/14 00:29

→ nfsong 未來遊戲引擎越來越容易 11/14 00:29

→ nfsong 先生成2D 美術圖然後轉3D圖 11/14 00:29

→ nfsong 以前很多美術渲染很困難 11/14 00:31

→ nfsong 現在就是先生成 1萬種藝術風格 11/14 00:31

→ nfsong 然後1萬種風格帶入遊戲引擎產1萬種地圖 11/14 00:32

→ nfsong demo 快很多 11/14 00:32

→ nfsong 其實現在AI產很多細緻的圖已經是美術設計辦不到 11/14 00:33

→ atari77 用文字與圖片就可生成3D世界模型哪不厲害超強好嗎 11/14 00:33

→ nfsong 細節很多的要再產3D 更難 11/14 00:34

→ atari77 燈光貼圖都弄好對動畫與遊戲省多大的工夫人力成本 11/14 00:34

→ atari77 再稍微做一些微調就能符合需求超好用 11/14 00:35

→ nfsong 譬如Steampunk 建上萬個齒輪 11/14 00:35

→ nfsong 建模還不建到死 11/14 00:35

推 nfsong 主要是想橋接物理世界 11/14 00:39

→ nfsong 應用在機器人身上就是視覺空間化 11/14 00:40

→ nfsong 很久以前採訪她就有說主要是為機器人橋接物理 11/14 00:40

→ nfsong 世界 11/14 00:41

→ DrTech 怎麼那麼多人大開眼界，文字轉3D技術，隨便一個大學 11/14 01:16

→ DrTech 生都能做的技術，都開源一堆了也那麼驚訝 11/14 01:16

→ DrTech 隨便舉例：https://github.com/Tencent-Hunyuan/Hun 11/14 01:17

→ DrTech yuan3D-2.1 這都出來多久了。 11/14 01:17

→ DrTech 文字或圖片產出3D場景根本沒什麼技術。精確度能不能 11/14 01:19

→ DrTech 達到工業級才是重點。給機器人學又更好笑了，物理精 11/14 01:19

→ DrTech 度或視覺真實那麼差的環境，機器人學了也不能用。 11/14 01:19

推 nfsong 不一樣的東西吧 11/14 01:30

→ nfsong 混元3D 是一般的3D 建模沒有建空間 11/14 01:31

推 nfsong HunyuanWorld-1.0 11/14 01:33

→ nfsong 就是李飛飛在做的東西 11/14 01:33

→ nfsong https://techcrunch.com/2025/11/12/fei-fei-lis- 11/14 01:37

→ nfsong world-labs-speeds-up-the-world-model-race- 11/14 01:38

→ nfsong with-marble-its-first-commercial-product/ 11/14 01:39

→ nfsong 比較的好像是 Google’s Genie 11/14 01:40

→ nfsong 能夠很好的生成一個空間就能生成更多 11/14 01:41

→ nfsong 譬如迷宮生成 11/14 01:42

→ nfsong 主要還是描述真實物理世界 11/14 01:43

推 tanby 混元模型跟這個技術效果差很多要不要先去用用看再 11/14 01:46

→ tanby 來講啊 11/14 01:46

推 nfsong 應該是混元世界模型 11/14 01:47

→ nfsong B站有人在實測marble 了好像蠻爛的 haha 11/14 01:47

→ nfsong 剛開始 11/14 01:48

推 nfsong 就是拿混元世界比marble ...兩個一樣爛 11/14 01:50

→ nfsong 剛開始疊代吧 11/14 01:51

推 nfsong 和leaderboard LLM 好像也有 3D場景的指標數值 11/14 01:53

→ nfsong 慢慢會變強吧 11/14 01:53

推 tanby 要拿混元世界-mirror 模型來比才是，生成的東西差 11/14 01:54

→ tanby 不多 11/14 01:54

推 nfsong 和前兩天 FAIR 田渊栋說的 11/14 01:55

→ nfsong 這東西要變成framework給人用應該會走開源路線 11/14 01:56

→ nfsong 現在是 domain 模型產業模型大爆炸時代 11/14 01:57

→ nfsong 人人都在做模型 11/14 01:58

推 nfsong 撇除細節這東西拿來DEMO給甲方蠻適合的 11/14 02:02

→ nfsong 是不是甲方要的一個眼緣送甲方1000個世界渲染 11/14 02:03

→ nfsong 包含室內設計喔 11/14 02:03

推 ggirls 教母漂亮嗎 11/14 03:56

推 qwe78971 懶得看 Ai要做3D遊戲還太勉強了光生出幾千面的模 11/14 04:49

→ qwe78971 型問題就大到不行不是人人拿頂尖顯卡在玩耶 11/14 04:49

推 chienk 哇。產品落地。濾鏡拿掉了。 11/14 07:42

→ a9564208 這對傳媒娛樂產業很有幫助 11/14 07:59

→ csyang 真的很討厭名字有疊字耶~ 11/14 08:30

推 smallkop 阿靠北這不就元宇宙 11/14 08:30

→ pov ANN都要大量訓練資料跟生物神經運作方式本質不同 11/14 11:05

→ loking 以後搭配vr 可以一直發現新世界不會地圖玩膩 11/14 11:46

推 decorum 有什麼運用可能要後續開發者去拓展原創團隊未必能 11/14 12:45

→ decorum 預先設想到其潛力 11/14 12:45

噓 quartics 世界模型也達不到AGI 11/14 14:30

推 bnd0327 空間智能方向是必要的，但輸入輸出還有待定義 11/14 15:41

→ bnd0327 要像ChatGPT那樣給公眾玩就是變這種玩具樣 11/14 15:42