原文標題:
※請勿刪減原文標題
李飛飛World Labs首款產品Marble登場!給一句提示就可生成3D世界,空間運算有何商業
潛力?
原文連結:
※網址超過一行過長請用縮網址工具
https://www.bnext.com.tw/article/85088/marble-world-model
發布時間:
※請以原文網頁/報紙之發布時間為準
2025.11.13
記者署名:
※原文無記載者得留空
陳建鈞
原文內容:
由AI教母李飛飛共同創辦、著眼空間運算的新創World Labs,如今推出了首款商業化產品
Marble,用戶可輸入文字、圖片或影片,即可生成一個完整的立體空間。
根據《TechCrunch》報導,距離World Labs宣佈完成2.3億美元募資大約一年時間,這間
新創公司便發布了這款生成式世界模型產品。兩個月前,該模型以Beta預覽版的形式推出
,現在也正式推出服務。
一句話、一張圖生成小小世界,世界模型「Marble」正式上線
Marble的核心能力是讓使用者透過多模態輸入,將文字提示、照片、影片、3D佈局或全景
圖,轉換為可編輯和下載的3D環境。李飛飛向媒體表示,世界模型是生成式AI時代的重大
發展,「大型世界模型是釋放AI潛能的重要一步。」
與其他生成式模型最大的差異在於,Marble是直接建立一個完整的3D環境,並且可供下載
,而不是在用戶探索過程中即時生成的世界。World Labs 表示,這能減少畫面變形或不
一致的問題,並讓用戶後續加工利用。
Marble的共同創辦人賈斯汀.強森(Justin Johnson)表示,這是一個「生成 3D 世界的
一個全新類別的模型」。強森指出,Marble未來的一個方向是創意應用,聲稱該服務具備
完善的編輯工具讓用戶反覆調整場景,其成果預計可以運用在遊戲、視覺特效和VR產品之
中。
不過,目前遊戲產業對AI的看法仍然好壞參半,近期一次遊戲開發者大會上的調查顯示,
約有3分之1受訪者對AI如何影響遊戲產業抱持負面看法,較去年的調查高出12個百分點,
AI生成內容的低劣品質、侵權等問題是許多從業人員不滿的原因。
目前在Marble網站上,用戶可以瀏覽不同作者生成的大量3D世界,又或者透過輸入提示詞
、上傳圖像影片自行創造心目中的虛擬世界。
Marble現在提供四種分層付費方案:
免費方案:提供四次文字、圖像或全景圖生成。
標準方案:每月 20 美元,包含 12 次生成,並支援多圖/影片輸入和進階編輯 。
專業方案:每月 35 美元,包含 25 次生成,提供場景擴展和商業權利 。
極致方案:每月 95 美元,包含所有功能和 75 次生成
看好空間智慧成AI新領域,李飛飛為「世界模型」寫下定義
且在World Labs推出首款產品之前,李飛飛發表了一篇宣言,聲稱空間智慧會是AI技術發
展的下一個新領域。她首先點出了大型語言模型當前的限制,形容它們就像是身處黑暗中
的語言大師,「能言善道卻缺乏經驗,博學多聞但沒有根基。」
她指出,空間智慧徹底改變創造及體驗現實與虛擬世界的方式,顛覆敘事、創造、機器人
技術、科學發現等眾多領域。尤其是機器人技術,她認為缺乏對物理世界的感知及理解能
力,是機器人技術發展的最大限制,賦予機器人空間智慧將對眾多產業帶來深遠影響。
不過世界模型目前仍是個相對模糊的新興概念。例如,Meta首席AI科學家楊立昆(Yann
LeCun)認為它是AI發展的未來,但更側重於AI的自主學習與因果理解。而在她的宣言中
,李飛飛則以三種核心能力為基礎,為世界模型下了明確定義。
生成能力(Generative):模型能生成多樣且合理的世界。
世界模型能「自己生成」世界。
生成的世界要在感知、幾何、物理上合理,並且多樣化。
模型應該理解世界的過去狀態,並保持與現在的一致性。
不論是虛擬空間還是真實場景,都能生成可觀察、可使用的世界狀態。
多模態(Multimodal):模型能從多種資訊理解世界
世界模型能接收各種形式的資訊:圖片、影片、深度圖、文字、手勢或動作。
它能把這些部分訊息整合成完整的世界狀態,像人類或動物一樣理解世界。
也能用多種方式與人或代理互動,輸入和輸出不侷限單一形式。
互動能力(Interactive):模型能根據動作或目標預測世界變化。
世界模型能根據動作或目標預測世界的下一步狀態。
輸出會符合物理規律、語義、動態行為,保持前後一致。
強大的模型甚至可以在目標驅動下,不只預測世界狀態,還能預測下一步行動。
她在文章的最後寫道,空間智慧能提昇人們最為重視的生活品質。在空間智慧能力誕生在
生物身上至今5億年,人類終於有機會將這項能力賦予機器,並造福世界各地的人們,「
如果沒有空間智慧,我們對真正智慧機器的夢想是不完整的。」
心得/評論:
※必需填寫滿30正體中文字,無意義者板規處分
理組的世界模型要上了
不過不知道效果如何?
但應該還是需要更大的算力
更大的記憶體吧?
重點是演算法還是transformer?
還是還在尋找更佳的演算法?
還是理組模型只要理解
不需要死背
所以算力記憶體需求大幅減少?
不可能吧......
等大神開示...
99NV
99MU
99BRCM
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.146.68 (臺灣)
※ 文章網址: https://webptt.cc/bbs/Stock/M.1763042767.A.DAB.html
※ 編輯: jerrychuang (118.160.146.68 臺灣), 11/14/2025 07:50:51
推文 (103)
推
odddriver
挖感覺很猛
11/13 22:07
推
DreamW
看成李發發
11/13 22:17
→
JoeyChen
上去看了那些作品 它的用途是創建風格化的場景嗎?
11/13 22:19
推
gk1329
做遊戲更簡單惹
11/13 22:20
推
northsoft
是說生這個要幹嘛?
11/13 22:22
→
yesonline
https://marble.worldlabs.ai/
11/13 22:23
推
duriamon
沒什麼用的東西,這東西就只是個3D建模AI,跟她宣稱
11/13 22:25
→
duriamon
的什麼大語言模型的未來沒什麼半毛錢關係,就整天吹
11/13 22:25
→
duriamon
而已,笑死!
11/13 22:25
→
yesonline
先讓投資者看到東西啦. 這樣後續才能繼續注資...
11/13 22:26
推
joshddd
技術細節 沒有透漏嗎?
11/13 22:40
推
tanby
3D世界建起來後 接著就是包含物理特性 後續延伸的
11/13 22:41
→
tanby
東西很多
11/13 22:41
→
ActionII
文字資料到頭了,開始理解視覺資料很正常吧
11/13 22:48
→
ActionII
可以理解3d 物理世界,比大語言模型更有用惹
11/13 22:49
→
truehero
世界模型產生模擬資料訓練機器人阿
11/13 22:56
推
Obama19
AI教母來了
11/13 22:59
推
cphe
看來AI泡沫就是笑話了
11/13 23:06
→
mokumoku
這說真的滿猛的
11/13 23:09
推
epephanylo
感覺對遊戲業是個好消息
11/13 23:09
推
guanting886
目前看起來像是擴散模型3D版 後面的物理/物體結構
11/13 23:15
→
guanting886
Ai什麼的應該沒有生成出來相關參數 看起來比較能
11/13 23:15
→
guanting886
輔助AR/VR開發的快速建模
11/13 23:15
→
guanting886
但整到遊戲去開發者可能更痛苦
11/13 23:16
→
guanting886
待教母補完後面那段
11/13 23:17
推
epephanylo
點了幾個演示,他根本沒建模 XD
11/13 23:19
→
epephanylo
就是搞了個蛋貼個圖假3D這樣 只能當作概念溝通用吧
11/13 23:19
推
bj45566
還是希望多一點人才投入研發世界模型
11/13 23:22
推
Lowpapa
Fake
11/13 23:30
推
madeinheaven
沒啥用
11/13 23:53
推
NCCUexpert
沒啥用,沒看出價值我太膚淺了嗎
11/14 00:11
推
odddriver
一個能做遊戲,一個給機器人用
11/14 00:18
→
odddriver
馬斯克做世界模型也是一樣概念,就是遊戲也能用
11/14 00:19
推
nfsong
教母
11/14 00:25
推
nfsong
https://www.youtube.com/watch?v=8OhrVkDRN2Y
11/14 00:28
→
nfsong
一張圖 生成3D 地圖
11/14 00:29
→
nfsong
未來 遊戲引擎越來越容易
11/14 00:29
→
nfsong
先生成2D 美術圖 然後轉3D圖
11/14 00:29
→
nfsong
以前很多 美術渲染很困難
11/14 00:31
→
nfsong
現在 就是先生成 1萬種藝術風格
11/14 00:31
→
nfsong
然後1萬種風格 帶入遊戲引擎 產1萬種地圖
11/14 00:32
→
nfsong
demo 快很多
11/14 00:32
→
nfsong
其實 現在AI產很多 細緻的圖 已經是美術設計辦不到
11/14 00:33
→
atari77
用文字與圖片就可生成3D世界模型哪不厲害 超強好嗎
11/14 00:33
→
nfsong
細節很多的 要再產3D 更難
11/14 00:34
→
atari77
燈光貼圖都弄好 對動畫與遊戲省多大的工夫人力成本
11/14 00:34
→
atari77
再稍微做一些微調就能符合需求 超好用
11/14 00:35
→
nfsong
譬如Steampunk 建上萬個齒輪
11/14 00:35
→
nfsong
建模還不建到死
11/14 00:35
推
nfsong
主要是想 橋接物理世界
11/14 00:39
→
nfsong
應用在機器人身上 就是視覺空間化
11/14 00:40
→
nfsong
很久以前採訪她 就有說 主要是為機器人橋接物理
11/14 00:40
→
nfsong
世界
11/14 00:41
→
DrTech
怎麼那麼多人大開眼界,文字轉3D技術,隨便一個大學
11/14 01:16
→
DrTech
生都能做的技術,都開源一堆了也那麼驚訝
11/14 01:16
→
DrTech
隨便舉例:https://github.com/Tencent-Hunyuan/Hun
11/14 01:17
→
DrTech
yuan3D-2.1 這都出來多久了。
11/14 01:17
→
DrTech
文字或圖片產出3D場景根本沒什麼技術。精確度能不能
11/14 01:19
→
DrTech
達到工業級才是重點。給機器人學又更好笑了,物理精
11/14 01:19
→
DrTech
度或視覺真實那麼差的環境,機器人學了也不能用。
11/14 01:19
推
nfsong
不一樣的東西吧
11/14 01:30
→
nfsong
混元3D 是一般的3D 建模 沒有建空間
11/14 01:31
推
nfsong
HunyuanWorld-1.0
11/14 01:33
→
nfsong
就是李飛飛在做的東西
11/14 01:33
→
nfsong
https://techcrunch.com/2025/11/12/fei-fei-lis-
11/14 01:37
→
nfsong
world-labs-speeds-up-the-world-model-race-
11/14 01:38
→
nfsong
with-marble-its-first-commercial-product/
11/14 01:39
→
nfsong
比較的好像是 Google’s Genie
11/14 01:40
→
nfsong
能夠很好的生成一個空間 就能生成更多
11/14 01:41
→
nfsong
譬如迷宮生成
11/14 01:42
→
nfsong
主要還是描述真實物理世界
11/14 01:43
推
tanby
混元模型跟這個技術效果差很多 要不要先去用用看再
11/14 01:46
→
tanby
來講啊
11/14 01:46
推
nfsong
應該是 混元世界模型
11/14 01:47
→
nfsong
B站 有人在實測marble 了 好像蠻爛的 haha
11/14 01:47
→
nfsong
剛開始
11/14 01:48
推
nfsong
就是 拿混元世界 比marble ...兩個一樣爛
11/14 01:50
→
nfsong
剛開始疊代吧
11/14 01:51
推
nfsong
和leaderboard LLM 好像也有 3D場景的指標數值
11/14 01:53
→
nfsong
慢慢會變強吧
11/14 01:53
推
tanby
要拿混元世界-mirror 模型來比才是,生成的東西差
11/14 01:54
→
tanby
不多
11/14 01:54
推
nfsong
和前兩天 FAIR 田渊栋說的
11/14 01:55
→
nfsong
這東西要變成framework給人用 應該會走開源路線
11/14 01:56
→
nfsong
現在是 domain 模型 產業模型大爆炸時代
11/14 01:57
→
nfsong
人人都在做模型
11/14 01:58
推
nfsong
撇除 細節 這東西 拿來DEMO給甲方 蠻適合的
11/14 02:02
→
nfsong
是不是 甲方要的 一個眼緣 送甲方1000個世界渲染
11/14 02:03
→
nfsong
包含 室內設計喔
11/14 02:03
推
ggirls
教母漂亮嗎
11/14 03:56
推
qwe78971
懶得看 Ai要做3D遊戲還太勉強了 光生出幾千面的模
11/14 04:49
→
qwe78971
型 問題就大到不行 不是人人拿頂尖顯卡在玩耶
11/14 04:49
推
chienk
哇。產品落地。 濾鏡拿掉了。
11/14 07:42
→
a9564208
這對傳媒娛樂產業很有幫助
11/14 07:59
→
csyang
真的很討厭名字有疊字耶~
11/14 08:30
推
smallkop
阿靠北這不就元宇宙
11/14 08:30
→
pov
ANN都要大量訓練資料 跟生物神經運作方式本質不同
11/14 11:05
→
loking
以後搭配vr 可以一直發現新世界 不會地圖玩膩
11/14 11:46
推
decorum
有什麼運用可能要後續開發者去拓展 原創團隊未必能
11/14 12:45
→
decorum
預先設想到其潛力
11/14 12:45
噓
quartics
世界模型也達不到AGI
11/14 14:30
推
bnd0327
空間智能方向是必要的,但輸入輸出還有待定義
11/14 15:41
→
bnd0327
要像ChatGPT那樣給公眾玩就是變這種玩具樣
11/14 15:42