谷歌DeepMind推出Genie 3"世界模型",僅需提示詞或圖像即可創(chuàng)建交互式世界。該模型支持720p分辨率24幀每秒的實(shí)時(shí)渲染,相比前代產(chǎn)品顯著提升了視覺保真度和記憶能力,可保持?jǐn)?shù)分鐘的視覺一致性。用戶能夠?qū)崟r(shí)修改環(huán)境、添加對(duì)象、改變天氣或插入新角色。DeepMind將其視為AI研究工具,用于訓(xùn)練embodied agents并生成合成訓(xùn)練數(shù)據(jù)。盡管仍存在局限性如無法模擬真實(shí)地點(diǎn)、易產(chǎn)生AI幻覺等,但該技術(shù)為游戲開發(fā)和AGI研究提供了新可能性。