角色視頻合成的最新進(jìn)展仍然依賴于廣泛的微調(diào)或復(fù)雜的3D建模過程,這可能會限制可訪問性并阻礙實(shí)時(shí)應(yīng)用性。為了解決這些挑戰(zhàn),我們提出了一種簡單而有效的無調(diào)整框架,名為MovieCharacter,旨在簡化合成過程同時(shí)確保高質(zhì)量的結(jié)果。
由于3D內(nèi)容創(chuàng)作在AR/VR、游戲和電影行業(yè)中的廣泛應(yīng)用,它已經(jīng)引起了顯著的關(guān)注。隨著擴(kuò)散模型的發(fā)展和大規(guī)模3D對象數(shù)據(jù)集的建立,最近三代3D基礎(chǔ)生成通過微調(diào)的文本到圖像(T2I)擴(kuò)散模型以及從頭開始訓(xùn)練大型重建模型得到了廣泛的探索,引領(lǐng)了3D資產(chǎn)創(chuàng)建進(jìn)入新時(shí)代。
文本到圖像生成領(lǐng)域最近隨著擴(kuò)散模型的引入取得了顯著進(jìn)步。然而,對不 一致問題仍然缺乏合理的解釋。緩解文本提示和圖像之間的不對齊仍然是一個(gè)挑戰(zhàn)。