谷歌DeepMind發(fā)布新一代世界模型Genie 3,相比前代產(chǎn)品實現(xiàn)多項關鍵提升。新模型支持720p分辨率輸出,可持續(xù)運行數(shù)分鐘而不產(chǎn)生偽影,并首次支持實時交互和文本提示功能,用戶可通過文本指令動態(tài)改變模擬世界狀態(tài)。DeepMind將其定位為AI智能體訓練工具,可用于自動駕駛等場景的"假如"情況訓練,提高模型可靠性。
Google 正式向用戶推出 Gemini Live 的新 AI 功能,讓用戶能夠通過手機屏幕或攝像頭實時與 AI 進行交互。這項源自 "Project Astra" 的技術,可以實時解讀視頻內(nèi)容并回答相關問題。目前該功能已向 Google One AI Premium 計劃的 Gemini Advanced 訂閱用戶開放,展現(xiàn)了 Google 在 AI 助手領域的領先地位。
一段令人驚嘆又讓人不安的AI語音演示在網(wǎng)上引發(fā)熱議。2013年,斯派克·瓊斯的電影《她》描繪了一個人們與AI語音助手建立情感聯(lián)系的未來。近12年后,AI初創(chuàng)公司Sesame發(fā)布的新對話語音模型使這一虛構(gòu)的設想更接近現(xiàn)實,許多用戶對此感到既著迷又不安。