亞馬遜推出Nova Act AI代理SDK,這是一個(gè)用于構(gòu)建可自主完成網(wǎng)絡(luò)任務(wù)的AI代理的開(kāi)發(fā)工具包。它由亞馬遜自研的Nova大語(yǔ)言模型驅(qū)動(dòng),采用細(xì)粒度任務(wù)分解和直接瀏覽器操作等方法,旨在提高AI代理的可靠性。該SDK開(kāi)源,但僅支持亞馬遜Nova模型。這標(biāo)志著亞馬遜在AI代理領(lǐng)域向OpenAI、微軟等競(jìng)爭(zhēng)對(duì)手發(fā)起挑戰(zhàn)。
Amazon 發(fā)布了名為 Nova Act 的通用 AI 代理,可獨(dú)立控制網(wǎng)頁(yè)瀏覽器執(zhí)行簡(jiǎn)單操作。同時(shí)推出 Nova Act SDK,供開(kāi)發(fā)者構(gòu)建原型。Nova Act 將為即將升級(jí)的 Alexa+ 提供核心功能。Amazon 稱這是研究預(yù)覽版,開(kāi)發(fā)者可通過(guò) nova.amazon.com 訪問(wèn)工具包。Nova Act 在內(nèi)部測(cè)試中表現(xiàn)優(yōu)異,是 Amazon AGI 實(shí)驗(yàn)室的首個(gè)公開(kāi)產(chǎn)品。
Opera瀏覽器現(xiàn)在擁有“代理AI”,用戶可以請(qǐng)求內(nèi)置的AI模型執(zhí)行需要一系列瀏覽器內(nèi)操作的任務(wù)。雖然這項(xiàng)技術(shù)展示可能有趣,但實(shí)際上它只是將網(wǎng)絡(luò)瀏覽委托給一個(gè)能力有限的個(gè)人助手。AI代理被稱為瀏覽器操作員,可以幫助用戶找到可購(gòu)買(mǎi)的12雙10碼Nike襪子。盡管用戶可以在15秒內(nèi)通過(guò)訪問(wèn)Walmart在線商店完成相同操作,但這項(xiàng)技術(shù)的推出標(biāo)志著瀏覽器角色的轉(zhuǎn)變。
OpenAI 發(fā)布了一款名為 Operator 的網(wǎng)絡(luò)自動(dòng)化工具,該工具使用名為計(jì)算機(jī)使用代理 (CUA) 的新 AI 模型來(lái)控制網(wǎng)絡(luò)瀏覽器。Operator 通過(guò)視覺(jué)界面觀察和交互屏幕元素,模仿人類操作方式執(zhí)行任務(wù)。這項(xiàng)技術(shù)目前仍處于研究預(yù)覽階段,OpenAI 希望通過(guò)用戶反饋來(lái)改進(jìn)系統(tǒng)功能。
OpenAI 推出名為 Operator 的 AI 代理,可自動(dòng)執(zhí)行用戶任務(wù)。與此同時(shí),主要競(jìng)爭(zhēng)對(duì)手 Perplexity AI 和 Anthropic 也宣布了產(chǎn)品更新。Perplexity AI 在其 Android 應(yīng)用中引入類似功能,而 Anthropic 則推出了改進(jìn) AI 模型引用能力的工具。這些動(dòng)作反映了 AI 服務(wù)領(lǐng)域的激烈競(jìng)爭(zhēng)和快速發(fā)展。
OpenAI推出名為Operator的人工智能代理,能夠自主使用網(wǎng)絡(luò)瀏覽器完成各種在線任務(wù)。這項(xiàng)功能目前僅向ChatGPT Pro訂閱用戶開(kāi)放,可以執(zhí)行多步驟的復(fù)雜任務(wù),如預(yù)訂餐廳或購(gòu)買(mǎi)音樂(lè)會(huì)門(mén)票。雖然具有一定的自動(dòng)化能力,但其可靠性和準(zhǔn)確性仍有待提高。