
從“Chat”到“Act”:AutoGLM 如何引領(lǐng) AI 智能設(shè)備新范式?

智譜AI率先推出了 AutoGLM,試圖打造一款能夠理解、規(guī)劃、執(zhí)行,并最終實(shí)現(xiàn)“無(wú)人駕駛”操作系統(tǒng)的 AI Agent。
近年來(lái),人工智能領(lǐng)域風(fēng)起云涌,而大模型技術(shù)的崛起無(wú)疑是其中最耀眼的“明星”。它不僅重新定義了人機(jī)交互的方式,更在各行各業(yè)掀起了一場(chǎng)顛覆性的革命。然而,當(dāng)下的 AI 應(yīng)用大多停留在“聊天機(jī)器人”的階段,人們期待著 AI 能夠更進(jìn)一步,從“Chat”走向“Act”,真正成為解決實(shí)際問(wèn)題、提升效率的得力助手。
面對(duì)這一需求和挑戰(zhàn),智譜AI率先推出了 AutoGLM,試圖打造一款能夠理解、規(guī)劃、執(zhí)行,并最終實(shí)現(xiàn)“無(wú)人駕駛”操作系統(tǒng)的 AI Agent。 然而,通往未來(lái)的道路并非一帆風(fēng)順,AutoGLM 的出現(xiàn)也引發(fā)了人們的諸多疑問(wèn):它究竟強(qiáng)大到什么程度?能否真正解放人們的雙手?又將如何改變我們的生活和工作方式?
從簡(jiǎn)單操作到復(fù)雜任務(wù):AutoGLM 不斷進(jìn)化
起初,AutoGLM 只能完成一些簡(jiǎn)單的手機(jī)操作,例如點(diǎn)外賣(mài)、發(fā)朋友圈、領(lǐng)紅包等。然而,在不斷的迭代升級(jí)中,它展現(xiàn)出了驚人的學(xué)習(xí)能力和執(zhí)行力。如今,AutoGLM 已經(jīng)能夠挑戰(zhàn)更加復(fù)雜的任務(wù)。
可以實(shí)現(xiàn)超長(zhǎng)任務(wù)。能在無(wú)需人為干預(yù)的情況下自主執(zhí)行超過(guò) 50 步的操作,例如自動(dòng)完成一份復(fù)雜的采購(gòu)清單。
AutoGLM 實(shí)現(xiàn)了跨 App 操作。AutoGLM打破了應(yīng)用之間的壁壘,能根據(jù)用戶的指令在不同 App 間自由切換,例如一邊瀏覽商品信息,一邊自動(dòng)打開(kāi)購(gòu)物 App 下單。
理解能力不斷提升,避免了繁瑣的指令,可對(duì)用戶的短指令進(jìn)行理解。AutoGLM不再需要冗長(zhǎng)的指令描述,只需簡(jiǎn)單幾個(gè)字,就能理解用戶的意圖,例如用戶只要說(shuō)出“點(diǎn)咖啡”,就能自動(dòng)完成咖啡預(yù)訂的所有步驟。用戶不必記住冗長(zhǎng)的咖啡的具體品名,他會(huì)根據(jù)用戶以往的習(xí)慣進(jìn)行自助選擇。
還可以采用“隨便模式”。即在用戶沒(méi)有明確指示的情況下,根據(jù)用戶的意圖主動(dòng)做出決策,可以據(jù)用戶的口味偏好推薦咖啡。按智譜 CEO 張鵬的說(shuō)法,這就是一個(gè)“盲盒模式”能讓用戶能感受到不一樣的“新奇體驗(yàn)”。
這些功能的實(shí)現(xiàn),得益于 AutoGLM 在泛化能力、思維鏈能力上的突破。它能夠?qū)⒂脩舻闹噶畈鸾獬梢幌盗懈?xì)化的步驟,并調(diào)用不同的應(yīng)用程序來(lái)完成,真正實(shí)現(xiàn)了從“被動(dòng)執(zhí)行”到“主動(dòng)思考”的轉(zhuǎn)變。
從手機(jī)到電腦:GLM-PC 開(kāi)啟“無(wú)人駕駛”新時(shí)代
除了手機(jī)端的 AutoGLM,智譜AI 還推出了面向 PC 端的 GLM-PC,試圖打造一款能夠“像人一樣操作電腦”的 AI Agent。目前,GLM-PC 已經(jīng)能夠?qū)崿F(xiàn):
會(huì)議替身: 自動(dòng)預(yù)定會(huì)議、發(fā)送會(huì)議紀(jì)要。
文檔處理: 下載、發(fā)送、理解和總結(jié)文檔。
網(wǎng)頁(yè)搜索與總結(jié): 在指定平臺(tái)搜索關(guān)鍵詞,并對(duì)搜索結(jié)果進(jìn)行閱讀和總結(jié)。
遠(yuǎn)程和定時(shí)操作: 通過(guò)手機(jī)遠(yuǎn)程控制電腦,或設(shè)定定時(shí)任務(wù)。
隱形屏幕: 在用戶工作時(shí),在后臺(tái)執(zhí)行任務(wù),不占用屏幕資源。
GLM-PC 的出現(xiàn)意味著 AI Agent 不再局限于移動(dòng)端,而是開(kāi)始向更加復(fù)雜、應(yīng)用場(chǎng)景更加豐富的 PC 端拓展。雖然現(xiàn)階段 GLM-PC 的功能還比較有限,需要用戶輸入非常精準(zhǔn)的指令,但它所展現(xiàn)出的潛力無(wú)疑是巨大的。
從 L1 到 L5:AI Agent 發(fā)展之路任重道遠(yuǎn)
Agent將迎來(lái)高速發(fā)展期。Gartner預(yù)測(cè),到2028年,至少15%的日常工作決策將通過(guò)人工智能代理自主完成(這一比例在2024年尚為0%)這依賴(lài)于強(qiáng)大的大模型能力。為此智譜AI將大模型能力的演進(jìn)劃分為五個(gè)階段:
L1 語(yǔ)言能力: 能夠理解和生成自然語(yǔ)言。
L2 邏輯能力: 能夠進(jìn)行邏輯推理和問(wèn)題求解。
L3 使用工具的能力: 能夠使用各種工具完成任務(wù)。
L4 自我學(xué)習(xí)能力: 能夠自主學(xué)習(xí)和改進(jìn)自身的能力。
L5 探究科學(xué)規(guī)律: 能夠像科學(xué)家一樣探索未知領(lǐng)域。
張鵬介紹道,目前大模型在 L1 和 L2 階段已經(jīng)取得了顯著進(jìn)展,但在 L3 工具使用能力方面還處于早期階段。AutoGLM 和 GLM-PC 的出現(xiàn),正是為了推動(dòng) AI Agent 在 L3 階段的快速發(fā)展,最終實(shí)現(xiàn) L4 自我學(xué)習(xí)能力的突破。
AutoGLM 和 GLM-PC 的出現(xiàn),意味著 AI 不再僅僅是冷冰冰的代碼,而開(kāi)始擁有了“手”和“眼”,能夠像人一樣與現(xiàn)實(shí)世界進(jìn)行交互。這不僅將徹底改變?nèi)藱C(jī)交互的方式,更將催生出全新的應(yīng)用場(chǎng)景和商業(yè)模式。
智譜不僅要讓AI的能力局限在手機(jī)和電腦,還會(huì)將他擴(kuò)展到不同的領(lǐng)域:手機(jī)+AI 會(huì)成為人們隨時(shí)隨地的個(gè)人智能助理,PC+AI 將會(huì)成為企業(yè)和個(gè)人的全新生產(chǎn)力工具,汽車(chē)+AI 將會(huì)讓汽車(chē)變?yōu)槿藗兊闹悄艿谌羁臻g。
而這些不僅僅是智譜的暢想,現(xiàn)在有很多場(chǎng)景都已落地。在AI與手機(jī)的結(jié)合中,榮耀手機(jī)的很多典型應(yīng)用已結(jié)合了智譜GLM大模型。榮耀 AI 技術(shù)總監(jiān)王作建表示,智譜GLM模型已在YoYo助理、榮耀筆記、榮耀文檔產(chǎn)品中規(guī)模上線,給用戶帶來(lái)了全新體驗(yàn)。
華碩 AIPC 智能生態(tài)負(fù)責(zé)人鐘懷圣對(duì)華碩與智譜的合作充滿了更多期望,他表示,將和智譜共同打造云端一體的AIPC智能助手。在內(nèi)容提煉、軟件控制、AI創(chuàng)作、個(gè)人知識(shí)庫(kù)、AI聊天、硬件體驗(yàn)等場(chǎng)景不斷發(fā)掘AI的創(chuàng)新能力。不僅如此,智譜不斷在不斷擴(kuò)大著自己的朋友圈,從小鵬汽車(chē)到高通、英特爾、以及眾多賦能2B、2G的合作伙伴……
正如張鵬所說(shuō):“我們期待著 AI 不再局限于語(yǔ)言交互,而是能夠做更多的事情。”
在不久的將來(lái),各種 AI 原生設(shè)備將如雨后春筍般涌現(xiàn),一個(gè)由 AI Agent 驅(qū)動(dòng)的智能時(shí)代即將到來(lái)。 在這個(gè)過(guò)程中,智譜AI 將繼續(xù)深耕大模型技術(shù),與合作伙伴攜手共進(jìn),共同推動(dòng) AI Agent 技術(shù)的進(jìn)步和應(yīng)用落地,為人類(lèi)創(chuàng)造更加美好的未來(lái)。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼
