從“Chat”到“Act”：AutoGLM 如何引領(lǐng) AI 智能設(shè)備新范式？

作者：趙曉勤

2024-12-02

“

智譜AI率先推出了 AutoGLM，試圖打造一款能夠理解、規(guī)劃、執(zhí)行，并最終實(shí)現(xiàn)“無(wú)人駕駛”操作系統(tǒng)的 AI Agent。

近年來(lái)，人工智能領(lǐng)域風(fēng)起云涌，而大模型技術(shù)的崛起無(wú)疑是其中最耀眼的“明星”。它不僅重新定義了人機(jī)交互的方式，更在各行各業(yè)掀起了一場(chǎng)顛覆性的革命。然而，當(dāng)下的 AI 應(yīng)用大多停留在“聊天機(jī)器人”的階段，人們期待著 AI 能夠更進(jìn)一步，從“Chat”走向“Act”，真正成為解決實(shí)際問(wèn)題、提升效率的得力助手。

面對(duì)這一需求和挑戰(zhàn)，智譜AI率先推出了 AutoGLM，試圖打造一款能夠理解、規(guī)劃、執(zhí)行，并最終實(shí)現(xiàn)“無(wú)人駕駛”操作系統(tǒng)的 AI Agent。然而，通往未來(lái)的道路并非一帆風(fēng)順，AutoGLM 的出現(xiàn)也引發(fā)了人們的諸多疑問(wèn)：它究竟強(qiáng)大到什么程度？能否真正解放人們的雙手？又將如何改變我們的生活和工作方式？

從簡(jiǎn)單操作到復(fù)雜任務(wù)：AutoGLM 不斷進(jìn)化

起初，AutoGLM 只能完成一些簡(jiǎn)單的手機(jī)操作，例如點(diǎn)外賣(mài)、發(fā)朋友圈、領(lǐng)紅包等。然而，在不斷的迭代升級(jí)中，它展現(xiàn)出了驚人的學(xué)習(xí)能力和執(zhí)行力。如今，AutoGLM 已經(jīng)能夠挑戰(zhàn)更加復(fù)雜的任務(wù)。

可以實(shí)現(xiàn)超長(zhǎng)任務(wù)。能在無(wú)需人為干預(yù)的情況下自主執(zhí)行超過(guò) 50 步的操作，例如自動(dòng)完成一份復(fù)雜的采購(gòu)清單。

AutoGLM 實(shí)現(xiàn)了跨 App 操作。AutoGLM打破了應(yīng)用之間的壁壘，能根據(jù)用戶的指令在不同 App 間自由切換，例如一邊瀏覽商品信息，一邊自動(dòng)打開(kāi)購(gòu)物 App 下單。

理解能力不斷提升，避免了繁瑣的指令，可對(duì)用戶的短指令進(jìn)行理解。AutoGLM不再需要冗長(zhǎng)的指令描述，只需簡(jiǎn)單幾個(gè)字，就能理解用戶的意圖，例如用戶只要說(shuō)出“點(diǎn)咖啡”，就能自動(dòng)完成咖啡預(yù)訂的所有步驟。用戶不必記住冗長(zhǎng)的咖啡的具體品名，他會(huì)根據(jù)用戶以往的習(xí)慣進(jìn)行自助選擇。

還可以采用“隨便模式”。即在用戶沒(méi)有明確指示的情況下，根據(jù)用戶的意圖主動(dòng)做出決策，可以據(jù)用戶的口味偏好推薦咖啡。按智譜 CEO 張鵬的說(shuō)法，這就是一個(gè)“盲盒模式”能讓用戶能感受到不一樣的“新奇體驗(yàn)”。

這些功能的實(shí)現(xiàn)，得益于 AutoGLM 在泛化能力、思維鏈能力上的突破。它能夠?qū)⒂脩舻闹噶畈鸾獬梢幌盗懈?xì)化的步驟，并調(diào)用不同的應(yīng)用程序來(lái)完成，真正實(shí)現(xiàn)了從“被動(dòng)執(zhí)行”到“主動(dòng)思考”的轉(zhuǎn)變。

從手機(jī)到電腦：GLM-PC 開(kāi)啟“無(wú)人駕駛”新時(shí)代

除了手機(jī)端的 AutoGLM，智譜AI 還推出了面向 PC 端的 GLM-PC，試圖打造一款能夠“像人一樣操作電腦”的 AI Agent。目前，GLM-PC 已經(jīng)能夠?qū)崿F(xiàn)：

會(huì)議替身：自動(dòng)預(yù)定會(huì)議、發(fā)送會(huì)議紀(jì)要。

文檔處理：下載、發(fā)送、理解和總結(jié)文檔。

網(wǎng)頁(yè)搜索與總結(jié)：在指定平臺(tái)搜索關(guān)鍵詞，并對(duì)搜索結(jié)果進(jìn)行閱讀和總結(jié)。

遠(yuǎn)程和定時(shí)操作：通過(guò)手機(jī)遠(yuǎn)程控制電腦，或設(shè)定定時(shí)任務(wù)。

隱形屏幕：在用戶工作時(shí)，在后臺(tái)執(zhí)行任務(wù)，不占用屏幕資源。

GLM-PC 的出現(xiàn)意味著 AI Agent 不再局限于移動(dòng)端，而是開(kāi)始向更加復(fù)雜、應(yīng)用場(chǎng)景更加豐富的 PC 端拓展。雖然現(xiàn)階段 GLM-PC 的功能還比較有限，需要用戶輸入非常精準(zhǔn)的指令，但它所展現(xiàn)出的潛力無(wú)疑是巨大的。

從 L1 到 L5：AI Agent 發(fā)展之路任重道遠(yuǎn)

Agent將迎來(lái)高速發(fā)展期。Gartner預(yù)測(cè)，到2028年，至少15%的日常工作決策將通過(guò)人工智能代理自主完成（這一比例在2024年尚為0%）這依賴(lài)于強(qiáng)大的大模型能力。為此智譜AI將大模型能力的演進(jìn)劃分為五個(gè)階段：

L1 語(yǔ)言能力：能夠理解和生成自然語(yǔ)言。

L2 邏輯能力：能夠進(jìn)行邏輯推理和問(wèn)題求解。

L3 使用工具的能力：能夠使用各種工具完成任務(wù)。

L4 自我學(xué)習(xí)能力：能夠自主學(xué)習(xí)和改進(jìn)自身的能力。

L5 探究科學(xué)規(guī)律：能夠像科學(xué)家一樣探索未知領(lǐng)域。

張鵬介紹道，目前大模型在 L1 和 L2 階段已經(jīng)取得了顯著進(jìn)展，但在 L3 工具使用能力方面還處于早期階段。AutoGLM 和 GLM-PC 的出現(xiàn)，正是為了推動(dòng) AI Agent 在 L3 階段的快速發(fā)展，最終實(shí)現(xiàn) L4 自我學(xué)習(xí)能力的突破。

AutoGLM 和 GLM-PC 的出現(xiàn)，意味著 AI 不再僅僅是冷冰冰的代碼，而開(kāi)始擁有了“手”和“眼”，能夠像人一樣與現(xiàn)實(shí)世界進(jìn)行交互。這不僅將徹底改變?nèi)藱C(jī)交互的方式，更將催生出全新的應(yīng)用場(chǎng)景和商業(yè)模式。

智譜不僅要讓AI的能力局限在手機(jī)和電腦，還會(huì)將他擴(kuò)展到不同的領(lǐng)域：手機(jī)+AI 會(huì)成為人們隨時(shí)隨地的個(gè)人智能助理，PC+AI 將會(huì)成為企業(yè)和個(gè)人的全新生產(chǎn)力工具，汽車(chē)+AI 將會(huì)讓汽車(chē)變?yōu)槿藗兊闹悄艿谌羁臻g。

而這些不僅僅是智譜的暢想，現(xiàn)在有很多場(chǎng)景都已落地。在AI與手機(jī)的結(jié)合中，榮耀手機(jī)的很多典型應(yīng)用已結(jié)合了智譜GLM大模型。榮耀 AI 技術(shù)總監(jiān)王作建表示，智譜GLM模型已在YoYo助理、榮耀筆記、榮耀文檔產(chǎn)品中規(guī)模上線，給用戶帶來(lái)了全新體驗(yàn)。

華碩 AIPC 智能生態(tài)負(fù)責(zé)人鐘懷圣對(duì)華碩與智譜的合作充滿了更多期望，他表示，將和智譜共同打造云端一體的AIPC智能助手。在內(nèi)容提煉、軟件控制、AI創(chuàng)作、個(gè)人知識(shí)庫(kù)、AI聊天、硬件體驗(yàn)等場(chǎng)景不斷發(fā)掘AI的創(chuàng)新能力。不僅如此，智譜不斷在不斷擴(kuò)大著自己的朋友圈，從小鵬汽車(chē)到高通、英特爾、以及眾多賦能2B、2G的合作伙伴……

正如張鵬所說(shuō)：“我們期待著 AI 不再局限于語(yǔ)言交互，而是能夠做更多的事情。”

在不久的將來(lái)，各種 AI 原生設(shè)備將如雨后春筍般涌現(xiàn)，一個(gè)由 AI Agent 驅(qū)動(dòng)的智能時(shí)代即將到來(lái)。在這個(gè)過(guò)程中，智譜AI 將繼續(xù)深耕大模型技術(shù)，與合作伙伴攜手共進(jìn)，共同推動(dòng) AI Agent 技術(shù)的進(jìn)步和應(yīng)用落地，為人類(lèi)創(chuàng)造更加美好的未來(lái)。

本文章選自《AI啟示錄》雜志，閱讀更多雜志內(nèi)容，請(qǐng)掃描下方二維碼

四虎影视精品永久在线观看,中文字幕婷婷日韩欧美亚洲 ,婷婷成人综合激情在线视频播放,中文在线а√天堂,伊人久久大香线蕉成人

從“Chat”到“Act”：AutoGLM 如何引領(lǐng) AI 智能設(shè)備新范式？