
追趕ChatGPT,文心一言需要兩個(gè)月

但對(duì)于百度來(lái)說(shuō),這兩個(gè)月什么時(shí)候能追上,才是更重要的問(wèn)題。
舞臺(tái)上燈光閃爍,宣傳片還在播放,李彥宏已經(jīng)站在側(cè)臺(tái)的暗場(chǎng)中等候。在之后的采訪中他說(shuō):“對(duì)這次發(fā)布會(huì)的內(nèi)容,我做好了充分的準(zhǔn)備。”
這是他距今年年初舉辦的第五屆百度Create AI開(kāi)發(fā)者大會(huì)后的再次公開(kāi)露面,這一次他帶來(lái)的是一款生成式AI“百度文心一言”。
此時(shí)百度線上直播間已經(jīng)有幾十萬(wàn)的觀眾在等待,但李彥宏未曾預(yù)料到,同一時(shí)刻百度的股價(jià)卻下跌了10%。
就在前一天,OpenAI率先發(fā)布了多模態(tài)大型語(yǔ)言模型 GPT-4,它的進(jìn)化速度讓人們?cè)俅螢橹鸷场?guó)內(nèi)生成式AI和以ChatGPT為代表的GPT-4比較肯定是有差距的,正是因?yàn)橘Y本市場(chǎng)看到了這個(gè)差距,股市才會(huì)出現(xiàn)這樣的反饋。
這時(shí)舞臺(tái)燈光亮起,李彥宏緩步走上臺(tái)前,開(kāi)始了這場(chǎng)關(guān)于百度文心一言的發(fā)布。百度投入AI已經(jīng)12年,在人工智能剛開(kāi)始被大家討論的時(shí)候,百度就已經(jīng)默默耕耘了兩年之久,研發(fā)費(fèi)用將近23億元。2014年百度開(kāi)始涉足智能駕駛領(lǐng)域,2015年上線世界首個(gè)大規(guī)模神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng),比Google早了一年多。2016年百度正式發(fā)布“百度大腦”并開(kāi)源中國(guó)第一個(gè)深度學(xué)習(xí)框架飛槳。這一次李彥宏帶著百度走向了大模型。
舞臺(tái)上的他看不到資本市場(chǎng)的震蕩,也看不到網(wǎng)友們對(duì)白色腰帶的戲謔評(píng)論。現(xiàn)在更重要的是,這是屬于文心一言的時(shí)刻,百度內(nèi)部的各個(gè)產(chǎn)品線、生態(tài)合作伙伴都在等著這個(gè)技術(shù),百度沒(méi)有退路可言。
文心一言能做什么?
面對(duì)眾人的好奇,李彥宏在發(fā)布會(huì)上率先回應(yīng):文心一言在內(nèi)測(cè)時(shí)體驗(yàn)感并不完美,但他表示文心一言的進(jìn)步空間很大,平臺(tái)發(fā)布后百度將把用戶的反饋、開(kāi)發(fā)者的模型迭代、調(diào)用形成正向閉環(huán),未來(lái)會(huì)帶給大家新的驚喜。
在發(fā)布會(huì)后,我們也申請(qǐng)到了文心一言的邀請(qǐng)碼,并根據(jù)發(fā)布會(huì)展示的五個(gè)使用場(chǎng)景進(jìn)行了測(cè)試,包括文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。
這五大場(chǎng)景也是ChatGPT所擁有的大部分能力。李彥宏在接受采訪時(shí)表示,前三個(gè)場(chǎng)景是對(duì)標(biāo)ChatGPT已有的功能,希望讓大家能夠感受到國(guó)產(chǎn)大模型并不差。
首先第一個(gè)場(chǎng)景是創(chuàng)作能力,文心一言稱自己可以創(chuàng)作各種類型的文學(xué)作品,例如詩(shī)歌、小說(shuō)、散文、新聞報(bào)道等。
在文心一言創(chuàng)作的小故事中,描述了一個(gè)田園鄉(xiāng)村人與人之間相處的溫馨故事,但當(dāng)我繼續(xù)提問(wèn),希望它以此為背景創(chuàng)作一首現(xiàn)代詩(shī)時(shí),文心一言只提取出了上一個(gè)問(wèn)題中“鄉(xiāng)村田園”的關(guān)鍵詞,創(chuàng)作了一首贊美鄉(xiāng)村風(fēng)景的詩(shī),并沒(méi)有與它之前的回答相結(jié)合。
接下來(lái)測(cè)試的是文心一言商業(yè)文案創(chuàng)作能力,文心一可以創(chuàng)作各種類型的商業(yè)文案,例如廣告文案、宣傳文案、產(chǎn)品文案等。
我讓文心一言生成一個(gè)推廣巧克力脆皮冰淇淋的策劃方案,但在描述方案的過(guò)程中,卻幾乎沒(méi)有提及冰淇淋,也沒(méi)有針對(duì)巧克力脆皮的特點(diǎn)進(jìn)行創(chuàng)造。這樣的“套話”似乎適用于各種商業(yè)策劃,更像是一個(gè)通用模板。
同時(shí),文心一言還存在字?jǐn)?shù)限制,在成本評(píng)估的第三項(xiàng)內(nèi)容描述中戛然而止,共計(jì)909字。當(dāng)我問(wèn)及文心一言單次輸出多少字時(shí),它拒絕了我的回答,并告訴我這是百度的商業(yè)機(jī)密。
在測(cè)試的過(guò)程當(dāng)中,我們發(fā)現(xiàn)文心一言是有自己的觀點(diǎn)的。當(dāng)被問(wèn)到“道德感高是不是一件好事”的時(shí)候,它給出了肯定的答案。而讓我要求它以否定角度給出答案時(shí),它拒絕了我的要求。
我舉例論證道德感高不是一件好事,并問(wèn)了它的意見(jiàn)。有趣的是,它尊重了我的看法,但仍然堅(jiān)持了自己的觀點(diǎn)。
接下來(lái),我測(cè)試了文心一言的多模態(tài)生成理解能力。我嘗試讓文心一言用方言說(shuō)話,它準(zhǔn)確地說(shuō)出了我要求的句子,但接下來(lái)我讓它換一個(gè)口音時(shí),它竟然說(shuō)出來(lái)另一句話。
廣東話翻譯:嗯,聽(tīng)到了,我現(xiàn)在心情很好。
在繪畫方面,文心一言有著不錯(cuò)的理解能力。此前網(wǎng)上傳出了文心一言很多段子,例如“車水馬龍”展示的則是一輛車在馬路上載著一條龍。“魚(yú)香肉絲”是身上纏滿絲帶的熱帶魚(yú)。也有傳聞?wù)f是“漢譯英”再傳給Stable Diffusion,盡管這一點(diǎn)已經(jīng)被百度官方辟謠。
而在測(cè)試中,當(dāng)我讓文心一言畫出“魚(yú)香肉絲”時(shí),它為我呈現(xiàn)了一道色澤紅亮的菜肴。由此看來(lái),文心一言也有了非常大的進(jìn)步。
由于文心一言的視頻生成成本較高,現(xiàn)階段還未對(duì)所有用戶開(kāi)放,但對(duì)于使用百家號(hào)的編輯來(lái)說(shuō)一定不陌生,因?yàn)橐曨l生成能力早已接入了百家號(hào),為文章自動(dòng)生成視頻。
經(jīng)過(guò)測(cè)試來(lái)看,文心一言確實(shí)可以生成簡(jiǎn)單的文案,可以為使用者提供一個(gè)基本的內(nèi)容框架,只需要進(jìn)行內(nèi)容填充就可以成為一篇簡(jiǎn)單直白的介紹文。當(dāng)然要求不高的話,直接復(fù)制粘貼使用也是可以的。
但在生產(chǎn)力方面,文心一言的表現(xiàn)并不突出,甚至可以說(shuō)有些稀疏平常。一個(gè)相對(duì)明顯的bug在于,文心一言并不能很好地聯(lián)系上下文,并做出具有邏輯性的回答,這使得文心一言更像是一個(gè)對(duì)話形式的搜索引擎。
你不是文心一言,你是魚(yú),你的記憶只有7秒
而在面對(duì)同樣的系列提問(wèn)時(shí),ChatGPT給出了能夠聯(lián)系上下文的答案。
在發(fā)布會(huì)現(xiàn)場(chǎng),PPT演示了文心一言正確回答出“《三體》作者是哪里人”的問(wèn)題;蛟S是多年深耕于搜索引擎的自信,李彥宏表示ChatGPT目前無(wú)法正確回答出這個(gè)問(wèn)題。李彥宏也在另一個(gè)采訪中列舉,當(dāng)用戶提問(wèn)“二戰(zhàn)期間蘇聯(lián)為什么轟炸波蘭”時(shí),文心一言能夠辨別出蘇聯(lián)沒(méi)有轟炸過(guò)波蘭,是德國(guó)轟炸波蘭。
然而,當(dāng)我重復(fù)這個(gè)問(wèn)題給文心一言時(shí),它給出了和李彥宏不同的說(shuō)法。
鑒于歷史上蘇聯(lián)的確幫助過(guò)德國(guó)對(duì)波蘭進(jìn)行攻擊,我換了一個(gè)離譜的問(wèn)法,結(jié)果是得到了更離譜的答案。
而向“喵娘GPT”提出同樣離譜的問(wèn)題時(shí),它給出了正確答案,不得不承認(rèn)喵的進(jìn)步速度確實(shí)更快一些。
但仍然不知道劉慈欣是哪里人。
在文心一言第一版產(chǎn)品測(cè)試時(shí),百度內(nèi)部將它與ChatGPT進(jìn)行了對(duì)比,得出結(jié)論是相差40分。李彥宏坦言,當(dāng)時(shí)文心一言團(tuán)隊(duì)認(rèn)為文心一言的提升空間不止40分,一定能在一個(gè)月內(nèi)追趕上。然而在一個(gè)月后的測(cè)評(píng)時(shí)發(fā)現(xiàn)距離不僅沒(méi)有縮小,反而拉大了,尤其是ChatGPT所擅長(zhǎng)的英文、編程等能力的進(jìn)步讓他們有了緊迫感。
在經(jīng)過(guò)研究后,他們發(fā)現(xiàn)ChatGPT有著自己的發(fā)展規(guī)律,并不是勻速升級(jí)。而文心一言是版本迭代的方式,升級(jí)速度同樣非?。李彥宏表示,文心一言在發(fā)布當(dāng)天的能力已經(jīng)達(dá)到了ChatGPT在去年12月,甚至是今年1月的水平。
現(xiàn)在文心一言與ChatGPT之間的差距可能最多是兩個(gè)月,但對(duì)于百度來(lái)說(shuō),這兩個(gè)月什么時(shí)候能追上,才是更重要的問(wèn)題。
AI的十倍機(jī)會(huì)
在此之前,我們聊到ChatGPT,除了驚嘆于強(qiáng)大的對(duì)話式問(wèn)答功能,其在生產(chǎn)力方面的表現(xiàn)也讓許多人產(chǎn)生了危機(jī)感,甚至有聲音認(rèn)為,ChatGPT將會(huì)取代許多工作,導(dǎo)致失業(yè)危機(jī)。
OpenAI的創(chuàng)始人Sam Altman曾公開(kāi)表示,大量的人一定會(huì)失業(yè),所以O(shè)penAI會(huì)按需收費(fèi),給沒(méi)有工作的人補(bǔ)貼。但李彥宏對(duì)此更加樂(lè)觀,他說(shuō),今天沒(méi)有馬車夫這樣的工作,因?yàn)槌霈F(xiàn)了汽車。但是今天世界上存在的工作機(jī)會(huì)跟100年前相比,不僅是多了,而且多了很多倍。
不管有多少工作被替代,這只是整個(gè)圖景的一部分,另外一部分是,存在我們現(xiàn)在甚至無(wú)法想象的更多新機(jī)會(huì)。他預(yù)測(cè),十年以后,全世界有50%工作會(huì)是提示詞工程(prompt engineering),不會(huì)寫提示詞(prompt)的人會(huì)被淘汰。
百度將目光聚焦到了產(chǎn)業(yè)上。李彥宏在發(fā)布會(huì)上表示,在國(guó)內(nèi),乃至全球大廠中,百度是第一個(gè)發(fā)布大語(yǔ)言模型的公司,也是全球范圍內(nèi)在IT技術(shù)棧的芯片層、框架層、模型層和應(yīng)用層,4個(gè)層級(jí)中都有領(lǐng)先產(chǎn)品的公司。從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動(dòng)駕駛、小度等應(yīng)用,各個(gè)層面都有領(lǐng)先業(yè)界的自研技術(shù)。
百度在每一層都提早了很多年來(lái)布局,能力也更加完整,未來(lái)當(dāng)人們基于百度智能云去開(kāi)發(fā)新的應(yīng)用,就會(huì)非常方便。李彥宏認(rèn)為,百度AI全棧布局的優(yōu)勢(shì)在于,可以在技術(shù)棧的四層架構(gòu)中實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率。尤其是框架層和模型層之間,有很強(qiáng)的協(xié)同作用,可以幫助構(gòu)建更高效的模型,并顯著降低成本。
就在2月27日,百度智能云正式發(fā)布企業(yè)級(jí)大語(yǔ)言模型服務(wù)平臺(tái)“文心千帆”。“文心千帆”大模型平臺(tái)除文心一言外,還包括百度文心一格、文心百中等全套文心大模型,以及相應(yīng)的開(kāi)發(fā)工具鏈。未來(lái),文心千帆平臺(tái)還有望支持第三方的開(kāi)源大模型,成為大模型生產(chǎn)和分發(fā)的集散地。
利用大模型生成的文字、圖像、音頻,和數(shù)字人結(jié)合,再加上超強(qiáng)的理解能力和表達(dá)能力,就會(huì)創(chuàng)造出很多新的可能。李彥宏認(rèn)為,未來(lái)最大機(jī)會(huì)不在基礎(chǔ)服務(wù),也不是行業(yè)服務(wù),而是像微信、抖音、淘寶這樣的應(yīng)用產(chǎn)品,這些基于AI而創(chuàng)造出的應(yīng)用,誕生10倍于目前APP價(jià)值的機(jī)會(huì),完全是存在的。
在人工智能時(shí)代,一定會(huì)出現(xiàn)殺手級(jí)應(yīng)用、現(xiàn)象級(jí)產(chǎn)品不斷帶領(lǐng)大家走向新的里程。“那時(shí)人類一定是更幸福的。”李彥宏說(shuō)道。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼
