Google 發(fā)布全新的 Gemini 2.5 Pro 實(shí)驗(yàn)版模型,號(hào)稱是其"最智能"的 AI 模型。該模型具備 100 萬 token 的上下文窗口、多模態(tài)處理能力和推理能力,在多項(xiàng)基準(zhǔn)測試中表現(xiàn)優(yōu)異。測試結(jié)果表明,這是目前最令人印象深刻的生成式 AI 模型之一。
Microsoft 在其 AI 聊天機(jī)器人應(yīng)用 Microsoft 365 Copilot 中引入了"深度研究"AI 工具。新增的 Researcher 和 Analyst 功能結(jié)合了 OpenAI 的深度研究模型和推理模型,可以進(jìn)行復(fù)雜分析和數(shù)據(jù)處理。這些工具不僅能訪問網(wǎng)絡(luò)數(shù)據(jù),還可以連接企業(yè)內(nèi)部數(shù)據(jù)源,為用戶提供更全面的研究支持。
本文探討了是否真正需要追求通用人工智能(AGI)的問題。文章提出了幾個(gè)觀點(diǎn):AGI可能過于復(fù)雜且成本高昂;現(xiàn)有AI技術(shù)已經(jīng)足夠強(qiáng)大,我們更需要關(guān)注如何整合和應(yīng)用;AGI可能帶來意想不到的風(fēng)險(xiǎn)。作者認(rèn)為,目前我們應(yīng)該專注于充分利用現(xiàn)有AI能力,而不是盲目追求AGI。
谷歌與計(jì)算機(jī)歷史博物館聯(lián)合發(fā)布了AlexNet的源代碼,這是一個(gè)在2012年徹底改變?nèi)斯ぶ悄茴I(lǐng)域的卷積神經(jīng)網(wǎng)絡(luò)。AlexNet證明了"深度學(xué)習(xí)"能夠?qū)崿F(xiàn)傳統(tǒng)人工智能技術(shù)無法達(dá)成的目標(biāo),標(biāo)志著人工智能領(lǐng)域的重大突破。此舉不僅為AI愛好者和研究人員提供了一個(gè)窺探計(jì)算機(jī)歷史關(guān)鍵時(shí)刻的機(jī)會(huì),也為未來的歷史學(xué)家提供了理解這項(xiàng)改變世界技術(shù)的寶貴資料。
英偉達(dá)提出"AI工廠"概念作為大規(guī)模創(chuàng)建AI系統(tǒng)的新范式,將AI開發(fā)比作工業(yè)流程:原始數(shù)據(jù)輸入,通過計(jì)算精煉,最終產(chǎn)出有價(jià)值的智能模型。本文深入探討英偉達(dá)的AI工廠愿景,解析其如何實(shí)現(xiàn)智能的工業(yè)化生產(chǎn)。
在近期舉行的Nvidia GTC 2025大會(huì)上,人工智能硬件巨頭Nvidia發(fā)布了新一代Blackwell Ultra GPU和AI數(shù)據(jù)平臺(tái)參考架構(gòu)。多家存儲(chǔ)供應(yīng)商紛紛宣布與Nvidia合作,推出針對AI工作負(fù)載優(yōu)化的存儲(chǔ)解決方案,以滿足AI訓(xùn)練和推理對高性能存儲(chǔ)的巨大需求。這標(biāo)志著存儲(chǔ)行業(yè)正在積極擁抱AI浪潮,為未來的智能計(jì)算提供強(qiáng)大的數(shù)據(jù)基礎(chǔ)設(shè)施支持。
人工智能研究者Francois Chollet聯(lián)合創(chuàng)立的非營利組織Arc Prize Foundation推出了一項(xiàng)新的挑戰(zhàn)性測試,旨在評估頂尖AI模型的通用智能水平。這項(xiàng)名為ARC-AGI-2的測試目前難倒了大多數(shù)模型,人類表現(xiàn)遠(yuǎn)超AI。測試要求AI識(shí)別視覺模式并生成正確答案,同時(shí)引入效率指標(biāo),評估AI獲取和應(yīng)用新技能的能力。
本文深入探討了一個(gè)普遍的誤解:人工通用智能(AGI)最終會(huì)演變成一個(gè)龐大的統(tǒng)一系統(tǒng)。作者認(rèn)為,基于當(dāng)前AI發(fā)展態(tài)勢,更可能出現(xiàn)多個(gè)獨(dú)立但相互關(guān)聯(lián)的AGI系統(tǒng)。文章分析了AGI之間可能的競爭與合作關(guān)系,以及這種分布式發(fā)展模式對人類社會(huì)的潛在影響。
OpenAI 的 AI 推理研究主管 Noam Brown 表示,如果研究人員早知道正確方法和算法,類似 OpenAI 的 o1 這樣的"推理"AI 模型本可以在 20 年前就出現(xiàn)。Brown 強(qiáng)調(diào)了測試時(shí)推理技術(shù)的重要性,同時(shí)指出預(yù)訓(xùn)練仍然重要。他還討論了學(xué)術(shù)界與前沿實(shí)驗(yàn)室合作的機(jī)會(huì),以及 AI 基準(zhǔn)測試的改進(jìn)空間。
SEARCH-R1 是一項(xiàng)創(chuàng)新技術(shù),通過強(qiáng)化學(xué)習(xí)方法訓(xùn)練大語言模型生成搜索查詢,并將搜索引擎檢索無縫集成到推理過程中。這項(xiàng)技術(shù)突破了傳統(tǒng) RAG 和工具使用方法的局限性,使模型能夠在推理過程中動(dòng)態(tài)獲取和利用最新的外部信息,為企業(yè)應(yīng)用提供了更智能、更可靠的 AI 解決方案。
Nvidia CEO黃仁勛在GTC 2025大會(huì)上發(fā)表重要演講,展示了公司在AI計(jì)算、推理能力和機(jī)器人技術(shù)等領(lǐng)域的最新進(jìn)展。重點(diǎn)包括Blackwell平臺(tái)性能提升40倍、開源AI工廠操作系統(tǒng)Dynamo、Rubin架構(gòu)路線圖、開源人形機(jī)器人模型Groot N1,以及與通用汽車在自動(dòng)駕駛領(lǐng)域的合作。這些舉措顯示了Nvidia從GPU制造商向全方位AI基礎(chǔ)設(shè)施公司的戰(zhàn)略轉(zhuǎn)型。
全球支付巨頭 Visa 正在利用人工智能技術(shù)提升其業(yè)務(wù)運(yùn)營。通過部署檢索增強(qiáng)生成 (RAG) 系統(tǒng),Visa 大幅提高了信息檢索速度和準(zhǔn)確性。同時(shí),Visa 還開發(fā)了安全的內(nèi)部 AI 模型,并利用深度學(xué)習(xí)來加強(qiáng)欺詐防范。這些 AI 應(yīng)用都建立在 Visa 精心構(gòu)建的多層技術(shù)架構(gòu)之上,旨在平衡創(chuàng)新與風(fēng)險(xiǎn)管理。
AI 語音克隆技術(shù)的濫用正日益成為企業(yè)面臨的重大安全威脅。近期多起高調(diào)事件顯示,不法分子利用 AI 生成的虛假音頻視頻進(jìn)行詐騙。目前許多語音克隆應(yīng)用缺乏有效防護(hù)措施,企業(yè)領(lǐng)導(dǎo)人的公開音頻很容易被用于克隆。專家呼吁采取多因素認(rèn)證等措施加強(qiáng)防范,并預(yù)計(jì)未來將出臺(tái)更多監(jiān)管措施和檢測技術(shù)來應(yīng)對這一威脅。
Google 推出了 Gemini 2.0 模型的一系列改進(jìn),包括為免費(fèi)用戶開放高級(jí)功能。用戶可以使用改進(jìn)的深度研究功能獲取詳細(xì)信息,新的推理模型還能分析搜索歷史以更好地了解用戶。Google 強(qiáng)調(diào)這些功能需要用戶選擇加入,并可隨時(shí)禁用。此外,Google 還為免費(fèi)賬戶推出了 Gems 功能,允許用戶創(chuàng)建自定義聊天機(jī)器人。
Google 宣布其 Gemini AI 的深度研究功能現(xiàn)已向所有用戶免費(fèi)開放,支持 45 種以上語言。該功能可生成復(fù)雜主題的綜合報(bào)告。Google 還推出了基于個(gè)人化的實(shí)驗(yàn)性功能,可根據(jù)用戶的 Google 應(yīng)用和服務(wù)使用情況來定制回應(yīng)。這些升級(jí)旨在提升 Gemini 的研究能力和個(gè)性化體驗(yàn)。
研究人員提出了一種名為長度控制策略優(yōu)化(LCPO)的訓(xùn)練技術(shù),可以讓開發(fā)者更好地控制大語言模型的思維鏈長度。這種方法通過在訓(xùn)練過程中引入長度約束,使模型能夠在保持準(zhǔn)確性的同時(shí)生成更簡潔的推理過程。實(shí)驗(yàn)表明,采用LCPO訓(xùn)練的模型在準(zhǔn)確性和成本之間提供了平滑的權(quán)衡,并且在相同推理長度下可以超越更大的模型。這項(xiàng)技術(shù)有望大幅降低企業(yè)應(yīng)用中推理的成本。
人工通用智能(AGI)是AI發(fā)展的終極目標(biāo),但實(shí)現(xiàn)這一目標(biāo)面臨諸多挑戰(zhàn)。本文探討了實(shí)現(xiàn)AGI的五大關(guān)鍵障礙:常識(shí)與直覺的缺乏、學(xué)習(xí)遷移能力不足、物理與數(shù)字世界的鴻溝、可擴(kuò)展性難題,以及社會(huì)信任問題?朔@些挑戰(zhàn)需要突破性技術(shù)進(jìn)展、大規(guī)模投資和廣泛的社會(huì)變革。
人工智能領(lǐng)域投資熱潮與互聯(lián)網(wǎng)泡沫有相似之處,但也存在不同。科技巨頭大舉投資AI,投資者面臨重大抉擇。有人認(rèn)為這是新時(shí)代的開端,也有人警告可能是泡沫。專家意見不一,有人看好AI前景,也有人對高估值和風(fēng)險(xiǎn)表示擔(dān)憂。關(guān)鍵在于AI能否帶來實(shí)質(zhì)性變革,以及哪些公司能在這場變革中生存下來。
OpenAI 正在推出一套新的 API 和工具,旨在幫助開發(fā)者和企業(yè)更高效地構(gòu)建基于 AI 的代理,這些代理基于 OpenAI 自家首個(gè) AI 代理 Deep Research 和 Operator 的技術(shù)。Deep Research 獨(dú)立搜索互聯(lián)網(wǎng),生成豐富、組織良好且有引用的報(bào)告,而 Operator 則根據(jù)用戶的文本指令自主控制網(wǎng)頁瀏覽器光標(biāo)并執(zhí)行諸如查找體育票或進(jìn)行預(yù)訂等操作。
SambaNova Systems 推出新的 AI 深度研究框架,可生成深度報(bào)告的速度提高 3 倍,成本大幅降低。該框架與 CrewAI 合作開發(fā),支持企業(yè)分析私密數(shù)據(jù),使用開源大語言模型和 SambaNova 的 AI 加速器,無需依賴 Nvidia GPU。新框架包含智能路由系統(tǒng),可根據(jù)需求選擇最合適的智能體,提供從基礎(chǔ)搜索到深度財(cái)務(wù)分析的全方位研究能力。