OpenAI計劃今年晚些時候向開發(fā)者社區(qū)發(fā)布一個"開放權(quán)重"模型,這是該公司自2019年以來的首次嘗試。新模型將具備推理能力,類似于現(xiàn)有的o3-mini模型。這一戰(zhàn)略轉(zhuǎn)變旨在應(yīng)對來自競爭對手的壓力,同時為開發(fā)者提供更多定制和使用靈活性。雖然不完全開源,但這種方式可能有助于OpenAI在保持技術(shù)領(lǐng)先的同時,滿足市場對更開放AI發(fā)展的需求。
OpenAI 正在開發(fā)一款新的"開放權(quán)重"AI 語言模型,具有推理能力。這種模型介于開源和閉源之間,允許用戶查看和修改模型的權(quán)重,但不公開底層代碼。它可能與 Meta 的 Llama 等開源模型競爭,為企業(yè)提供更經(jīng)濟、可定制的 AI 工具。OpenAI 目前正征集開發(fā)者反饋,以提高模型的實用性。
來自加州帕洛阿爾托的 AI 初創(chuàng)公司 Reve AI 正式發(fā)布了 Reve Image 1.0 文本生成圖像模型。該模型在提示詞遵循度、美學(xué)效果和文字渲染方面表現(xiàn)出色,目前可在 preview.reve.art 免費體驗。作為該公司的首個產(chǎn)品,Reve Image 憑借其卓越的性能已躍居第三方基準測試榜首,超越了包括 Midjourney v6.1 和 Google Imagen 3 在內(nèi)的多個競品。
百度推出兩款強大的人工智能模型:Ernie X1 和 Ernie 4.5。Ernie X1 是一款推理模型,性能媲美 DeepSeek R1,但成本僅為后者的一半。Ernie 4.5 則是一款多模態(tài)模型,旨在與 OpenAI 的 GPT-4 競爭。這兩款模型的推出標(biāo)志著百度在人工智能領(lǐng)域的重大進展,也反映了中國科技公司在全球 AI 競賽中的激烈角逐。
Google 發(fā)布新一代輕量級開源大語言模型 Gemma 3,提供多種參數(shù)規(guī)模選擇,可在單個 GPU 上運行。該模型基于 Gemini 技術(shù),性能優(yōu)異,具備多模態(tài)能力和大上下文窗口。同時推出 ShieldGemma 2 用于圖像安全檢查,為開發(fā)者提供更多 AI 應(yīng)用開發(fā)選擇。
當(dāng)前,AI模型的推出速度令人眼花繚亂,從谷歌等大型科技公司到OpenAI和Anthropic等初創(chuàng)企業(yè)都在不斷推出新模型。跟蹤最新的AI模型可能會讓人感到不知所措。AI模型通常根據(jù)行業(yè)基準進行宣傳,但這些技術(shù)指標(biāo)往往無法真實反映人們和公司如何實際使用它們。為了幫助讀者理清思路,TechCrunch匯總了自2024年以來發(fā)布的最先進的AI模型概述,包括如何使用它們及其最佳應(yīng)用場景。我們也會持續(xù)更新這個列表,添加最新的發(fā)布信息。
Quora 旗下的 AI 平臺 Poe 推出了新功能 Poe Apps,允許用戶通過描述來創(chuàng)建基于 AI 模型的可視化應(yīng)用。用戶可以指定使用特定模型或提供一般規(guī)格。這些應(yīng)用可以與 Poe 的聊天窗口并行運行或完全可視化,底層代碼可供調(diào)整。Poe Apps 目前僅支持網(wǎng)頁版,未來將支持 iOS 和 Android。
DeepSeek公司最近發(fā)布的開源推理AI模型R1在開發(fā)者和研究人員中迅速流行,引發(fā)科技股大幅拋售。R1的出現(xiàn)以及同期宣布的Stargate項目,凸顯了AI投資和商業(yè)模式的深度不確定性。這些事件引發(fā)了關(guān)于開源vs閉源AI系統(tǒng)、硬件vs軟件優(yōu)化、以及AI公司盈利模式等多方面的爭議和思考。
Google 推出名為 Titans 的新型 AI 架構(gòu),是 Transformer 的直接進化版。Titans 引入了神經(jīng)長期記憶、短期記憶和基于驚喜的學(xué)習(xí)系統(tǒng),使 AI 更接近人類思維方式。這一突破性技術(shù)有望徹底改變 AI 范式,推動機器智能向人類認知邁進一大步。
DeepSeek 發(fā)布了新的大語言模型系列 R1,專為推理任務(wù)優(yōu)化。該系列包括兩個主要模型 R1 和 R1-Zero,采用混合專家架構(gòu),擁有 6710 億參數(shù)。R1 在多項推理基準測試中超越了 OpenAI 的 o1 模型,而 R1-Zero 則代表了機器學(xué)習(xí)研究的重大進展。DeepSeek 已在 Hugging Face 上開源了這些模型的源代碼。
在 CES 2024 上,Nvidia 發(fā)布了名為 Cosmos 的生成式 AI 技術(shù),旨在加速物理 AI 開發(fā)。該技術(shù)通過生成準確的物理感知視頻來模擬虛擬環(huán)境,可大幅減少機器人 AI 訓(xùn)練所需的資源。Cosmos 與 Nvidia 的 Omniverse 數(shù)字孿生平臺配合使用,為機器人和自動駕駛領(lǐng)域提供了全棧解決方案,有望推動 Nvidia 在這些領(lǐng)域的業(yè)務(wù)快速發(fā)展。