OpenAI發(fā)布兩款開源推理模型gpt-oss-120b和gpt-oss-20b,分別具有1170億和210億參數(shù),可運行代碼并與外部系統(tǒng)交互。其中20b版本僅需16GB顯存,適合設備端部署。同時Anthropic推出Claude Opus 4.1升級版,在編程能力測試中得分提升至74.5%,并改進了研究和數(shù)據(jù)分析功能。
舊金山AI研究初創(chuàng)公司Deep Cogito發(fā)布四款新的大語言模型,參數(shù)規(guī)模從700億到6710億不等。這些模型采用混合推理系統(tǒng)設計,能夠學習更有效的推理方式并自我改進。通過迭代蒸餾放大技術,模型將推理過程內(nèi)化到訓練中,發(fā)展出"機器直覺",使用比同類模型短60%的推理鏈條就能達到相似性能。模型在數(shù)學、法律推理和多跳問題等任務中表現(xiàn)出色,訓練成本僅350萬美元。
AlphaOne 框架使開發(fā)者能在模型推理過程中靈活調(diào)節(jié)“慢思考”與“快思考”,從而提高復雜任務的準確性與效率,同時降低計算成本。
Google 發(fā)布新一代 AI 模型 Gemini 2.5,在 LMArena 評測中位居榜首。該模型采用遞歸分析方法提供輸出,在推理、科學、數(shù)學和代碼生成等方面表現(xiàn)出色。目前已向付費高級用戶開放使用,并將在 2025 年投入 750 億美元用于 AI 開發(fā),以爭奪未來萬億規(guī)模的 AI 市場。
xAI 推出新一代人工智能模型 Grok-3,計算能力大幅提升,新增高級推理功能。該模型在初步測試中表現(xiàn)優(yōu)于同類產(chǎn)品,并推出"思考"和"大腦"兩種推理模式。xAI 還將推出名為"深度搜索"的 AI 代理產(chǎn)品。Grok-3 致力于追求真相,即使可能與政治正確相悖。
微軟宣布將OpenAI的GPT-o1推理模型免費集成到Copilot中,增強其推理能力。這一決定緊隨Microsoft 365漲價和競爭對手DeepSeek發(fā)布免費開源AI模型之后。GPT-o1作為鏈式思考模型,可通過產(chǎn)生中間輸出來改善結果質(zhì)量。此舉旨在應對市場競爭,但也引發(fā)了對"免費"定義的爭議。