圖數(shù)據(jù)庫廠商N(yùn)eo4j推出Infinigraph架構(gòu),支持在單一圖數(shù)據(jù)庫平臺(tái)上運(yùn)行操作和分析工作負(fù)載,處理超過100TB規(guī)模數(shù)據(jù)而不分割圖結(jié)構(gòu)。該產(chǎn)品采用分片技術(shù),支持?jǐn)?shù)十億關(guān)系和數(shù)千并發(fā)查詢,同時(shí)保持ACID特性。新架構(gòu)可將數(shù)千萬文檔作為向量直接嵌入圖中,應(yīng)用于欺詐檢測(cè)、知識(shí)圖譜等場(chǎng)景。
人工智能芯片初創(chuàng)公司SiMa Technologies宣布其第二代系統(tǒng)級(jí)芯片平臺(tái)MLSoC Modalix正式出貨,專為多模態(tài)物理AI工作負(fù)載設(shè)計(jì)。該芯片可嵌入機(jī)器人、工業(yè)設(shè)備和車輛等設(shè)備中,支持運(yùn)行大語言模型、卷積神經(jīng)網(wǎng)絡(luò)等多種AI算法。芯片采用低功耗設(shè)計(jì),能在邊緣設(shè)備上直接處理傳感器數(shù)據(jù)并運(yùn)行AI模型,無需依賴云端處理,有效降低延遲。
新加坡AI初創(chuàng)公司Sapient Intelligence開發(fā)出層次推理模型(HRM),在復(fù)雜推理任務(wù)上匹配甚至超越大語言模型性能,同時(shí)顯著降低數(shù)據(jù)和內(nèi)存需求。該架構(gòu)模仿人腦雙系統(tǒng)運(yùn)作機(jī)制,通過高層抽象規(guī)劃模塊和低層快速計(jì)算模塊協(xié)同工作,避免了鏈?zhǔn)剿季S推理的局限性。在極難數(shù)獨(dú)和迷宮問題上,HRM僅用1000個(gè)訓(xùn)練樣本就達(dá)到近完美準(zhǔn)確率,而先進(jìn)語言模型完全失敗。
Perplexity本周發(fā)布的Comet AI瀏覽器標(biāo)志著智能代理應(yīng)用時(shí)代的到來。該瀏覽器采用AI原生設(shè)計(jì),配備能夠理解網(wǎng)頁內(nèi)容的AI助手,可在側(cè)邊欄中實(shí)時(shí)回答用戶問題。OpenAI隨即宣布將推出自己的AI瀏覽器,驗(yàn)證了這一趨勢(shì)。智能代理應(yīng)用不同于傳統(tǒng)的AI功能增強(qiáng)產(chǎn)品,而是圍繞AI能力重新構(gòu)建整個(gè)工作流程。企業(yè)需要從SEO轉(zhuǎn)向AEO優(yōu)化,為AI發(fā)現(xiàn)做好準(zhǔn)備。
檢索增強(qiáng)生成(RAG)正成為AI領(lǐng)域的關(guān)鍵技術(shù),通過結(jié)合外部信息檢索與大語言模型的生成能力,解決傳統(tǒng)模型僅依賴訓(xùn)練數(shù)據(jù)的局限性。RAG允許模型實(shí)時(shí)訪問外部數(shù)據(jù)庫或文檔,提供更準(zhǔn)確、更新的信息。該技術(shù)可應(yīng)用于企業(yè)文檔查詢、個(gè)人化AI助手等場(chǎng)景,通過向模型提供特定領(lǐng)域知識(shí)來獲得精準(zhǔn)結(jié)果。微軟專家指出,RAG有助于結(jié)合知識(shí)與推理、提高模型使用效率,并支持多模態(tài)應(yīng)用。
來自上海交通大學(xué)和浙江大學(xué)等機(jī)構(gòu)的研究團(tuán)隊(duì)開發(fā)出首個(gè)AI"記憶操作系統(tǒng)"MemOS,解決了AI系統(tǒng)無法實(shí)現(xiàn)人類般持久記憶和學(xué)習(xí)的根本限制。該系統(tǒng)將記憶視為核心計(jì)算資源進(jìn)行調(diào)度、共享和演化,在時(shí)間推理任務(wù)中相比OpenAI記憶系統(tǒng)性能提升159%。MemOS采用三層架構(gòu)設(shè)計(jì),通過標(biāo)準(zhǔn)化記憶單元實(shí)現(xiàn)跨平臺(tái)記憶遷移,有望改變企業(yè)AI部署模式。
存儲(chǔ)行業(yè)近期動(dòng)態(tài)頻繁,Arctera、Wasabi和TD SYNNEX聯(lián)合推出渠道專屬數(shù)據(jù)保護(hù)解決方案;AWS啟用EC2環(huán)境SAN啟動(dòng)功能;Broadcom發(fā)布VMware Cloud Foundation 9.0版本;Commvault與Kyndryl合作提升網(wǎng)絡(luò)彈性服務(wù);CTERA成為首家支持模型上下文協(xié)議的混合云存儲(chǔ)供應(yīng)商;多家企業(yè)獲得新一輪融資,推動(dòng)AI基礎(chǔ)設(shè)施和數(shù)據(jù)管理技術(shù)發(fā)展。
文章闡述了數(shù)據(jù)中心由傳統(tǒng)向多樣化轉(zhuǎn)型,著重介紹了Intel Xeon 6 CPU采用P核與E核雙架構(gòu),在AI、高性能計(jì)算及云邊端場(chǎng)景中實(shí)現(xiàn)高效節(jié)能的創(chuàng)新應(yīng)用。
本文介紹了 Sakana 針對(duì)語言模型提出的全新 CTM 架構(gòu),通過內(nèi)部短時(shí)記憶和自適應(yīng)運(yùn)算,令模型推理更接近人類思考方式。
Salesforce正通過構(gòu)建完整的AI全棧體系,將SaaS升級(jí)為服務(wù)即軟件,全面整合智能、記錄與交互系統(tǒng),實(shí)現(xiàn)企業(yè)生產(chǎn)效率大幅提升。
Nvidia 推出基于 BlueField 處理單元的 DOCA Argus 框架,實(shí)現(xiàn)對(duì) AI 工作負(fù)載的無代理實(shí)時(shí)威脅檢測(cè),并與 Cisco 合作,為 AI 基礎(chǔ)設(shè)施提供全方位安全防護(hù)。
Ocient成功融資4210萬美元,加速研發(fā)基于NVMe SSD與計(jì)算近接存儲(chǔ)架構(gòu)的綠色、低成本大數(shù)據(jù)與 AI 分析解決方案。