NetApp本周推出StorageGRID對象存儲(chǔ)平臺第12版,新版本將改善AI工作負(fù)載擴(kuò)展性,先進(jìn)緩存技術(shù)可將訓(xùn)練和HPC工作負(fù)載性能提升20倍?蛻艨赏ㄟ^存儲(chǔ)桶分支對AI數(shù)據(jù)集進(jìn)行版本控制,支持空間高效的對象存儲(chǔ)桶克隆。新版本還增強(qiáng)了加密標(biāo)準(zhǔn)、對象鎖定等安全功能。集成緩存簡化了AI工作流程中的緩存使用,性能比當(dāng)前設(shè)備提升10倍。平臺發(fā)布限制翻倍,單個(gè)集群可支持超過6000億個(gè)對象。
數(shù)字內(nèi)存計(jì)算芯片初創(chuàng)公司d-Matrix推出3D堆疊內(nèi)存技術(shù),聲稱相比當(dāng)前行業(yè)標(biāo)準(zhǔn)HBM4,該技術(shù)可將AI模型運(yùn)行速度提升10倍,能耗降低90%。該公司成立于2019年,采用LPDDR5內(nèi)存配合數(shù)字內(nèi)存計(jì)算硬件,通過改進(jìn)的SRAM單元直接在內(nèi)存陣列中執(zhí)行計(jì)算。首款3DIMC芯片Pavehawk已在實(shí)驗(yàn)室投入運(yùn)行,下一代架構(gòu)Raptor將整合該技術(shù)。
Bun團(tuán)隊(duì)發(fā)布了1.2.21版本,新增MySQL和SQLite內(nèi)置驅(qū)動(dòng)、YAML解析器和密鑰管理器等功能。新的數(shù)據(jù)庫驅(qū)動(dòng)屬于Bun.SQL API,現(xiàn)已支持MySQL、MariaDB和SQLite。據(jù)稱其MySQL客戶端比Node.js的mysql2包快9倍。Bun.secrets為CLI工具和本地開發(fā)提供原生密鑰管理。此版本還包含安全掃描API、獨(dú)立可執(zhí)行文件構(gòu)建API等更新。
戴爾閃電項(xiàng)目為PowerScale集群文件系統(tǒng)存儲(chǔ)帶來并行化性能提升,早期測試反饋積極。該項(xiàng)目旨在為PowerScale和ObjectScale存儲(chǔ)系統(tǒng)添加并行訪問能力,實(shí)現(xiàn)97%網(wǎng)絡(luò)利用率和支持?jǐn)?shù)千個(gè)GPU。通過客戶端軟件層分布式讀取和RDMA技術(shù),直接從客戶端訪問設(shè)備而無需遍歷文件系統(tǒng),有望成為全球最快的并行文件系統(tǒng),性能比競爭系統(tǒng)高出2倍。
英偉達(dá)發(fā)布Spectrum-XGS千兆級以太網(wǎng)交換平臺,實(shí)現(xiàn)數(shù)據(jù)中心間互聯(lián)協(xié)調(diào),讓分布式GPU集群如同一個(gè)巨型處理器運(yùn)行。同時(shí)推出Dynamo推理服務(wù)框架,通過分解式服務(wù)技術(shù)將上下文構(gòu)建和令牌生成分配到不同GPU,顯著提升模型部署效率。在GPT和DeepSeek等模型測試中,令牌生成速度分別提升4倍和2.5倍,投機(jī)解碼技術(shù)更實(shí)現(xiàn)35%性能提升。
PCIe總線是連接x86服務(wù)器、PC和筆記本電腦核心處理器與外設(shè)的重要技術(shù)。隨著CPU和GPU性能提升,PCIe標(biāo)準(zhǔn)也在不斷演進(jìn),每一代帶寬都會(huì)翻倍。目前PCIe 4.0和5.0已廣泛應(yīng)用,首批6.0外設(shè)開始推出。即將到來的PCIe 7.0將提供128GT/s傳輸速率,可能采用光互連技術(shù),主要面向超大規(guī)模數(shù)據(jù)中心和高性能計(jì)算領(lǐng)域。PCIe 8.0的初步開發(fā)已啟動(dòng),預(yù)計(jì)傳輸速率將再次翻倍。
中國AI公司DeepSeek發(fā)布旗艦語言模型V3.1更新版,該模型已針對新一代國產(chǎn)芯片進(jìn)行優(yōu)化。新模型采用UE8M0數(shù)據(jù)類型訓(xùn)練,為即將發(fā)布的國產(chǎn)芯片做準(zhǔn)備。V3.1統(tǒng)一了"思考"和"非思考"模式,單一模型支持兩種范式,上下文窗口從65536擴(kuò)展至131072個(gè)token,在工具調(diào)用能力上顯著提升,Browsecomp基準(zhǔn)測試得分從8.9提升至30。
微軟發(fā)布.NET 10運(yùn)行時(shí)和框架預(yù)覽版7,新增WebSocket連接流封裝、ASP.NET改進(jìn)密鑰認(rèn)證和MAUI多項(xiàng)功能修復(fù)。WebSocketStream提供基于流的抽象簡化編程,Blazor應(yīng)用自動(dòng)支持密鑰認(rèn)證,MAUI新增XAML強(qiáng)類型源代碼生成器提升構(gòu)建性能。作為LTS版本,正式版將于11月中旬發(fā)布。
近期用戶反映Firefox瀏覽器出現(xiàn)CPU和電力消耗激增問題,原因是Mozilla在最新版本中嵌入了LLM機(jī)器人用于標(biāo)簽組命名。后臺運(yùn)行的"推理引擎"進(jìn)程造成了性能問題。Mozilla承認(rèn)在功能推出過程中意外引入了性能漏洞,已暫停相關(guān)功能推廣。用戶可通過設(shè)置界面或about:config頁面禁用AI聊天機(jī)器人功能來解決此問題。
Nvidia在溫哥華Siggraph大會(huì)上發(fā)布了兩款小型Blackwell GPU:RTX Pro 4000 SFF和RTX Pro 2000,功耗僅70瓦。RTX 4000 SFF配備8960個(gè)CUDA核心,光線追蹤性能提升1.7倍,AI性能提升2.5倍,搭載24GB GDDR7顯存。RTX Pro 2000擁有4352個(gè)CUDA核心,3D建模性能提升1.6倍。兩款產(chǎn)品將由戴爾、惠普、聯(lián)想等廠商集成到OEM系統(tǒng)中。
Pure Storage發(fā)布研究報(bào)告,聲稱其直接閃存模塊(DFM)在功耗和碳排放指標(biāo)上優(yōu)于傳統(tǒng)SSD和機(jī)械硬盤。該公司表示,DFM具有更大容量且采用系統(tǒng)級管理,能以更少設(shè)備數(shù)量滿足容量和吞吐量需求,從而降低電力消耗。在10年使用周期的對比測試中,150TB DFM系統(tǒng)的年功耗比HDD系統(tǒng)低4.8倍,碳排放量也顯著更低。Pure Storage認(rèn)為,系統(tǒng)級閃存存儲(chǔ)在速度、密度、可持續(xù)性和可靠性方面均超越HDD。
OpenAI發(fā)布了最先進(jìn)的GPT-5語言模型,雖未實(shí)現(xiàn)通用人工智能但影響深遠(yuǎn)。GPT-5采用統(tǒng)一系統(tǒng)架構(gòu),具備智能路由機(jī)制和自適應(yīng)推理能力,在編程、數(shù)學(xué)推理等多項(xiàng)基準(zhǔn)測試中創(chuàng)新高。該模型已免費(fèi)向所有用戶開放并集成到微軟生態(tài)系統(tǒng)中。對教育領(lǐng)域而言,GPT-5提供個(gè)性化輔導(dǎo)功能,將深刻改變學(xué)習(xí)方式,教育機(jī)構(gòu)必須積極適應(yīng)這一變革。
Snowflake推出客戶端連接器,支持在其云數(shù)據(jù)倉庫中直接運(yùn)行Apache Spark代碼,無需集群設(shè)置。該方案基于Spark Connect的客戶端-服務(wù)器架構(gòu),讓用戶可以使用Spark客戶端連接Snowflake分析引擎。據(jù)稱,預(yù)覽用戶的代碼運(yùn)行性能平均提升5.6倍,成本降低約40%。此舉體現(xiàn)了數(shù)據(jù)湖和數(shù)據(jù)倉庫市場的融合趨勢。
Anthropic周一發(fā)布旗艦AI模型升級版Claude Opus 4.1,在SWE-bench Verified基準(zhǔn)測試中獲得74.5%成績,超越OpenAI o3模型的69.1%和谷歌Gemini 2.5 Pro的67.2%。該公司年收入從10億美元增至50億美元,但近一半API收入依賴Cursor和GitHub Copilot兩大客戶。新模型采用最嚴(yán)格ASL-3安全協(xié)議,在多文件代碼重構(gòu)方面表現(xiàn)突出,但面臨GPT-5競爭威脅。
MLPerf存儲(chǔ)基準(zhǔn)測試第二版顯示,測試系統(tǒng)服務(wù)的加速器數(shù)量比2023年1.0版本增加約一倍。MLCommons表示本輪測試參與度大幅提高,提交機(jī)構(gòu)地域代表性更強(qiáng),系統(tǒng)多樣性更豐富。該基準(zhǔn)測試評估存儲(chǔ)系統(tǒng)在Unet3D、Cosmoflow和Resnet50 AI訓(xùn)練任務(wù)中的性能,以及Llama 3訓(xùn)練中的檢查點(diǎn)性能。隨著AI訓(xùn)練集群GPU數(shù)量增加,故障率上升,檢查點(diǎn)技術(shù)成為標(biāo)準(zhǔn)做法。
美光發(fā)布三款新一代SSD產(chǎn)品,均采用最新276層3D NAND技術(shù)。9650為PCIe Gen 6高速TLC驅(qū)動(dòng)器,最高提供550萬IOPS隨機(jī)讀取性能;6600 ION是容量高達(dá)122.88TB的PCIe Gen 5 QLC存儲(chǔ)產(chǎn)品;7600則是專為低延遲設(shè)計(jì)的PCIe Gen 5 TLC驅(qū)動(dòng)器。三款產(chǎn)品分別針對AI加速、大容量存儲(chǔ)和企業(yè)級應(yīng)用場景,集成美光自研DRAM、控制器和固件技術(shù)。
Linux內(nèi)核6.16在周末發(fā)布,雖然沒有重大新功能,但包含大量錯(cuò)誤修復(fù)和代碼優(yōu)化。該版本擁有3840萬行代碼,分布在超過78000個(gè)文件中。主要改進(jìn)包括:支持英特爾2023年高級性能擴(kuò)展,XFS和ext4文件系統(tǒng)性能優(yōu)化,NUMA系統(tǒng)自動(dòng)調(diào)優(yōu),五級頁表支持,以及USB硬件聲音解碼卸載功能。這些改進(jìn)展現(xiàn)了Linux在大型服務(wù)器到小型設(shè)備的廣泛應(yīng)用范圍。
軟件RAID供應(yīng)商Xinnor宣稱其技術(shù)可在僅五小時(shí)多一點(diǎn)的時(shí)間內(nèi)重建61.44TB SSD,速度約為傳統(tǒng)Linux RAID重建軟件的10倍。Xinnor的xiRAID產(chǎn)品將數(shù)據(jù)分布在驅(qū)動(dòng)器集群中,每個(gè)驅(qū)動(dòng)器上都有備用區(qū)域,故障驅(qū)動(dòng)器的數(shù)據(jù)會(huì)恢復(fù)到這些區(qū)域,從而減少總體重建時(shí)間。測試顯示,在有主機(jī)工作負(fù)載的情況下,使用xiRAID重建速度比Linux mdraid快約30倍,且寫入放大因子低23%。
三星Galaxy S25系列搭載驍龍8 Elite處理器,AI處理速度提升40%,CPU性能增強(qiáng)37%,圖形渲染提升30%。配備40%更大蒸汽腔散熱系統(tǒng),有效防止過熱。ProScaler AI圖像縮放引擎實(shí)時(shí)優(yōu)化視覺效果,游戲模式可定制化設(shè)置避免干擾。Audio Eraser功能清理背景噪音,AI電池優(yōu)化技術(shù)延長游戲時(shí)間,為移動(dòng)游戲玩家提供專業(yè)級體驗(yàn)。
開源Iceberg正成為數(shù)據(jù)湖表格式的通用標(biāo)準(zhǔn),StarTree是最新將其作為實(shí)時(shí)后端的供應(yīng)商。StarTree Cloud基于Apache Pinot構(gòu)建,現(xiàn)可作為Iceberg之上的分析和服務(wù)層。該公司聲稱Iceberg支持能將其從被動(dòng)存儲(chǔ)格式轉(zhuǎn)變?yōu)閷?shí)時(shí)后端,為面向客戶的應(yīng)用和AI代理提供高并發(fā)服務(wù)。與其他查詢引擎不同,StarTree專為低延遲、高并發(fā)訪問而構(gòu)建,可直接在原生Iceberg表上提供實(shí)時(shí)查詢加速。