初創(chuàng)公司Positron獲得5160萬(wàn)美元A輪融資,推出專(zhuān)門(mén)針對(duì)AI推理的Atlas芯片。該公司聲稱(chēng)其芯片在性能功耗比和成本效益方面比英偉達(dá)H100高出2-5倍,并已獲得Cloudflare等企業(yè)客戶(hù)采用。Positron專(zhuān)注于內(nèi)存優(yōu)化設(shè)計(jì),無(wú)需液體冷卻,可直接部署在現(xiàn)有數(shù)據(jù)中心。公司計(jì)劃2026年推出支持16萬(wàn)億參數(shù)模型的下一代Titan平臺(tái)。
專(zhuān)家小組討論了AI加速發(fā)展的關(guān)鍵要素,包括硬件芯片設(shè)計(jì)、量子計(jì)算作用和技術(shù)擴(kuò)展。Cerebras展示了餐盤(pán)大小的WSE超級(jí)芯片,被稱(chēng)為"推理界的魚(yú)子醬"。專(zhuān)家們探討了從單原子量子比特到高精度計(jì)算的創(chuàng)新方法,預(yù)測(cè)量子計(jì)算將首先在研究領(lǐng)域產(chǎn)生影響。討論還涉及軟件開(kāi)發(fā)、開(kāi)源模型和摩爾定律的未來(lái)十年效率提升前景。
聯(lián)想集團(tuán)推出專(zhuān)為人工智能工作負(fù)載優(yōu)化的數(shù)據(jù)中心系統(tǒng)產(chǎn)品組合。主打產(chǎn)品ThinkSystem SR680a V4計(jì)算設(shè)備集成近二十個(gè)處理器,推理工作負(fù)載運(yùn)行速度比上一代硬件快11倍。該系統(tǒng)配備8塊英偉達(dá)Blackwell B200顯卡、6個(gè)英特爾至強(qiáng)6處理器,以及8個(gè)英偉達(dá)SuperNIC和BlueField-3 DPU。同時(shí)發(fā)布基于SR675服務(wù)器的兩個(gè)系統(tǒng)和四個(gè)混合AI優(yōu)勢(shì)產(chǎn)品包,涵蓋制造、酒店、安全和零售等應(yīng)用場(chǎng)景。
人工智能能耗問(wèn)題引發(fā)關(guān)注,量子計(jì)算或成解決方案。量子硬件在某些方面更適合AI底層數(shù)學(xué)運(yùn)算,但目前錯(cuò)誤率仍偏高。研究人員正著手準(zhǔn)備,以便在硬件就緒時(shí)運(yùn)行AI模型。本文探討了量子AI的潛力,包括量子電路在機(jī)器學(xué)習(xí)中的應(yīng)用、將經(jīng)典圖像數(shù)據(jù)輸入量子處理器的方法,以及在真實(shí)量子硬件上運(yùn)行AI算法的初步嘗試。
亞馬遜云服務(wù)在獲取高質(zhì)量服務(wù)器以構(gòu)建 AI 基礎(chǔ)設(shè)施方面面臨挑戰(zhàn)。公司縮短了部分服務(wù)器和網(wǎng)絡(luò)設(shè)備的使用壽命,以騰出空間部署加速計(jì)算機(jī)。這些問(wèn)題影響了亞馬遜近 1000 億美元的 AI 基礎(chǔ)設(shè)施投資計(jì)劃。盡管如此,亞馬遜仍看好 AI 前景,認(rèn)為這是一個(gè)"一生難遇的商業(yè)機(jī)會(huì)"。