微軟發(fā)布兩款內(nèi)部訓(xùn)練的AI模型:MAI-Voice-1自然語音生成模型和MAI-1-preview大語言模型。后者專門為Copilot聊天機(jī)器人設(shè)計(jì),使用約15000塊英偉達(dá)H100 GPU訓(xùn)練。此舉被視為微軟減少對(duì)OpenAI依賴的努力,盡管兩家公司仍保持投資關(guān)系。新模型更專注于消費(fèi)者應(yīng)用場(chǎng)景,MAI-Voice-1已在Copilot Daily使用,MAI-1-preview將逐步部署到Copilot文本功能中。
OpenAI和微軟發(fā)布了兩款新的語音人工智能模型。OpenAI的gpt-realtime被稱為其最強(qiáng)語音模型,可生成更自然的語音并能在句中改變語調(diào)和語言。微軟推出的MAI-Voice-1模型已集成到Copilot助手中,具有高硬件效率,單個(gè)GPU即可在一秒內(nèi)生成一分鐘音頻。兩家公司還發(fā)布了MAI-1-preview模型,采用專家混合架構(gòu)提高效率。