微軟人工智能部門於週四發佈了首批自主研發的 AI 模型:MAI-Voice-1AIMAI-1-preview。此舉標誌着微軟在自研 AI 模型領域邁出重要一步,有望改變其對外部模型的依賴,併爲未來的 Copilot 產品奠定基礎。

MAI-Voice-1:極速語音生成新突破

MAI-Voice-1是一個專注於語音生成的模型,其最大亮點是高效和低成本。微軟表示,該模型僅需一個 GPU,就能在不到一秒的時間內生成一分鐘的音頻。目前,該模型已應用於微軟的一些現有功能,例如 Copilot Daily,一個能以播客風格解釋新聞頭條的 AI 主持人。

人工智能大腦 大模型 (2)

用戶現在可以在 Copilot Labs 上親身體驗 MAI-Voice-1,通過輸入文本並調整聲音和風格,感受其強大的語音生成能力。

MAI-1-preview:Copilot 的未來形態

同時發佈的 MAI-1-preview 模型,據稱是在約15,000塊 Nvidia H100GPU 上進行訓練的。該模型旨在爲用戶提供能夠遵循指令並對日常查詢給出有用響應的 AI 體驗。

微軟人工智能主管穆斯塔法·蘇萊曼曾表示,微軟內部的 AI 模型將專注於消費者用例,利用其在廣告和消費者數據方面的優勢,打造真正爲消費者服務的 AI 伴侶。未來,MAI-1-preview 將部分用於 Copilot AI 助手,以補充或替代目前依賴的 OpenAI 大型語言模型。此外,該模型也已在 AI 基準測試平臺 LMArena 上進行公開測試。

微軟人工智能部門在博客中表示,他們的雄心不僅限於此,未來將協調一系列服務於不同用戶意圖和用例的專用模型,以釋放更大的價值