小米開源首個原生端到端語音大模型

每日經濟新聞 2025-09-19 09:27:18

每經AI快訊，據Xiaomi MiMo微信公眾號消息，9月19日，小米正式開源首個原生端到端語音模型——Xiaomi-MiMo-Audio，它基于創(chuàng)新預訓練架構和上億小時訓練數據，首次在語音領域實現基于ICL的少樣本泛化，并在預訓練觀察到明顯的“涌現”行為。據介紹，在通用語音理解及對話等多項標準評測基準中，MiMo-Audio大幅超越了同參數量的開源模型，取得7B最佳性能；在音頻理解基準MMAU的標準測試集上，MiMo-Audio超過Google閉源語音模型Gemini-2.5-Flash；在面向音頻復雜推理的基準Big Bench Audio S2T任務中，MiMo-Audio同樣超越了OpenAI閉源的語音模型GPT-4o-Audio-Preview。

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現在本站，可聯(lián)系我們要求撤下您的作品。

模型開源小米大模型

上一篇文章

9月19日A股三大指數開盤漲跌不一，上證指數開盤下跌0.03%，創(chuàng)業(yè)板指上漲0.08%

返回每經網首頁

下一篇文章

云南臨滄市耿馬縣發(fā)生3.6級地震震源深度10千米