ZoneTwelveblog.z12.tw·Sep 25, 2024Moshi: 開源版 GPT-4 級語音 AI 問世 - ALM在 2024年9月 @kyutai_labs 在 Huggingface 以及 GitHub 上釋出了即時語音對話模型,該模型是個 7B 模型,如果你有張 RTX 3090 24GB 或者與之大小相符的顯卡就可以跑這顆 Model 了,再來就可能要選擇量化模型了。 相信大家可能或多或少都有看到這篇在 X 上的貼文,這是一個來自法國的初創團隊 Kyutai,在七月初發佈對標 GPT-4o 的神奇模型。經歷兩個多月的時間,他們也對兌現自己的承諾,不僅把模型開源,甚至程式碼也開源了! 論文: ht...Discuss·73 readsAudioLanguageModel