郝彦飞 Eleven Labs:AI语音云服务 主要功能 文章介绍: https://mp.weixin.qq.com/s/qhR6NMnPhhbQ3qhR27ZFaw 官网地址: https://elevenlabs.io/app/speech-synthesis/text-to-speech... AI语音 底层应用
郝彦飞 FunAudioLLM:阿里通义音频生成开源大模型 CosyVoice 致力于自然语音生成,支持多语言、音色和情感控制,在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行能力方面表现卓越。 多语言合成:采用了总共超15万小时的数据训练,支持中英日粤韩5种语言的合成,合成效果显著优于传统语音合成模型。 极速音色模拟:仅需要3~10s的原始音频,即可生成模拟音色,甚至包括韵律、情感等细节。在跨语种的语音合成中,也有不俗的表现。 富文本或自然语言... AI语音 底层工具 开源
郝彦飞 fish-speech:Brand new TTS solution Fish Speech:人人都可克隆声音且带情感的开源AI语音模型,该TTS模型与chat-tts、seed-tts同一级别,且支持自定义训练,支持本地化部署 官网: https://speech.fish.audio/ 源码地址: https://github.com/fishaudio/fish-speech... AI语音 开源
郝彦飞 MARS5-TTS:完美声音克隆,支持140+语言 CAMB.AI 的 MARS5 语音模型 (TTS) This is the repo for the MARS5 English speech model (TTS) from CAMB.AI. 这是 CAMB.AI 的 MARS5 英语语音模型 (TTS) 的存储库。 The model follows a two-stage AR-NAR pipeline with a distinctiv... AGPL-3.0开源 AI语音
郝彦飞 AudioCraft:最先进的语音和文本翻译的基础模型(meta) Seamless is a family of AI models that enable more natural and authentic communication across languages. SeamlessM4T is a massive multilingual multimodal machine translation model supporting around 10... AI语音 MIT开源 meta