AI项目 | 新优态AI

5 文章

AI语音 ×

Eleven Labs：AI语音云服务

Eleven Labs：AI语音云服务

主要功能文章介绍： https://mp.weixin.qq.com/s/qhR6NMnPhhbQ3qhR27ZFaw 官网地址： https://elevenlabs.io/app/speech-synthesis/text-to-speech...

AI语音底层应用

2024年10月14日

0 303

FunAudioLLM：阿里通义音频生成开源大模型

FunAudioLLM：阿里通义音频生成开源大模型

CosyVoice 致力于自然语音生成，支持多语言、音色和情感控制，在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行能力方面表现卓越。多语言合成：采用了总共超15万小时的数据训练，支持中英日粤韩5种语言的合成，合成效果显著优于传统语音合成模型。极速音色模拟：仅需要3~10s的原始音频，即可生成模拟音色，甚至包括韵律、情感等细节。在跨语种的语音合成中，也有不俗的表现。富文本或自然语言...

AI语音底层工具开源

2024年7月8日

0 406

fish-speech：Brand new TTS solution

Fish Speech：人人都可克隆声音且带情感的开源AI语音模型，该TTS模型与chat-tts、seed-tts同一级别，且支持自定义训练，支持本地化部署官网： https://speech.fish.audio/ 源码地址： https://github.com/fishaudio/fish-speech...

AI语音开源

2024年7月5日

0 300

MARS5-TTS：完美声音克隆，支持140+语言

MARS5-TTS：完美声音克隆，支持140+语言

CAMB.AI 的 MARS5 语音模型 (TTS) This is the repo for the MARS5 English speech model (TTS) from CAMB.AI. 这是 CAMB.AI 的 MARS5 英语语音模型 (TTS) 的存储库。 The model follows a two-stage AR-NAR pipeline with a distinctiv...

AGPL-3.0开源 AI语音

2024年7月2日

0 570

AudioCraft：最先进的语音和文本翻译的基础模型（meta）

AudioCraft：最先进的语音和文本翻译的基础模型（meta）

Seamless is a family of AI models that enable more natural and authentic communication across languages. SeamlessM4T is a massive multilingual multimodal machine translation model supporting around 10...

AI语音 meta MIT开源

2024年7月2日

0 320

关于我们

新优态AI社区，收录AI项目、开源项目、创新场景等。

商务合作请电话咨询，感谢您的关注！

归档

标签

AGPL-3.0开源 AI Agent AI-Code AI-搜索 AI场景 AI声音 Ai数字人 AI翻译 AI语音 GraphRAG meta MIT开源 PC RAG SaaS text2sql YC 二次元企业支持体育信息挖掘公文写作医疗大模型学习大模型评估应用场景底层工具底层应用底层技术开源开源Apache-2.0 license 推理提示词Prompt 效率工具数据分析数据处理文生图智能客服智能硬件机器人爬虫电商直播卖货稍后阅读笔记算法网页生成视觉模型视频分析工具视频处理语音阿里非开源面壁智能音响音视频转录