音频大模型-全球
OpenAudio S1 是 Fish Audio 最新推出的文本转语音(TTS)模型,基于超过 200 万小时的音频数据进行训练,旨在提供高度自然的语音合成体验
OpenAudio S1 是 Fish Audio 最新推出的文本转语音(TTS...
Amazon Nova Sonic是一款全新的基础模型,旨在为人工智能应用程序提供自然、类似人类的语音对话体验
Amazon Nova Sonic是一款全新的基础模型,旨在为人工智能应用程序提...
Octave TTS 是由 Hume AI 开发的一种新型文本到语音(TTS)模型,旨在生成具有情感和个性化的 AI 语音
Octave TTS 是由 Hume AI 开发的一种新型文本到语音(TTS)模...
Zonos是一个开源的文本到语音(TTS)模型,提供高质量、自然的语音生成,支持多种语言,并具备即时语音克隆的能力
Zonos是一个开源的文本到语音(TTS)模型,提供高质量、自然的语音生成,支持...
Meta Movie Gen 是 Meta 公司最新推出的生成式人工智能(AI)工具,旨在通过文本提示生成高质量的视频和音频内容
Meta Movie Gen 是 Meta 公司最新推出的生成式人工智能(AI)...