text-to-speech
MiniMax 声音设计
通过文字描述生成个性化定制声音。返回可用于 T2A 语音合成 API 的 voice_id,以及十六进制编码的预览音频样本。
Gemini 2.5 Flash TTS Text-to-Speech
Google Gemini 系列强调多模态理解与指令遵循,兼顾速度与成本,适合生产级调用。Gemini 2.5 Flash 侧重低延迟与性价比,在实时场景更友好。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
MiniMax Speech 2.8 Turbo Async Text-to-Speech
Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
MiniMax Speech 2.8 HD Async Text-to-Speech
Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
MiniMax Speech 2.8 Turbo Sync Text-to-Speech
Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
MiniMax Speech 2.8 HD Sync Text-to-Speech
Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
GLM Text to Speech
Glm 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
Elevenlabs flash v2.5 Text to Speech
Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
Elevenlabs flash v2 Text to Speech
Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
Elevenlabs multilingual v2 Text to Speech
Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
Elevenlabs turbo v2.5 Text to Speech
Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
Elevenlabs turbo v2 Text to Speech
Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
Elevenlabs v3 Text to Speech
Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民