首页/text-to-speech

text-to-speech

MiniMax
MiniMax

MiniMax 声音设计

通过文字描述生成个性化定制声音。返回可用于 T2A 语音合成 API 的 voice_id,以及十六进制编码的预览音频样本。

Gemini
Gemini

Gemini 2.5 Flash TTS Text-to-Speech

Google Gemini 系列强调多模态理解与指令遵循,兼顾速度与成本,适合生产级调用。Gemini 2.5 Flash 侧重低延迟与性价比,在实时场景更友好。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

MiniMax
MiniMax

MiniMax Speech 2.8 Turbo Async Text-to-Speech

Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

MIniMax
MIniMax

MiniMax Speech 2.8 HD Async Text-to-Speech

Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

MIniMax
MIniMax

MiniMax Speech 2.8 Turbo Sync Text-to-Speech

Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

MIniMax
MIniMax

MiniMax Speech 2.8 HD Sync Text-to-Speech

Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

G
GLM

GLM Text to Speech

Glm 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs flash v2.5 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs flash v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs multilingual v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs turbo v2.5 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs turbo v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs v3 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

联系我们