新增国内直连 Base URL： https://api.highwayapi.ai/openai，原域名继续提供服务，详见产品文档

首页/text-to-speech

text-to-speech

Fish Audio S2 Pro Text to Speech

Fish Audio S2 Pro 文本转语音模型，将文本转换为自然语音，支持参考音色、采样控制、分段、音频格式和韵律控制。

MiniMax 声音设计

通过文字描述生成个性化定制声音。返回可用于 T2A 语音合成 API 的 voice_id，以及十六进制编码的预览音频样本。

Gemini 2.5 Flash TTS Text-to-Speech

Google Gemini 系列强调多模态理解与指令遵循，兼顾速度与成本，适合生产级调用。Gemini 2.5 Flash 侧重低延迟与性价比，在实时场景更友好。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

MiniMax Speech 2.8 Turbo Async Text-to-Speech

Minimax 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

MiniMax Speech 2.8 HD Async Text-to-Speech

Minimax 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

MiniMax Speech 2.8 Turbo Sync Text-to-Speech

Minimax 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

MiniMax Speech 2.8 HD Sync Text-to-Speech

Minimax 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

Elevenlabs flash v2.5 Text to Speech

Elevenlabs 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

Elevenlabs flash v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

Elevenlabs multilingual v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

Elevenlabs turbo v2.5 Text to Speech

Elevenlabs 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

Elevenlabs turbo v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

Elevenlabs v3 Text to Speech

Elevenlabs 系列提供稳定的生成能力，适合生产场景。该系列面向生产级调用，强调稳定性与可控输出。语音合成支持多语种与情绪语气控制，可用于配音、播报、客服与角色对白。即时推理 API，性能稳定，无需等待，价格亲民

联系我们