speech-to-text
gemini-3.1-flash-lite-preview
gemini-3.1-pro-preview
gemini-2.5-flash
gemini-3-flash-preview
gemini-3-pro-preview
gemini-2.5-flash-lite-preview-09-2025
gemini-2.0-flash-lite
gemini-2.5-flash-lite
gemini-2.5-pro
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-05-20
gemini-2.5-pro-preview-06-05
gemini-2.0-flash-20250609
G
GLM Audio to Text
Glm 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音转文字适合会议/客服录音转写,支持噪声场景下的稳定识别与时间轴输出。即时推理 API,性能稳定,无需等待,价格亲民
E
Elevenlabs scribe v1 Speech to Text
Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民
E
Elevenlabs scribe v2 Speech to Text
Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民