OpenAI TTS

可调控的语音。

GPT-4o-mini-tts 生成自然语音,精细控制语调、节奏和风格。支持流式输出。

模型
gpt-4o-mini-tts
音色
6 个音色
语言
50+ 种语言
延迟
< 500ms
能力

OpenAI TTS 的优势

01

自然语音

人类般的韵律和节奏,轻松实现。

02

可调控

用自然语言描述你想要的风格:「急切地低语」或「像新闻主播一样说话」。

03

流式输出

实时音频输出,适合交互式应用。

04

表现力

自然处理重音、停顿和情感变化。

常见问题

常见问题

有哪些音色可用?

6 个内置音色:alloy、echo、fable、onyx、nova 和 shimmer。

最大输入长度是多少?

每次请求 4096 字符。更长文本会自动分段。

开始使用

准备好试听所有声音了吗?

一个工作台,完成生成、克隆、朗读和广播。无需信用卡即可开始。