OpenAI TTS
可调控的语音。
GPT-4o-mini-tts 生成自然语音,精细控制语调、节奏和风格。支持流式输出。
模型
gpt-4o-mini-tts
音色
6 个音色
语言
50+ 种语言
延迟
< 500ms
能力
OpenAI TTS 的优势
01
自然语音
人类般的韵律和节奏,轻松实现。
02
可调控
用自然语言描述你想要的风格:「急切地低语」或「像新闻主播一样说话」。
03
流式输出
实时音频输出,适合交互式应用。
04
表现力
自然处理重音、停顿和情感变化。
常见问题
常见问题
有哪些音色可用?
6 个内置音色:alloy、echo、fable、onyx、nova 和 shimmer。
最大输入长度是多少?
每次请求 4096 字符。更长文本会自动分段。