OpenAI TTS

可调控的语音。

GPT-4o-mini-tts 生成自然语音,精细控制语调、节奏和风格。支持流式输出。

模型

gpt-4o-mini-tts

音色

6 个音色

语言

50+ 种语言

延迟

< 500ms

能力

OpenAI TTS 的优势

01

自然语音

人类般的韵律和节奏,轻松实现。

02

可调控

用自然语言描述你想要的风格:「急切地低语」或「像新闻主播一样说话」。

03

流式输出

实时音频输出,适合交互式应用。

04

表现力

自然处理重音、停顿和情感变化。

常见问题

常见问题

有哪些音色可用?

6 个内置音色:alloy、echo、fable、onyx、nova 和 shimmer。

最大输入长度是多少?

每次请求 4096 字符。更长文本会自动分段。

开始使用

准备好试听所有声音了吗?

一个工作台,完成生成、克隆、朗读和广播。无需信用卡即可开始。

进入工作台查看定价