Whisper on Cloudflare AI

June 22, 2025 · View on GitHub

一个基于 Whisper 模型的在线音频转写工具，部署在 Cloudflare 上。该工具可以将音频文件转换为文字，并支持生成 SRT 格式的字幕文件。

index

速度

使用一段时长为41分钟39秒的音频测试，用时1.9分钟

由于worker的资源限制，在使用时可能出现错误，重试即可

example

返回未经处理的原始转写数据（JSON 格式）。

返回处理后的字幕数据（SRT 格式）。

参数名	类型	说明
`task`	string	任务类型，可选值：`transcribe`（转写）或 `translate`（翻译）
`language`	string	目标语言代码，例如：`en`、`zh`、`ja` 等
`vad_filter`	boolean	是否启用 VAD（语音活动检测）过滤，`true` 或 `false`
`initial_prompt`	string	初始提示词，用于引导模型理解语境（可选）
`prefix`	string	前缀文本，用于增强上下文理解（可选）