W
Whisper
Open-source speech recognition model for transcription, subtitles, and audio processing workflows.
Speech to text Subtitle Transcription Open source
Overview
Whisper 常用于语音转写、字幕生成、长音频初稿和多语言音频处理。它适合给视频剪辑、会议纪要和播客工作流提供第一版文本。
转写结果需要人工校对,尤其是专有名词、数字、口音、背景噪音和多人对话。
在目录中,Whisper 归入 AI Voice、AI Subtitle 和 Open Source AI,常与剪辑工具、文档工具和 LLM 润色流程配合。
Key Metadata
- Pricing: open source
- Platforms: python, cli, local
- API support: no
- Chinese support: yes
- Open source: yes
- Source confidence: 0.8
- Last checked: 2026-05-13