# faster-whisper-webui **Repository Path**: devonqi/faster-whisper-webui ## Basic Information - **Project Name**: faster-whisper-webui - **Description**: No description available - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2024-08-16 - **Last Updated**: 2024-08-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README --- title: Faster Whisper Webui emoji: 🚀 colorFrom: indigo colorTo: blue sdk: gradio sdk_version: 3.23.0 app_file: app.py pinned: false license: apache-2.0 --- [**English**](README.md) | [**中文文档**](README_zh_CN.md) 请查看配置参考,网址为: https://huggingface.co/docs/hub/spaces-config-reference 本项目复制自 [aadnk/whisper-webui](https://gitlab.com/aadnk/whisper-webui), 为了个人使用我在此基础上进行了修改。 # 本地运行 要在本地运行此程序,首先需要安装Python 3.9+和Git。然后安装Pytorch 10.1+和所有其他依赖项: ``` pip install -r requirements.txt ``` 项目模型为本地加载,需要在项目路径下创建`models`目录,然后按照如下格式放置模型文件 ``` ├─faster-whisper │ ├─base │ ├─large │ ├─large-v2 │ ├─medium │ ├─small │ └─tiny └─silero-vad ├─examples │ ├─cpp │ ├─microphone_and_webRTC_integration │ └─pyaudio-streaming ├─files └─__pycache__ ``` ### 模型下载地址 [faster-whisper](https://huggingface.co/guillaumekln) [silero-vad](https://github.com/snakers4/silero-vad) 您可以在Windows 10/11上找到安装详细说明: [here (PDF)](docs/windows/install_win10_win11.pdf). 最后,启用并行CPU/GPU,运行应用程序的完整版本(无音频长度限制): ``` python app.py --input_audio_max_duration -1 --server_name 127.0.0.1 --auto_parallel True ``` 您还可以运行CLI界面,它类似于Whisper自己的CLI,但还支持以下额外的参数: ``` python cli.py \ [--vad {none,silero-vad,silero-vad-skip-gaps,silero-vad-expand-into-gaps,periodic-vad}] \ [--vad_merge_window VAD_MERGE_WINDOW] \ [--vad_max_merge_size VAD_MAX_MERGE_SIZE] \ [--vad_padding VAD_PADDING] \ [--vad_prompt_window VAD_PROMPT_WINDOW] [--vad_cpu_cores NUMBER_OF_CORES] [--vad_parallel_devices COMMA_DELIMITED_DEVICES] [--auto_parallel BOOLEAN] ``` 此外,您还可以使用URL作为输入,而不仅仅是文件路径。 ``` python cli.py --model large --vad silero-vad --language Japanese "https://www.youtube.com/watch?v=4cICErqqRSM" ``` 您可以使用配置文件`config.json5`而不是向`app.py`或`cli.py`提供参数。请参阅该文件以获取更多信息。 如果您想使用不同的配置文件,则可以使用`WHISPER_WEBUI_CONFIG`环境变量来指定另一个文件的路径。 ### 多个文件 您可以通过“上传文件”选项或作为YouTube上的播放列表上传多个文件。 然后,每个音频文件将依次进行处理,并将生成的SRT/VTT/Transcript放在“下载”部分中。 当处理多个文件时,UI还将生成一个“All_Output”zip文件,其中包含所有文本输出文件。 ### 一键启动 针对新手用户,可以在`Releases`页面下载免安装程序。点击`webui-start.bat`启动程序,然后在浏览器输入对应地址访问即可(仅包含`small` 模型,其他模型自行下载)。