# linly-dubbing
**Repository Path**: ailist/linly-dubbing
## Basic Information
- **Project Name**: linly-dubbing
- **Description**: 智能视频多语言AI配音/翻译工具 - Linly-Dubbing — “AI赋能,语言无界”
- **Primary Language**: Python
- **License**: Apache-2.0
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 3
- **Forks**: 1
- **Created**: 2024-09-21
- **Last Updated**: 2025-06-22
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 智能视频多语言AI配音/翻译工具 - Linly-Dubbing — “AI赋能,语言无界”
Linly-Dubbing WebUI
[](https://github.com/Kedreamix/Linly-Dubbing)

[](https://colab.research.google.com/github/Kedreamix/Linly-Dubbing/blob/main/colab_webui.ipynb)
[](https://github.com/Kedreamix/Linly-Dubbing/blob/main/LICENSE)
[**English**](./README.md) | [**中文简体**](./README_zh.md)
---
目录
- [智能视频多语言AI配音/翻译工具 - Linly-Dubbing — “AI赋能,语言无界”](#智能视频多语言ai配音翻译工具---linly-dubbing--ai赋能语言无界)
- [介绍](#介绍)
- [TO DO LIST](#to-do-list)
- [示例](#示例)
- [安装与使用指南](#安装与使用指南)
- [测试环境](#测试环境)
- [1. 克隆代码仓库](#1-克隆代码仓库)
- [2. 安装依赖环境](#2-安装依赖环境)
- [3. 配置环境变量](#3-配置环境变量)
- [4. 运行程序](#4-运行程序)
- [详细功能和技术细节](#详细功能和技术细节)
- [自动下载视频](#自动下载视频)
- [人声分离](#人声分离)
- [Demucs](#demucs)
- [UVR5](#uvr5)
- [AI 智能语音识别](#ai-智能语音识别)
- [WhisperX](#whisperx)
- [FunASR](#funasr)
- [大型语言模型字幕翻译](#大型语言模型字幕翻译)
- [OpenAI API](#openai-api)
- [Qwen](#qwen)
- [Google Translate](#google-translate)
- [AI 语音合成](#ai-语音合成)
- [Edge TTS](#edge-tts)
- [XTTS](#xtts)
- [CosyVoice](#cosyvoice)
- [GPT-SoVITS](#gpt-sovits)
- [视频处理](#视频处理)
- [数字人对口型技术](#数字人对口型技术)
- [许可协议](#许可协议)
- [参考](#参考)
- [Star History](#star-history)
## 介绍
`Linly-Dubbing` 是一个智能视频多语言AI配音和翻译工具,它融合了[`YouDub-webui`](https://github.com/liuzhao1225/YouDub-webui)的灵感,并在此基础上进行了拓展和优化。我们致力于提供更加多样化和高质量的配音选择,通过集成[`Linly-Talker`](https://github.com/Kedreamix/Linly-Talker)的数字人对口型技术,为用户带来更加自然的多语言视频体验。
通过整合最新的AI技术,`Linly-Dubbing` 在多语言配音的自然性和准确性方面达到了新的高度,适用于国际教育、全球娱乐内容本地化等多种场景,帮助团队将优质内容传播到全球各地。
主要特点包括:
- **多语言支持**: 支持中文及多种其他语言的配音和字幕翻译,满足国际化需求。
- **AI 智能语音识别**: 使用先进的AI技术进行语音识别,提供精确的语音到文本转换和说话者识别。
- **大型语言模型翻译**: 结合领先的本地化大型语言模型(如GPT),快速且准确地进行翻译,确保专业性和自然性。
- **AI 声音克隆**: 利用尖端的声音克隆技术,生成与原视频配音高度相似的语音,保持情感和语调的连贯性。
- **数字人对口型技术**: 通过对口型技术,使配音与视频画面高度契合,提升真实性和互动性。
- **灵活上传与翻译**: 用户可以上传视频,自主选择翻译语言和标准,确保个性化和灵活性。
- **定期更新**: 持续引入最新模型,保持配音和翻译的领先地位。
我们旨在为用户提供无缝、高质量的多语言视频配音和翻译服务,为内容创作者和企业在全球市场中提供有力支持。
---
## TO DO LIST
- [x] 完成AI配音和智能翻译功能的基础实现
- [x] 集成CosyVoice的AI声音克隆算法,实现高质量音频翻译
- [x] 增加FunASR的AI语音识别算法,特别优化对中文的支持
- [x] 利用Qwen大语言模型实现多语言翻译
- [x] 开发Linly-Dubbing WebUI,提供一键生成最终视频的便捷功能,并支持多种参数配置
- [ ] 加入UVR5进行人声/伴奏分离和混响移除,参考GPTSoVits
- [ ] 提升声音克隆的自然度,考虑使用GPTSoVits进行微调,加入GPTSoVits
- [ ] 实现并优化数字人对口型技术,提升配音与画面的契合度
---
## 示例
| 原视频 | Linly-Dubbing |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
|