# KittenTTS **Repository Path**: ai-sales/kitten-tts ## Basic Information - **Project Name**: KittenTTS - **Description**: KittenTTS - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-09-22 - **Last Updated**: 2025-10-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Kitten TTS Kitten TTS 是一个开源的轻量级高保真文本转语音模型,仅包含 1500 万参数,专为轻量化部署和高质量语音合成设计。 *当前处于开发者预览阶段* [加入我们的 Discord](https://discord.com/invite/VJ86W4SURW) [获取定制支持 - 填写此表单](https://docs.google.com/forms/d/e/1FAIpQLSc49erSr7jmh3H2yeqH4oZyRRuXm0ROuQdOgWguTzx6SMdUnQ/viewform?usp=preview) 如有任何问题,请联系创建者:info@stellonlabs.com ## ✨ 特点 - **超轻量级**:模型大小不到 25MB - **CPU 优化**:无需 GPU,可在任何设备上运行 - **高质量语音**:提供多种优质语音选项 - **快速推理**:为实时语音合成进行了优化 - **前后端分离架构**:支持独立部署的 API 服务和 Web 前端 ## 🏗️ 项目架构 本项目实现了基于以下组件的前后端分离架构: - **后端 API 服务** (`kitten_tts_api/`):基于 FastAPI 的 Python 服务,提供 TTS 核心功能 - **前端应用** (`kitten_tts_frontend/`):基于 Vue 3 的 Web 应用,提供用户界面 - **核心库** (`kittentts/`):KittenTTS 的核心算法实现 ## 🚀 快速开始 ### 安装核心库 ```bash pip install https://github.com/KittenML/KittenTTS/releases/download/0.1/kittentts-0.1.0-py3-none-any.whl ``` ### 基本用法 (Python) ```python from kittentts import KittenTTS m = KittenTTS("KittenML/kitten-tts-nano-0.2") audio = m.generate("这个高质量 TTS 模型无需 GPU 即可运行", voice='expr-voice-2-f') # 可用语音: [ 'expr-voice-2-m', 'expr-voice-2-f', 'expr-voice-3-m', 'expr-voice-3-f', 'expr-voice-4-m', 'expr-voice-4-f', 'expr-voice-5-m', 'expr-voice-5-f' ] # 保存音频 import soundfile as sf sf.write('output.wav', audio, 24000) ``` ### 前后端应用运行 请参考详细的[前后端分离部署指南](KITTEN_TTS_SEPARATED_DEPLOYMENT_GUIDE.md)进行安装和配置。 #### 后端 API 服务启动 ```bash cd kitten_tts_api pip install -r requirements.txt python start_server.py ``` API 服务默认运行在 http://localhost:8000 #### 前端应用启动 ```bash cd kitten_tts_frontend npm install npm run dev ``` 前端应用默认运行在 http://localhost:3000 ### 系统演示 使用提供的演示脚本测试整个系统: ```bash python demo_separated_system.py ``` ## 💻 系统要求 几乎可以在任何设备上运行 ## 项目结构 ``` KittenTTS/ ├── kitten_tts_api/ # 后端 API 服务 │ ├── main.py # FastAPI 主程序 │ ├── requirements.txt # Python 依赖 │ └── start_server.py # 启动脚本 ├── kitten_tts_frontend/ # 前端 Vue 应用 │ ├── src/ # 前端源代码 │ ├── package.json # NPM 依赖配置 │ └── vite.config.js # Vite 构建配置 ├── kittentts/ # KittenTTS 核心库 ├── demo_separated_system.py # 系统演示脚本 └── KITTEN_TTS_SEPARATED_DEPLOYMENT_GUIDE.md # 部署指南 ``` ## 功能清单 - [x] 发布预览模型 - [ ] 发布完全训练的模型权重 - [ ] 发布移动 SDK - [x] 实现前后端分离 Web 版本 - [x] 提供 API 文档和部署指南 ## Python 3.13 兼容性 如果您在使用 Python 3.13,请参考项目中的 [PYTHON_313_COMPATIBILITY_GUIDE.md](PYTHON_313_COMPATIBILITY_GUIDE.md) 文件了解兼容性信息和修复方案。 ## 贡献指南 我们欢迎社区贡献!如果您有任何想法或建议,请通过以下方式参与: 1. 提交 GitHub Issues 报告问题或提出功能请求 2. 提交 Pull Requests 改进代码 3. 在 Discord 社区中分享您的使用体验 ## 许可证 请查看项目根目录下的 LICENSE 文件了解许可证信息。 ## 联系方式 如有任何问题或需要支持,请联系: - 电子邮件:info@stellonlabs.com - Discord:[https://discord.com/invite/VJ86W4SURW](https://discord.com/invite/VJ86W4SURW)