# EasyML Studio - 零代码机器学习平台 **Repository Path**: ma0513207162/easy-ml-studio ## Basic Information - **Project Name**: EasyML Studio - 零代码机器学习平台 - **Description**: 🎯 让机器学习触手可及 - 一个简单易用的零代码机器学习平台,让每个人都能轻松构建和部署机器学习模型。 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2025-09-03 - **Last Updated**: 2025-09-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: 数据可视化, Python ## README # 🚀 EasyML Studio - 零代码机器学习平台 [![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT) [![Python](https://img.shields.io/badge/python-3.8+-blue.svg)](https://www.python.org/downloads/) [![Flask](https://img.shields.io/badge/flask-2.0+-green.svg)](https://flask.palletsprojects.com/) [![scikit-learn](https://img.shields.io/badge/sklearn-1.2+-orange.svg)](https://scikit-learn.org/) [![GitHub stars](https://img.shields.io/github/stars/ma0513207162/easyml-studio.svg)](https://github.com/ma0513207162/easyml-studio/stargazers) > 🎯 **让机器学习触手可及** - 一个简单易用的零代码机器学习平台,让每个人都能轻松构建和部署机器学习模型。 [在线演示](https://easyml-studio-demo.herokuapp.com) | [快速开始](#快速开始) | [文档](docs/) | [示例](examples/) --- ## ✨ 特性 ### 🔥 核心功能 - **📊 智能数据分析** - 自动化的探索性数据分析(EDA) - **🛠️ 零代码建模** - 拖拽式界面,无需编程经验 - **📈 可视化洞察** - 丰富的图表和统计分析 - **🤖 自动机器学习** - 智能算法选择和超参数优化 - **🚀 一键部署** - 模型即时部署为 REST API - **📋 模型对比** - 多算法性能对比分析 ### 🎨 用户体验 - **🖱️ 拖拽上传** - 支持 CSV、Excel、JSON 等格式 - **📱 响应式设计** - 完美适配移动端和桌面端 - **⚡ 实时预览** - 即时查看数据处理结果 - **💾 项目管理** - 保存和管理多个 ML 项目 ## 🎬 快速预览 ![EasyML Studio Demo](./static/demo.png) ## 🚀 快速开始 ### 环境要求 - Python 3.8+ - 4GB+ RAM 推荐 ### 🐍 方式一:Python 安装 ```bash # 克隆项目 git clone https://github.com/ma0513207162/easyml-studio.git cd easyml-studio # 创建虚拟环境 python -m venv venv source venv/bin/activate # Windows: venv\Scripts\activate # 安装依赖 pip install -r requirements.txt # 启动应用 python app.py ``` 访问 http://localhost:5000 开始使用! ### 🐳 方式二:Docker 安装 ```bash # 构建并运行 docker build -t easyml-studio . docker run -p 5000:5000 easyml-studio ``` ### ☁️ 方式三:在线体验 直接访问我们的 [在线演示](https://easyml-studio-demo.herokuapp.com),无需安装! ## 📖 使用教程 ### 1️⃣ 上传数据 ```python # 支持的数据格式 ✅ CSV (.csv) ✅ Excel (.xlsx, .xls) ✅ JSON (.json) ✅ TSV (.tsv) ``` ### 2️⃣ 数据探索 - **📊 自动统计摘要** - 数据类型、缺失值、分布统计 - **📈 可视化分析** - 相关性热图、分布图、箱线图 - **🔍 异常检测** - 自动识别异常值和数据质量问题 ### 3️⃣ 模型训练 ```python # 支持的算法 🔹 分类: 逻辑回归、随机森林、SVM、梯度提升 🔹 回归: 线性回归、岭回归、随机森林回归 🔹 聚类: K-Means、层次聚类、DBSCAN 🔹 降维: PCA、t-SNE、UMAP ``` ### 4️⃣ 模型评估 - **📊 性能指标** - 准确率、精确率、召回率、F1-score - **📈 可视化评估** - ROC 曲线、混淆矩阵、学习曲线 - **🔍 特征重要性** - 了解哪些特征最重要 ### 5️⃣ 模型部署 ```bash # 自动生成 API 端点 POST /api/predict Content-Type: application/json { "features": [1.2, 3.4, 5.6, 7.8] } ``` ## 🏗️ 项目结构 ``` easyml-studio/ ├── 📁 app/ │ ├── 🐍 __init__.py │ ├── 🌐 routes/ # Flask 路由 │ ├── 🤖 models/ # ML 模型定义 │ ├── 📊 data_processing/ # 数据处理模块 │ ├── 📈 visualization/ # 可视化模块 │ └── 🛠️ utils/ # 工具函数 ├── 🎨 static/ # 静态资源 │ ├── 🎨 css/ │ ├── 📜 js/ │ └── 🖼️ images/ ├── 📄 templates/ # HTML 模板 ├── 📊 examples/ # 示例数据集 ├── 📖 docs/ # 文档 ├── 🧪 tests/ # 测试文件 ├── 🐳 Dockerfile ├── ⚙️ requirements.txt └── 🚀 app.py # 应用入口 ``` ## 🎯 示例项目 ### 🏠 房价预测 ```python # 使用波士顿房价数据集 1. 上传 boston_housing.csv 2. 选择回归任务 3. 目标变量: price 4. 自动特征工程 5. 一键训练多模型 6. 部署最佳模型 ``` ### 🌸 鸢尾花分类 ```python # 经典分类案例 1. 上传 iris.csv 2. 选择分类任务 3. 目标变量: species 4. 可视化特征分布 5. 训练分类器 6. 评估模型性能 ``` 更多示例请查看 [`examples/`](examples/) 目录。 ## 🛠️ 技术栈 | 类别 | 技术 | 版本 | 用途 | | ------------ | ------------ | ----- | ------------- | | **后端** | Flask | 2.3+ | Web 框架 | | **数据处理** | Pandas | 2.0+ | 数据操作 | | **数值计算** | NumPy | 1.24+ | 数值计算 | | **机器学习** | Scikit-learn | 1.3+ | ML 算法 | | **可视化** | Matplotlib | 3.7+ | 图表绘制 | | **可视化** | Plotly | 5.15+ | 交互图表 | | **前端** | Bootstrap | 5.3 | UI 框架 | | **前端** | jQuery | 3.6 | JavaScript 库 | ## 📊 性能基准 | 数据集大小 | 加载时间 | 训练时间 | 内存使用 | | ---------- | -------- | -------- | -------- | | 1K 行 | < 1s | < 5s | < 100MB | | 10K 行 | < 3s | < 30s | < 500MB | | 100K 行 | < 10s | < 2min | < 2GB | | 1M 行 | < 30s | < 10min | < 8GB | ## 🔧 配置选项 创建 `config.py` 文件自定义配置: ```python class Config: # 基础配置 SECRET_KEY = 'your-secret-key' UPLOAD_FOLDER = 'uploads' MAX_CONTENT_LENGTH = 100 * 1024 * 1024 # 100MB # 数据库配置(可选) DATABASE_URL = 'sqlite:///easyml.db' # ML 配置 MAX_FEATURES = 1000 DEFAULT_TEST_SIZE = 0.2 CV_FOLDS = 5 ``` ## 🤝 贡献指南 我们欢迎所有形式的贡献!🎉 ### 🐛 报告 Bug 使用 [GitHub Issues](https://github.com/ma0513207162/easyml-studio/issues) 报告问题 ### 💡 功能建议 1. 查看 [现有 Issues](https://github.com/ma0513207162/easyml-studio/issues) 2. 创建新的 Feature Request 3. 详细描述功能需求 ### 🔧 代码贡献 ```bash # 1. Fork 项目 # 2. 创建功能分支 git checkout -b feature/amazing-feature # 3. 提交改动 git commit -m 'Add amazing feature' # 4. 推送到分支 git push origin feature/amazing-feature # 5. 创建 Pull Request ``` ### 📋 开发环境设置 ```bash # 安装开发依赖 pip install -r requirements-dev.txt # 运行测试 python -m pytest tests/ # 代码格式化 black app/ isort app/ # 类型检查 mypy app/ ``` ## 🧪 测试 ```bash # 运行所有测试 python -m pytest # 运行特定测试 python -m pytest tests/test_models.py # 生成覆盖率报告 python -m pytest --cov=app tests/ ``` ## 📈 路线图 ### 🎯 v1.0 (当前版本) - ✅ 基础数据上传和预处理 - ✅ 常用 ML 算法支持 - ✅ 模型评估和可视化 - ✅ 简单 API 部署 ### 🚀 v1.1 (计划中) - 🔄 自动特征工程 - 🔄 深度学习模型支持 - 🔄 时间序列分析 - 🔄 模型解释性分析 ### 🌟 v2.0 (未来版本) - ⏳ 分布式训练支持 - ⏳ 实时数据流处理 - ⏳ 云端部署集成 - ⏳ 协作功能 ## 📜 更新日志 ### v1.0.0 (2025-09-03) - 🎉 首次发布 - ✨ 完整的 ML 工作流支持 - 📊 丰富的可视化功能 - 🚀 一键模型部署 查看完整的 [更新日志](CHANGELOG.md) ## 🙏 致谢 特别感谢以下开源项目: - [Flask](https://flask.palletsprojects.com/) - 出色的 Python Web 框架 - [Scikit-learn](https://scikit-learn.org/) - 强大的机器学习库 - [Pandas](https://pandas.pydata.org/) - 数据处理的瑞士军刀 - [Plotly](https://plotly.com/) - 美观的交互式图表 ## 📞 联系方式 - **作者**: ma0513207162 - **Email**: your-email@example.com - **GitHub**: [@ma0513207162](https://github.com/ma0513207162) - **讨论**: [GitHub Discussions](https://github.com/ma0513207162/easyml-studio/discussions) ## 📄 许可证 本项目采用 [MIT 许可证](LICENSE) - 查看 LICENSE 文件了解详情。 --- ## ⭐ 如果这个项目对您有帮助,请给我们一个 Star! **让机器学习变得简单易用,让每个人都能成为数据科学家!** 🚀 ---