# douzhiPhone **Repository Path**: Lapper/douzhi-phone ## Basic Information - **Project Name**: douzhiPhone - **Description**: 豆汁手机,你值得拥有 - **Primary Language**: Unknown - **License**: MulanPSL-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-12-11 - **Last Updated**: 2025-12-12 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
Logo

🤖 豆汁手机 (DouZhi Phone)

字节有豆包 · 我们有豆汁
✨ 豆汁助手,你值得拥有 ✨

Gitee     GitHub     Website

项目简介核心特性新手教程技术架构加入我们

--- ## 📖 项目简介 **豆汁手机 (DouZhi Phone)** 是一款基于 **多模态大模型 (LLM)** 与 **计算机视觉 (CV)** 驱动的 Android 智能助手。 与依赖死板脚本或 XML 控件树的传统自动化工具不同,豆汁手机像人类一样通过“视觉”理解屏幕内容,并智能规划操作路径。无论你是自动化测试工程师,还是 AI Agent 探索者,豆汁手机都能为你提供强大的支持。 > **DouZhi Phone** is an advanced Android automation agent powered by Large Language Models (LLMs) and Computer Vision. Unlike traditional automation tools, it "sees" the screen and "thinks" about how to operate apps, just like a human. > ⚠️ **Attention**: 根据 [LICENSE](./LICENSE) 协议,使用本软件前请务必在 Gitee 或 GitHub 仓库点亮 **Star** ⭐️。您的支持是我们持续维护的动力! > > **According to the LICENSE, please Star ⭐️ the repository before using this software.** ## ✨ 核心特性 - **🗣️ 自然语言控制**:直接告诉它“给妈妈发微信说晚上不回家吃饭”,剩下的交给它。 - **👁️ 纯视觉驱动**:基于截图和归一化坐标 (0-1000) 进行交互,完美兼容那些屏蔽了无障碍服务 (Accessibility) 的 App。 - **🧠 智能推理环**:内置“观察-思考-行动”循环,具备自我纠错能力。如果操作失败,它会重试或换一种方式。 - **⚡ 高性能**:优化的 ADB 通信,智能输入处理(自动切换键盘、文本清除)。 - **🛡️ 安全可控**:内置死循环检测和重复操作预警,防止自动化失控。 ## 📸 界面展示 (Gallery)
沉浸式控制台

💻 沉浸式实时控制台 (Immersive Console)
实时监控,全局掌控


极速启动
🚀 极速启动 (Loading)
无线连接
📡 无线远程控制 (WiFi Control)
## �� 新手教程 ### 1. 准备工作 (Prerequisites) 在开始之前,请确保你的电脑上安装了以下环境: 1. **Node.js**:版本需 18 或更高。 2. **ADB 工具**:确保 `adb` 命令在你的系统 PATH 中(通常随 Android Studio 或 SDK Platform-Tools 安装)。 3. **Android 设备**:真机或模拟器均可,必须开启 **USB 调试**。 4. **豆包 API Key**:你需要从 [火山引擎 (Volcengine)](https://www.volcengine.com/) 获取 API Key。 5. **ADBKeyBoard**:为了实现快速文本输入,请务必在手机上安装项目根目录下的 `ADBKeyBoard.apk`。 * 安装命令:`adb install ADBKeyBoard.apk` * 安装后需在设置中将默认输入法切换为 ADB Keyboard。 ### 2. 安装步骤 (Installation) **第一步:克隆仓库** 推荐国内用户使用 Gitee,速度更快: ```bash # Gitee (推荐) git clone https://gitee.com/Lapper/douzhi-phone.git # GitHub git clone https://github.com/Lappercn/DouZhiPhone.git cd douzhi-phone ``` **第二步:安装后端依赖** ```bash npm install ``` **第三步:配置 API Key** 修改 `config/default.json` 文件(或者新建 `config/local.json` 覆盖配置),填入你的 Key: ```json { "doubao": { "apiKey": "YOUR_API_KEY_HERE", "model": "doubao-pro-32k" } } ``` ### 3. 启动运行 (Running) **启动后端服务** 在项目根目录下运行: ```bash npm run server ``` **启动前端界面** 打开一个新的终端窗口,进入 `frontend` 目录: ```bash cd frontend npm install npm run dev ``` **开始控制** 1. 用 USB 线连接你的 Android 手机。 2. 浏览器打开 `http://localhost:5173`。 3. 你应该能看到手机屏幕镜像。在输入框输入指令(例如:“打开设置查看WiFi”),开始体验! ## 🏗️ 技术架构 豆汁手机采用现代化的前后端分离架构: * **前端 (Frontend)**: Vue 3 + Element Plus (响应式 UI,实时屏幕镜像) * **后端 (Backend)**: Node.js + Express (API 服务,ADB 设备管理) * **Agent 核心**: * **Planner (规划器)**: 基于 LLM 的推理核心 (观察 -> 思考 -> 行动)。 * **Executor (执行器)**: 健壮的指令执行层 (ADB/Monkey/Shell)。 * **Verifier (验证器)**: 视觉闭环验证机制。 ## 🤝 加入我们 **我们是一个充满激情的技术团队,致力于探索 AI 与移动端的无限可能。** ### 🌟 为什么要加入? * **前沿技术**:接触最新的 LLM (豆包, GPT-4o) 和计算机视觉技术。 * **实际落地**:打造一款真正能改变移动测试和自动化现状的工具。 * **极客社区**:结识一群志同道合的开发者。 ### 🚀 如何贡献? - **提交 PR**: 修复 Bug,增加新功能(比如支持更多 App,优化推理逻辑)。 - **反馈 Issue**: 发现问题?请在 [Gitee Issues](https://gitee.com/Lapper/douzhi-phone/issues) 或 [GitHub Issues](https://github.com/Lappercn/DouZhiPhone/issues) 告诉我们。 - **扩散项目**: Star 一下仓库,并分享给你的朋友! **国内开发者**:推荐使用 [Gitee 仓库](https://gitee.com/Lapper/douzhi-phone) 提交 Issue 和 PR。 **Global Developers**: Please use [GitHub Repository](https://github.com/Lappercn/DouZhiPhone). ### ☕ 联系我们 - **官方网站**: [www.tongzhilian.cn](https://www.tongzhilian.cn) - **Email**: shibaizhelianmeng@163.com 让我们一起把“豆汁”熬得更浓、更香!🔥 ---

© 2025 DouZhi Phone Team | Powered by 同智联