# Windows-MCP
**Repository Path**: crazymonkey186/Windows-MCP
## Basic Information
- **Project Name**: Windows-MCP
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-08-11
- **Last Updated**: 2025-08-11
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
**Windows MCP** 是一个轻量级开源项目,实现了AI代理与Windows操作系统之间的无缝集成。作为MCP服务器,它架起了LLM与Windows操作系统之间的桥梁,允许代理执行**文件导航、应用控制、UI交互、QA测试**等任务。
## 更新日志
- 试试 🪟[Windows-Use](https://gitee.com/crazymonkey186/Windows-Use)!!,这是一个使用Windows-MCP构建的代理。
- Windows-MCP现已作为桌面扩展功能集成到`Claude Desktop`中。
### 支持的操作系统
- Windows 7
- Windows 8, 8.1
- Windows 10
- Windows 11
## 🎥 演示视频
## ✨ 核心功能
- **无缝Windows集成**
原生与Windows UI元素交互,打开应用程序,控制窗口,模拟用户输入等。
- **支持任何LLM(可选视觉功能)**
与许多自动化工具不同,Windows MCP不依赖任何传统计算机视觉技术或特定的微调模型;它适用于任何LLM,降低了复杂性和设置时间。
- **丰富的UI自动化工具集**
包括基本键盘、鼠标操作以及窗口/UI状态捕获工具。
- **轻量级且开源**
依赖项少,设置简单,完整源代码在MIT许可证下可用。
- **可定制和可扩展**
轻松调整或扩展工具以满足您独特的自动化或AI集成需求。
- **实时交互**
操作之间的典型延迟(例如,从一次鼠标点击到下一次)范围为**0.7至2.5秒**,可能会根据活动应用程序数量、系统负载以及LLM的推理速度略有不同。
### 先决条件
- Python 3.13+
- Anthropic Claude Desktop应用程序或其他MCP客户端
- Astra的UV(包管理器),通过`pip install uv`安装
- Antropic的DXT(桌面扩展),通过`npm install -g @anthropic-ai/dxt`安装
- Windows默认语言为`英语`,或在其他语言的Windows系统中禁用MCP服务器中的`Launch-Tool`和`Resize-Tool`。
## 🏁 快速开始
### Gemini CLI
1. 在文件资源管理器中导航到`%USERPROFILE%/.gemini`并打开`settings.json`。
2. 在`settings.json`中添加`windows-mcp`配置并保存。
```json
{
"theme": "Default",
...
//MCP服务器配置
"mcpServers": {
"windows-mcp": {
"command": "uv",
"args": [
"--directory",
"",
"run",
"main.py"
]
}
}
}
```
3. 在终端中重新运行Gemini CLI。开始使用吧 🥳
### Claude Desktop
1. 克隆仓库。
```shell
git clone https://github.com/CursorTouch/Windows-MCP.git
cd Windows-MCP
```
2. 构建桌面扩展`DXT`:
```shell
npx @anthropic-ai/dxt pack
```
3. 打开Claude Desktop:
进入Claude Desktop:设置->扩展->安装扩展(找到`.dxt`文件)->安装
完成后开始使用吧 🥳。
有关Claude Desktop集成的其他故障排除,请参阅[MCP文档](https://modelcontextprotocol.io/quickstart/server#claude-for-desktop-integration-issues)。该文档包含检查日志和解决常见问题的有用提示。
---
## 🛠️MCP工具
Claude可以使用以下工具与Windows交互:
- `Click-Tool`:在给定坐标处点击屏幕。
- `Type-Tool`:在元素上输入文本(可选清除现有文本)。
- `Clipboard-Tool`:使用系统剪贴板进行复制或粘贴。
- `Scroll-Tool`:在窗口或特定区域垂直或水平滚动。
- `Drag-Tool`:从一个点拖动到另一个点。
- `Move-Tool`:移动鼠标指针。
- `Shortcut-Tool`:按下键盘快捷键(`Ctrl+c`、`Alt+Tab`等)。
- `Key-Tool`:按下单个键。
- `Wait-Tool`:暂停指定的持续时间。
- `State-Tool`:默认语言、浏览器、活动应用程序以及交互式、文本和可滚动元素的组合快照,以及桌面截图。
- `Resize-Tool`:用于更改应用程序的窗口大小或位置。
- `Launch-Tool`:从开始菜单启动应用程序。
- `Shell-Tool`:执行PowerShell命令。
- `Scrape-Tool`:抓取整个网页信息。
## 星标历史
[](https://www.star-history.com/#CursorTouch/Windows-MCP&Date)
## ⚠️注意事项
此MCP直接与您的Windows操作系统交互以执行操作。请谨慎使用,避免在无法容忍此类风险的环境中部署。
## 📝 限制
- 无法选择段落中的特定文本部分,因为MCP依赖辅助功能树。(⌛ 开发中。)
- `Type-Tool`用于输入文本,不适用于在IDE中编程,因为它会将程序作为整体输入到文件中。(⌛ 开发中。)
## 🪪许可证
本项目采用MIT许可证 - 详见[LICENSE](LICENSE)文件。
## 🤝贡献
欢迎贡献!请参阅[CONTRIBUTING](CONTRIBUTING)了解设置说明和开发指南。
由[Jeomon George](https://github.com/Jeomon)用心制作 ❤️
## 引用
```bibtex
@software{
author = {George, Jeomon},
title = {Windows-MCP: 用于将LLM代理与Windows集成的轻量级开源项目},
year = {2024},
publisher = {GitHub},
url={https://github.com/CursorTouch/Windows-MCP}
}
```