使用说明
项目简介
本项目是一个基于 Model Context Protocol (MCP) 的服务器实现,旨在使大型语言模型 (LLM),例如 Claude,能够安全且标准化地控制 Windows 操作系统。通过提供鼠标、键盘、屏幕和窗口管理等工具,该MCP服务器为 LLM 客户端构建强大的桌面自动化能力,扩展了 LLM 在实际应用场景中的潜力。
主要功能点
- 全面的Windows系统控制能力:
- 鼠标操作: 支持精确的光标移动、单击、双击、右键点击和拖拽操作。
- 键盘输入: 支持文本输入、特殊按键、组合键(如 Ctrl+C)以及国际字符。
- 屏幕操作: 能够捕获实时屏幕截图,并获取屏幕尺寸信息。
- 窗口管理: 允许 LLM 控制窗口的焦点、最小化、最大化和恢复状态。
- 安全可靠的架构:
- 三层架构: 采用 MCP 服务器层 (TypeScript)、API 层 (Python/FastAPI) 和计算机控制层 (Python) 的分层设计,确保系统稳定性和安全性。
- 输入验证和安全措施: 实施严格的输入验证、边界检查和故障保护机制,防止误操作和安全风险。
- 完善的错误处理: 具备全面的异常处理、详细日志记录和自动恢复机制,提高系统健壮性。
安装步骤
- 安装 Python 依赖
打开命令提示符或 PowerShell,导航到仓库根目录,运行命令:
pip install -r requirements.txt - 安装 Node.js 依赖
在命令提示符或 PowerShell 中,导航到仓库根目录,运行命令:
npm install - 构建 MCP 服务器
在命令提示符或 PowerShell 中,导航到仓库根目录,运行命令:
npm run build
服务器配置 (Claude Desktop 集成)
要将此 MCP 服务器与 Claude Desktop 集成,您需要在 Claude Desktop 的配置文件中添加服务器配置信息。请编辑或创建 '%APPDATA%\Claude\claude_desktop_config.json' 文件,并添加以下 JSON 配置:
{ "mcpServers": { "windows-control": { "command": "C:\\Program Files\\nodejs\\node.exe", "args": [ "C:\\Users\\YourUsername\\path\\to\\windows-implementation\\dist\\index.js", "--api-url=http://localhost:8000" ], "cwd": "C:\\Users\\YourUsername\\path\\to\\windows-implementation" } } }
配置参数说明:
- 'server name': 'windows-control' (服务器名称,在 Claude Desktop 客户端配置中用于标识此服务器)
- 'command': 'C:\Program Files\nodejs\node.exe' (Node.js 运行时的可执行文件路径,请根据您的 Node.js 安装路径进行调整)
- 'args': 启动 MCP 服务器的参数列表
- '"C:\Users\YourUsername\path\to\windows-implementation\dist\index.js"': MCP 服务器的入口文件路径,请替换为您的 'windows-implementation' 仓库的实际路径。
- '"--api-url=http://localhost:8000"': API 服务器的 URL 地址,指定 MCP 服务器与 Python 后端 API 通信的地址。
- 'cwd': 'C:\Users\YourUsername\path\to\windows-implementation' (MCP 服务器的工作目录,请替换为您的 'windows-implementation' 仓库的实际路径。)
请注意: 您需要将 'C:\Users\YourUsername\path\to\windows-implementation' 替换为您本地 'windows-implementation' 仓库的实际绝对路径。
基本使用方法
-
启动 Python API 服务器: 打开命令提示符或 PowerShell,导航到仓库根目录,运行命令以启动 Python 后端 API 服务:
python main.py保持此命令提示符窗口运行,API 服务器将在后台运行。
-
配置并启动 Claude Desktop: 确保您已按照上述步骤配置 'claude_desktop_config.json' 文件。启动 Claude Desktop 应用程序。Claude Desktop 应该会自动检测并连接到您配置的名为 "windows-control" 的 MCP 服务器。
-
在 Claude 中使用工具: 现在,您可以在 Claude 中指示其使用 "windows-control" 服务器提供的工具来控制 Windows 系统。例如,您可以提示 Claude 执行以下操作:
- "移动鼠标到屏幕坐标 (100, 200)"
- "点击鼠标左键"
- "在当前位置输入文本 'Hello, Claude!'"
- "截取当前屏幕的截图"
Claude 将通过 MCP 协议与 "windows-control" 服务器通信,执行相应的 Windows 系统操作。
信息
分类
桌面与硬件