使用说明
项目简介
Computer Control MCP 是一个基于 Model Context Protocol (MCP) 构建的服务器,旨在为大型语言模型(LLM)客户端提供计算机操作能力。它通过标准化的 MCP 协议,允许 LLM 应用调用预定义的工具来控制用户的计算机,例如移动鼠标、输入文本、截取屏幕、识别屏幕文字等。该项目无需外部依赖,易于安装和部署,为构建能够与桌面环境交互的智能应用提供了基础。
主要功能点
- 鼠标控制:模拟鼠标移动和点击操作。
- 键盘输入:在当前光标位置输入文本。
- 屏幕截图:截取全屏或指定窗口的图像,并可选择保存到本地下载目录。
- 光学字符识别 (OCR):从屏幕截图中提取文本内容。
- 窗口管理:列出和激活系统中的窗口。
- 键盘按键:模拟按下键盘按键。
- 拖拽操作:模拟鼠标拖拽动作。
安装步骤
方法一:使用 'uvx' 运行 (推荐)
'uvx' 是一个可以方便地运行和管理 Python 包的工具。如果你的 MCP 客户端支持 'uvx',这是最快速启动 Computer Control MCP 服务器的方式。
- 确保你的 MCP 客户端支持 'uvx' 并已正确配置。
- 在 MCP 客户端的服务器配置文件中,添加以下配置信息。
方法二:全局安装 'computer-control-mcp' 包
- 确保你的 Python 环境已配置好,并且 'pip' 工具可用。
- 打开终端或命令提示符,运行以下命令安装 'computer-control-mcp' 包:
pip install computer-control-mcp - 安装完成后,即可使用 'computer-control-mcp' 命令启动服务器。
服务器配置
MCP 客户端需要配置服务器的启动命令和参数才能连接到 Computer Control MCP 服务器。以下是两种安装方法对应的服务器配置信息,请根据你的安装方法选择其一添加到 MCP 客户端的配置文件中。
如果使用 'uvx' 运行,请使用以下配置:
{ "mcpServers": { "computer-control-mcp": { // 服务器名称,可以自定义 "command": "uvx", // 启动命令,指定使用 uvx 工具 "args": ["computer-control-mcp@latest"] // 启动参数,指定运行 computer-control-mcp 包的最新版本 } } }
如果全局安装 'computer-control-mcp' 包,请使用以下配置:
{ "mcpServers": { "computer-control-mcp": { // 服务器名称,可以自定义 "command": "computer-control-mcp", // 启动命令,直接运行 computer-control-mcp 命令 "args": [] // 启动参数,此处无需额外参数 } } }
基本使用方法
-
启动服务器:
- 使用 'uvx': MCP 客户端会自动通过 'uvx' 启动服务器。
- 全局安装: 在终端或命令提示符中运行 'computer-control-mcp' 命令。服务器启动后,会显示 "Starting Computer Control MCP server..." 的信息。
-
客户端连接: 配置完成后,MCP 客户端应该能够自动连接到 Computer Control MCP 服务器。
-
调用工具: 通过 MCP 客户端,你可以调用服务器提供的各种工具,例如 'click_screen' (鼠标点击), 'type_text' (文本输入), 'take_screenshot' (屏幕截图) 等,实现计算机的自动化控制。具体的工具调用方法和参数,请参考 MCP 客户端的文档和 Computer Control MCP 项目的代码及API文档('docs/api.md')。
注意: 首次使用全局安装方式启动服务器后,如果需要使用最新版本,可以运行 'uv cache clean' 清理缓存,然后再次使用 'uvx computer-control-mcp' 或重新全局安装来确保使用最新版本。
信息
分类
桌面与硬件