使用说明

项目简介

Computer Control MCP 是一个基于 Model Context Protocol (MCP) 构建的服务器,旨在为大型语言模型(LLM)客户端提供计算机操作能力。它通过标准化的 MCP 协议,允许 LLM 应用调用预定义的工具来控制用户的计算机,例如移动鼠标、输入文本、截取屏幕、识别屏幕文字等。该项目无需外部依赖,易于安装和部署,为构建能够与桌面环境交互的智能应用提供了基础。

主要功能点

  • 鼠标控制:模拟鼠标移动和点击操作。
  • 键盘输入:在当前光标位置输入文本。
  • 屏幕截图:截取全屏或指定窗口的图像,并可选择保存到本地下载目录。
  • 光学字符识别 (OCR):从屏幕截图中提取文本内容。
  • 窗口管理:列出和激活系统中的窗口。
  • 键盘按键:模拟按下键盘按键。
  • 拖拽操作:模拟鼠标拖拽动作。

安装步骤

方法一:使用 'uvx' 运行 (推荐)

'uvx' 是一个可以方便地运行和管理 Python 包的工具。如果你的 MCP 客户端支持 'uvx',这是最快速启动 Computer Control MCP 服务器的方式。

  1. 确保你的 MCP 客户端支持 'uvx' 并已正确配置。
  2. 在 MCP 客户端的服务器配置文件中,添加以下配置信息。

方法二:全局安装 'computer-control-mcp' 包

  1. 确保你的 Python 环境已配置好,并且 'pip' 工具可用。
  2. 打开终端或命令提示符,运行以下命令安装 'computer-control-mcp' 包:
    pip install computer-control-mcp
  3. 安装完成后,即可使用 'computer-control-mcp' 命令启动服务器。

服务器配置

MCP 客户端需要配置服务器的启动命令和参数才能连接到 Computer Control MCP 服务器。以下是两种安装方法对应的服务器配置信息,请根据你的安装方法选择其一添加到 MCP 客户端的配置文件中。

如果使用 'uvx' 运行,请使用以下配置:

{
  "mcpServers": {
    "computer-control-mcp": {  // 服务器名称,可以自定义
      "command": "uvx",      // 启动命令,指定使用 uvx 工具
      "args": ["computer-control-mcp@latest"] // 启动参数,指定运行 computer-control-mcp 包的最新版本
    }
  }
}

如果全局安装 'computer-control-mcp' 包,请使用以下配置:

{
  "mcpServers": {
    "computer-control-mcp": {  // 服务器名称,可以自定义
      "command": "computer-control-mcp", // 启动命令,直接运行 computer-control-mcp 命令
      "args": []                   // 启动参数,此处无需额外参数
    }
  }
}

基本使用方法

  1. 启动服务器

    • 使用 'uvx': MCP 客户端会自动通过 'uvx' 启动服务器。
    • 全局安装: 在终端或命令提示符中运行 'computer-control-mcp' 命令。服务器启动后,会显示 "Starting Computer Control MCP server..." 的信息。
  2. 客户端连接: 配置完成后,MCP 客户端应该能够自动连接到 Computer Control MCP 服务器。

  3. 调用工具: 通过 MCP 客户端,你可以调用服务器提供的各种工具,例如 'click_screen' (鼠标点击), 'type_text' (文本输入), 'take_screenshot' (屏幕截图) 等,实现计算机的自动化控制。具体的工具调用方法和参数,请参考 MCP 客户端的文档和 Computer Control MCP 项目的代码及API文档('docs/api.md')。

注意: 首次使用全局安装方式启动服务器后,如果需要使用最新版本,可以运行 'uv cache clean' 清理缓存,然后再次使用 'uvx computer-control-mcp' 或重新全局安装来确保使用最新版本。

信息

分类

桌面与硬件