使用说明

项目简介

MCP Manus浏览器自动化代理是一个基于 Model Context Protocol (MCP) 构建的后端服务器,旨在为大型语言模型 (LLM) 提供浏览器自动化能力。通过该服务器,LLM 可以调用预定义的工具来控制浏览器执行各种操作,例如页面浏览、元素点击、文本输入等,从而实现更丰富的交互式应用。该项目基于 'fastmcp' 框架开发,并集成了 'browser-use' 库以实现浏览器控制功能。

主要功能点

  • 浏览器自动化工具: 提供 'get_planner_state' 和 'execute_actions' 两个核心 MCP 工具,允许 LLM 获取浏览器状态和执行浏览器操作序列。
  • 状态管理: 服务器维护浏览器会话状态,包括页面 URL、标题、标签页信息和可交互元素等,为 LLM 提供上下文感知能力。
  • 可配置的浏览器环境: 支持配置浏览器启动参数,例如是否以 Headless 模式运行、窗口大小、安全设置等。
  • 会话录制: 支持将浏览器会话录制为视频,用于调试和回溯。
  • 详细日志: 提供详细的日志输出,方便开发者调试和监控服务器运行状态。

安装步骤

  1. 克隆仓库:

    git clone <仓库URL>
    cd mcp-manus

    请将 '<仓库URL>' 替换为 'https://github.com/ashley-ha/mcp-manus'。

  2. 设置 Python 环境: 确保已安装 Python 3.12 或更高版本,并使用 'uv' 包管理器创建虚拟环境并安装依赖:

    uv venv
    source .venv/bin/activate  # 或者 .venv\Scripts\activate (Windows)
    uv sync

服务器配置

MCP 服务器需要配置到 MCP 客户端中才能使用。以 Claude Desktop 为例,需要在其配置文件中添加如下服务器配置信息。请注意将 '/ABSOLUTE/PATH/TO/mcp-manus' 替换为 mcp-manus 仓库在您本地机器上的绝对路径

{
  "mcpServers": {
    "browser-automation": {  // 服务器名称,可以自定义
      "command": "uv",      // 启动命令,使用 uv 包管理器
      "args": [            // 启动参数
        "--directory",     // 指定工作目录
        "/ABSOLUTE/PATH/TO/mcp-manus", // 替换为 mcp-manus 仓库的绝对路径
        "run",             // 运行 Python 脚本
        "browser-use.py"   // 服务器主脚本文件名
      ]
    }
  }
}

基本使用方法

  1. 启动 MCP 服务器: 按照上述 服务器配置 中的说明,在 MCP 客户端(如 Claude Desktop)中配置并启动 'browser-automation' 服务器。

  2. 在 LLM 中调用工具: 在 LLM 的 Prompt 中,可以指示 LLM 调用 'get_planner_state' 工具来获取当前浏览器状态和可操作元素信息。 然后,根据 LLM 的规划,可以调用 'execute_actions' 工具并提供相应的浏览器操作指令,以控制浏览器执行指定动作。

注意:

  • 运行服务器前请确保已安装 Google Chrome 浏览器,并关闭所有 Chrome 浏览器实例。
  • 服务器默认以非 Headless 模式运行,会显示浏览器窗口。
  • 首次运行或浏览器状态异常时,服务器可能会重新初始化浏览器实例。
  • 'get_planner_state' 工具必须在 'execute_actions' 工具之前调用,以确保操作基于最新的浏览器状态。
  • 如果在执行 'execute_actions' 过程中页面 DOM 结构发生较大变化,操作序列可能会中断,需要重新获取浏览器状态。

信息

分类

开发者工具