使用说明
项目简介
MCP Manus浏览器自动化代理是一个基于 Model Context Protocol (MCP) 构建的后端服务器,旨在为大型语言模型 (LLM) 提供浏览器自动化能力。通过该服务器,LLM 可以调用预定义的工具来控制浏览器执行各种操作,例如页面浏览、元素点击、文本输入等,从而实现更丰富的交互式应用。该项目基于 'fastmcp' 框架开发,并集成了 'browser-use' 库以实现浏览器控制功能。
主要功能点
- 浏览器自动化工具: 提供 'get_planner_state' 和 'execute_actions' 两个核心 MCP 工具,允许 LLM 获取浏览器状态和执行浏览器操作序列。
- 状态管理: 服务器维护浏览器会话状态,包括页面 URL、标题、标签页信息和可交互元素等,为 LLM 提供上下文感知能力。
- 可配置的浏览器环境: 支持配置浏览器启动参数,例如是否以 Headless 模式运行、窗口大小、安全设置等。
- 会话录制: 支持将浏览器会话录制为视频,用于调试和回溯。
- 详细日志: 提供详细的日志输出,方便开发者调试和监控服务器运行状态。
安装步骤
-
克隆仓库:
git clone <仓库URL> cd mcp-manus请将 '<仓库URL>' 替换为 'https://github.com/ashley-ha/mcp-manus'。
-
设置 Python 环境: 确保已安装 Python 3.12 或更高版本,并使用 'uv' 包管理器创建虚拟环境并安装依赖:
uv venv source .venv/bin/activate # 或者 .venv\Scripts\activate (Windows) uv sync
服务器配置
MCP 服务器需要配置到 MCP 客户端中才能使用。以 Claude Desktop 为例,需要在其配置文件中添加如下服务器配置信息。请注意将 '/ABSOLUTE/PATH/TO/mcp-manus' 替换为 mcp-manus 仓库在您本地机器上的绝对路径。
{ "mcpServers": { "browser-automation": { // 服务器名称,可以自定义 "command": "uv", // 启动命令,使用 uv 包管理器 "args": [ // 启动参数 "--directory", // 指定工作目录 "/ABSOLUTE/PATH/TO/mcp-manus", // 替换为 mcp-manus 仓库的绝对路径 "run", // 运行 Python 脚本 "browser-use.py" // 服务器主脚本文件名 ] } } }
基本使用方法
-
启动 MCP 服务器: 按照上述 服务器配置 中的说明,在 MCP 客户端(如 Claude Desktop)中配置并启动 'browser-automation' 服务器。
-
在 LLM 中调用工具: 在 LLM 的 Prompt 中,可以指示 LLM 调用 'get_planner_state' 工具来获取当前浏览器状态和可操作元素信息。 然后,根据 LLM 的规划,可以调用 'execute_actions' 工具并提供相应的浏览器操作指令,以控制浏览器执行指定动作。
注意:
- 运行服务器前请确保已安装 Google Chrome 浏览器,并关闭所有 Chrome 浏览器实例。
- 服务器默认以非 Headless 模式运行,会显示浏览器窗口。
- 首次运行或浏览器状态异常时,服务器可能会重新初始化浏览器实例。
- 'get_planner_state' 工具必须在 'execute_actions' 工具之前调用,以确保操作基于最新的浏览器状态。
- 如果在执行 'execute_actions' 过程中页面 DOM 结构发生较大变化,操作序列可能会中断,需要重新获取浏览器状态。
信息
分类
开发者工具