项目简介

MCP Browser是一个符合MCP协议标准的服务器实现,专门为AI助手提供浏览器自动化能力。它通过Chrome扩展实现与浏览器的实时连接,支持智能导航、表单填写、元素点击、屏幕截图等丰富功能,让AI能够直接控制和操作浏览器。

主要功能

  • 🎯 高级DOM交互:点击元素、填写表单、提交数据、选择下拉菜单、等待元素加载
  • 📊 控制台日志捕获:实时从所有浏览器标签捕获日志,支持高级过滤
  • 📷 屏幕截图:通过扩展支持的视口捕获
  • 🌐 智能导航:程序化浏览器导航,支持URL验证
  • 🔄 自动发现:动态端口分配(默认8851-8899)和冲突避免
  • 🤖 AI就绪:5个整合的MCP工具,优化提示效率
  • ⚡ WebSocket通信:实时双向浏览器通信
  • 💾 JSONL存储:自动日志轮换(50MB),7天保留期
  • 🔧 服务导向架构:清晰的依赖注入分离

安装步骤

环境要求

  • Python 3.10+
  • Chrome/Chromium浏览器
  • macOS或Linux操作系统(不支持Windows)

快速安装(推荐)

pip install mcp-browser
mcp-browser extension install
mcp-browser install
mcp-browser start --background

Chrome扩展加载

  1. 打开Chrome浏览器,访问 'chrome://extensions'
  2. 启用"开发者模式"
  3. 点击"加载已解压的扩展程序"
  4. 选择 '~/mcp-browser-extensions/chrome/'目录

开发安装

git clone https://github.com/browserpymcp/mcp-browser.git
cd mcp-browser
make install
make ext-deploy
mcp-browser start --background

服务器配置

MCP客户端(如Claude Code)需要配置以下信息才能连接MCP服务器:

{
  "mcpServers": {
    "mcp-browser": {
      "command": "mcp-browser",
      "args": ["mcp"]
    }
}

基本使用方法

启动服务器

mcp-browser start --background  # 后台运行(推荐)
mcp-browser start                    # 前台运行(调试用)

MCP工具接口

服务器提供5个核心工具:

  • 'browser_action' - 导航/点击/填写/选择/等待操作
  • 'browser_query' - 查询日志/元素/能力
  • 'browser_screenshot' - 扩展支持的屏幕截图
  • 'browser_form' - 表单填写和提交
  • 'browser_extract' - 可读内容或语义DOM提取

连接验证

  1. 确保Chrome扩展图标显示绿色(已连接)
  2. 使用 'mcp-browser status' 检查服务器状态
  3. 使用 'mcp-browser doctor' 诊断和修复问题

信息

分类

开发者工具