项目简介
MCP Browser是一个符合MCP协议标准的服务器实现,专门为AI助手提供浏览器自动化能力。它通过Chrome扩展实现与浏览器的实时连接,支持智能导航、表单填写、元素点击、屏幕截图等丰富功能,让AI能够直接控制和操作浏览器。
主要功能
- 🎯 高级DOM交互:点击元素、填写表单、提交数据、选择下拉菜单、等待元素加载
- 📊 控制台日志捕获:实时从所有浏览器标签捕获日志,支持高级过滤
- 📷 屏幕截图:通过扩展支持的视口捕获
- 🌐 智能导航:程序化浏览器导航,支持URL验证
- 🔄 自动发现:动态端口分配(默认8851-8899)和冲突避免
- 🤖 AI就绪:5个整合的MCP工具,优化提示效率
- ⚡ WebSocket通信:实时双向浏览器通信
- 💾 JSONL存储:自动日志轮换(50MB),7天保留期
- 🔧 服务导向架构:清晰的依赖注入分离
安装步骤
环境要求
- Python 3.10+
- Chrome/Chromium浏览器
- macOS或Linux操作系统(不支持Windows)
快速安装(推荐)
pip install mcp-browser mcp-browser extension install mcp-browser install mcp-browser start --background
Chrome扩展加载
- 打开Chrome浏览器,访问 'chrome://extensions'
- 启用"开发者模式"
- 点击"加载已解压的扩展程序"
- 选择 '~/mcp-browser-extensions/chrome/'目录
开发安装
git clone https://github.com/browserpymcp/mcp-browser.git cd mcp-browser make install make ext-deploy mcp-browser start --background
服务器配置
MCP客户端(如Claude Code)需要配置以下信息才能连接MCP服务器:
{ "mcpServers": { "mcp-browser": { "command": "mcp-browser", "args": ["mcp"] } }
基本使用方法
启动服务器
mcp-browser start --background # 后台运行(推荐) mcp-browser start # 前台运行(调试用)
MCP工具接口
服务器提供5个核心工具:
- 'browser_action' - 导航/点击/填写/选择/等待操作
- 'browser_query' - 查询日志/元素/能力
- 'browser_screenshot' - 扩展支持的屏幕截图
- 'browser_form' - 表单填写和提交
- 'browser_extract' - 可读内容或语义DOM提取
连接验证
- 确保Chrome扩展图标显示绿色(已连接)
- 使用 'mcp-browser status' 检查服务器状态
- 使用 'mcp-browser doctor' 诊断和修复问题
信息
分类
开发者工具