项目简介
VibeBrowser 是一个基于 Chromium 的开源浏览器,旨在原生运行 AI 代理,提供私密、用户自定义的浏览自动化体验。它将浏览器自身的功能和网页内容作为“资源”和“工具”暴露给大语言模型(LLM)客户端,允许 LLM 直接与浏览器交互,执行任务,从而实现智能化的浏览和自动化操作。VibeBrowser 强调隐私保护,支持使用用户自己的 API 密钥或本地模型,确保数据不离开本地设备。
主要功能点
- AI 代理原生运行: AI 代理在浏览器本地运行,而非云端,保障用户数据隐私。
- MCP 服务器功能: VibeBrowser 可作为 MCP 服务器,向外部 LLM 客户端(如 'claude-code' 或 'gemini-cli')提供上下文信息和可调用的浏览器功能。
- 隐私保护: 支持使用自己的 API 密钥或本地运行 Ollama/LMStudio 模型,确保浏览数据和敏感信息保留在本地。
- 任务自动化: 允许 AI 代理无缝自动化日常浏览任务,例如在购物网站下单或填写表格。
- 熟悉的用户界面: 沿袭 Google Chrome 的界面,兼容现有浏览器扩展。
- (即将推出)AI 广告拦截器: 内置 AI 驱动的广告拦截功能,提升浏览体验。
安装步骤
VibeBrowser 是一个 Chromium Fork,通常需要从源代码编译安装或下载预编译版本。
- 克隆仓库: 使用 Git 命令克隆 VibeBrowser 的 GitHub 仓库到本地。 'git clone https://github.com/ttracx/vibebrowser.git'
- 进入项目目录: 'cd vibebrowser'
- 查看官方安装指南: 由于 VibeBrowser 是一个浏览器项目,其编译和安装过程可能较为复杂,具体步骤请参考其官方文档(例如仓库中的 'BUILD.md' 或 'INSTALL.md' 文件,此处未提供)。通常会涉及安装开发依赖、配置构建环境等。
- 安装 MCP 服务器组件: 仓库中提到“可以安装我们的 MCP 服务器”,这可能是一个独立步骤,或者集成在浏览器构建过程中。请查阅项目文档以获取确切的 MCP 服务器安装和启动说明。
服务器配置 (JSON-RPC)
作为 MCP 服务器,VibeBrowser 需要提供一个启动命令和可能的参数,以便 MCP 客户端能够连接并与其通信。以下是一个示例 JSON 配置,用于向 MCP 客户端声明如何连接到 VibeBrowser MCP 服务器。实际的 'command' 和 'args' 可能会因 VibeBrowser 的实现而异,请根据 VibeBrowser 官方文档提供的信息进行调整。
{ "server_name": "VibeBrowser MCP Server", "description": "连接到 VibeBrowser,以编程方式通过 AI 代理控制浏览器操作和获取网页上下文。这允许您的 LLM 客户端使用浏览器功能作为工具。", "command": "path/to/vibebrowser", "args": [ "--enable-mcp-server", "--mcp-port", "8000", "--profile-dir", "/path/to/browser/profile" ], "capabilities": { "resources": [ { "name": "current_page_content", "description": "获取当前活动标签页的完整HTML内容或纯文本。", "parameters": { "type": "object", "properties": { "format": { "type": "string", "enum": ["html", "text"], "description": "所需内容的格式。" } } } }, { "name": "browsing_history", "description": "访问浏览器历史记录(需要用户授权)。" }, { "name": "current_url", "description": "获取当前活动标签页的URL。" } ], "tools": [ { "name": "navigate", "description": "导航到指定的URL。", "parameters": { "type": "object", "properties": { "url": { "type": "string", "description": "要导航到的完整URL。" } }, "required": ["url"] } }, { "name": "click_element", "description": "点击网页上指定选择器匹配的元素。", "parameters": { "type": "object", "properties": { "selector": { "type": "string", "description": "用于查找要点击的元素的CSS选择器。" } }, "required": ["selector"] } }, { "name": "fill_form_field", "description": "在网页上指定选择器匹配的输入字段中填充文本。", "parameters": { "type": "object", "properties": { "selector": { "type": "string", "description": "用于查找输入字段的CSS选择器。" }, "text": { "type": "string", "description": "要填充到字段中的文本。" } }, "required": ["selector", "text"] } }, { "name": "take_screenshot", "description": "对当前浏览器窗口进行截图。", "parameters": { "type": "object", "properties": { "full_page": { "type": "boolean", "description": "是否截取整个页面,默认为当前视口。" } } } } ], "prompts": [] } }
- 'command': VibeBrowser 可执行文件的路径。例如,在 Linux 上可能是 '/usr/local/bin/vibebrowser',在 macOS 上可能是 '/Applications/VibeBrowser.app/Contents/MacOS/VibeBrowser'。
- 'args': 传递给 VibeBrowser 进程的命令行参数。
- '--enable-mcp-server': 启用 MCP 服务器模式的标志。
- '--mcp-port 8000': 指定 MCP 服务器监听的端口。请根据实际需求选择一个可用的端口。
- '--profile-dir /path/to/browser/profile': 指定浏览器用户配置文件的存储目录,这对于维持会话和隐私设置很重要。
基本使用方法
- 启动 VibeBrowser MCP 服务器: 按照上述配置,在命令行中执行 'command' 和 'args' 来启动 VibeBrowser,使其进入 MCP 服务器模式并监听指定端口。
- 连接 MCP 客户端: 使用任何支持 Model Context Protocol 的 LLM 客户端(例如 'claude-code' 或 'gemini-cli'),配置它连接到 VibeBrowser MCP 服务器所监听的端口。
- LLM 调用浏览器功能: 您的 LLM 客户端现在可以通过 JSON-RPC 请求,调用 VibeBrowser 作为 MCP 服务器提供的“工具”来执行浏览器操作(如打开网页、点击元素、填写表单),或获取“资源”(如当前网页内容、浏览历史)作为上下文信息。
信息
分类
桌面与硬件