项目简介

VibeBrowser 是一个基于 Chromium 的开源浏览器,旨在原生运行 AI 代理,提供私密、用户自定义的浏览自动化体验。它将浏览器自身的功能和网页内容作为“资源”和“工具”暴露给大语言模型(LLM)客户端,允许 LLM 直接与浏览器交互,执行任务,从而实现智能化的浏览和自动化操作。VibeBrowser 强调隐私保护,支持使用用户自己的 API 密钥或本地模型,确保数据不离开本地设备。

主要功能点

  • AI 代理原生运行: AI 代理在浏览器本地运行,而非云端,保障用户数据隐私。
  • MCP 服务器功能: VibeBrowser 可作为 MCP 服务器,向外部 LLM 客户端(如 'claude-code' 或 'gemini-cli')提供上下文信息和可调用的浏览器功能。
  • 隐私保护: 支持使用自己的 API 密钥或本地运行 Ollama/LMStudio 模型,确保浏览数据和敏感信息保留在本地。
  • 任务自动化: 允许 AI 代理无缝自动化日常浏览任务,例如在购物网站下单或填写表格。
  • 熟悉的用户界面: 沿袭 Google Chrome 的界面,兼容现有浏览器扩展。
  • (即将推出)AI 广告拦截器: 内置 AI 驱动的广告拦截功能,提升浏览体验。

安装步骤

VibeBrowser 是一个 Chromium Fork,通常需要从源代码编译安装或下载预编译版本。

  1. 克隆仓库: 使用 Git 命令克隆 VibeBrowser 的 GitHub 仓库到本地。 'git clone https://github.com/ttracx/vibebrowser.git'
  2. 进入项目目录: 'cd vibebrowser'
  3. 查看官方安装指南: 由于 VibeBrowser 是一个浏览器项目,其编译和安装过程可能较为复杂,具体步骤请参考其官方文档(例如仓库中的 'BUILD.md' 或 'INSTALL.md' 文件,此处未提供)。通常会涉及安装开发依赖、配置构建环境等。
  4. 安装 MCP 服务器组件: 仓库中提到“可以安装我们的 MCP 服务器”,这可能是一个独立步骤,或者集成在浏览器构建过程中。请查阅项目文档以获取确切的 MCP 服务器安装和启动说明。

服务器配置 (JSON-RPC)

作为 MCP 服务器,VibeBrowser 需要提供一个启动命令和可能的参数,以便 MCP 客户端能够连接并与其通信。以下是一个示例 JSON 配置,用于向 MCP 客户端声明如何连接到 VibeBrowser MCP 服务器。实际的 'command' 和 'args' 可能会因 VibeBrowser 的实现而异,请根据 VibeBrowser 官方文档提供的信息进行调整。

{
  "server_name": "VibeBrowser MCP Server",
  "description": "连接到 VibeBrowser,以编程方式通过 AI 代理控制浏览器操作和获取网页上下文。这允许您的 LLM 客户端使用浏览器功能作为工具。",
  "command": "path/to/vibebrowser",
  "args": [
    "--enable-mcp-server",
    "--mcp-port",
    "8000",
    "--profile-dir",
    "/path/to/browser/profile"
  ],
  "capabilities": {
    "resources": [
      {
        "name": "current_page_content",
        "description": "获取当前活动标签页的完整HTML内容或纯文本。",
        "parameters": {
          "type": "object",
          "properties": {
            "format": {
              "type": "string",
              "enum": ["html", "text"],
              "description": "所需内容的格式。"
            }
          }
        }
      },
      {
        "name": "browsing_history",
        "description": "访问浏览器历史记录(需要用户授权)。"
      },
      {
        "name": "current_url",
        "description": "获取当前活动标签页的URL。"
      }
    ],
    "tools": [
      {
        "name": "navigate",
        "description": "导航到指定的URL。",
        "parameters": {
          "type": "object",
          "properties": {
            "url": {
              "type": "string",
              "description": "要导航到的完整URL。"
            }
          },
          "required": ["url"]
        }
      },
      {
        "name": "click_element",
        "description": "点击网页上指定选择器匹配的元素。",
        "parameters": {
          "type": "object",
          "properties": {
            "selector": {
              "type": "string",
              "description": "用于查找要点击的元素的CSS选择器。"
            }
          },
          "required": ["selector"]
        }
      },
      {
        "name": "fill_form_field",
        "description": "在网页上指定选择器匹配的输入字段中填充文本。",
        "parameters": {
          "type": "object",
          "properties": {
            "selector": {
              "type": "string",
              "description": "用于查找输入字段的CSS选择器。"
            },
            "text": {
              "type": "string",
              "description": "要填充到字段中的文本。"
            }
          },
          "required": ["selector", "text"]
        }
      },
      {
        "name": "take_screenshot",
        "description": "对当前浏览器窗口进行截图。",
        "parameters": {
          "type": "object",
          "properties": {
            "full_page": {
              "type": "boolean",
              "description": "是否截取整个页面,默认为当前视口。"
            }
          }
        }
      }
    ],
    "prompts": []
  }
}
  • 'command': VibeBrowser 可执行文件的路径。例如,在 Linux 上可能是 '/usr/local/bin/vibebrowser',在 macOS 上可能是 '/Applications/VibeBrowser.app/Contents/MacOS/VibeBrowser'。
  • 'args': 传递给 VibeBrowser 进程的命令行参数。
    • '--enable-mcp-server': 启用 MCP 服务器模式的标志。
    • '--mcp-port 8000': 指定 MCP 服务器监听的端口。请根据实际需求选择一个可用的端口。
    • '--profile-dir /path/to/browser/profile': 指定浏览器用户配置文件的存储目录,这对于维持会话和隐私设置很重要。

基本使用方法

  1. 启动 VibeBrowser MCP 服务器: 按照上述配置,在命令行中执行 'command' 和 'args' 来启动 VibeBrowser,使其进入 MCP 服务器模式并监听指定端口。
  2. 连接 MCP 客户端: 使用任何支持 Model Context Protocol 的 LLM 客户端(例如 'claude-code' 或 'gemini-cli'),配置它连接到 VibeBrowser MCP 服务器所监听的端口。
  3. LLM 调用浏览器功能: 您的 LLM 客户端现在可以通过 JSON-RPC 请求,调用 VibeBrowser 作为 MCP 服务器提供的“工具”来执行浏览器操作(如打开网页、点击元素、填写表单),或获取“资源”(如当前网页内容、浏览历史)作为上下文信息。

信息

分类

桌面与硬件