使用说明

项目简介

WebLook 是一个命令行工具,主要用于捕获网页的屏幕截图和录制动画 GIF。它扩展了实验性的 MCP (Model Context Protocol) 服务器功能,允许其他 MCP 客户端(如 AI 模型)通过标准协议调用 WebLook 的网页捕获能力。

主要功能点

  • 网页截图服务: 提供 'capture_screenshot' 上下文动作,允许 MCP 客户端指定 URL 并获取网页截图的 Base64 编码图像数据。
  • 网页录制服务: 提供 'record_interaction' 上下文动作,允许 MCP 客户端指定 URL 和录制时长,获取网页动态交互过程的动画 GIF 的 Base64 编码图像数据。
  • 实验性 MCP 服务器: 通过命令行参数 '--mcp-server' 启动,监听指定地址和端口,等待 MCP 客户端的连接和请求。
  • 基于 Mock SDK: 当前 MCP 服务器实现基于一个 Mock SDK,用于开发和测试目的,可能不完全符合正式 MCP 协议规范。

安装步骤

  1. 克隆仓库:
    git clone https://github.com/TrippingKelsea/weblookrs.git
    cd weblookrs
  2. 编译项目 (包含实验性 MCP 支持):
    cargo build --release --features mcp_experimental
    编译后的可执行文件 'weblook' 位于 'target/release/' 目录下。

服务器配置

MCP 客户端需要配置以下信息以连接 WebLook MCP 服务器。以下是一个 JSON 格式的配置示例,通常在 MCP 客户端的配置文件中设置:

{
  "serverName": "WebLook MCP Server",
  "command": "/path/to/weblook",  // WebLook 可执行文件的路径,根据实际情况修改
  "args": [
    "--mcp-server",
    "127.0.0.1:8000"         // MCP 服务器监听的地址和端口,可以根据需要修改
  ]
}

参数注释:

  • 'serverName': MCP 服务器的名称,可以自定义。
  • 'command': 启动 WebLook MCP 服务器的命令,通常是 'weblook' 可执行文件的绝对路径。请根据实际 'weblook' 可执行文件的位置进行修改。
  • 'args': 传递给 'weblook' 命令的参数列表。
    • '--mcp-server': 指定 WebLook 以 MCP 服务器模式启动。
    • '127.0.0.1:8000': 指定服务器监听的 IP 地址和端口。可以根据需要修改 IP 地址(例如 '0.0.0.0' 允许所有 IP 连接)和端口号。

注意:

  • 确保将 '/path/to/weblook' 替换为 'weblook' 可执行文件的实际路径。
  • WebLook MCP 服务器是实验性功能,可能不稳定或存在未完善之处。
  • 当前实现使用了 Mock SDK,可能与正式 MCP 协议存在差异。

基本使用方法

  1. 启动 WebLook MCP 服务器: 打开终端,导航到 'weblook' 项目根目录,运行以下命令启动 MCP 服务器:

    target/release/weblook --mcp-server 127.0.0.1:8000

    服务器默认监听 '127.0.0.1:8000' 地址。可以根据需要修改启动命令中的地址和端口。

  2. 配置 MCP 客户端并连接: 在 MCP 客户端中,根据上述 “服务器配置” 示例配置 WebLook MCP 服务器的连接信息。启动 MCP 客户端,客户端应该能够连接到 WebLook MCP 服务器。

  3. 调用上下文动作: MCP 客户端可以使用 MCP 协议,向 WebLook MCP 服务器发送请求,调用 'capture_screenshot' 或 'record_interaction' 上下文动作,并传递必要的参数(例如 'url')。服务器将返回包含 Base64 编码图像数据的 JSON 响应。

  4. 停止 WebLook MCP 服务器: 在运行 WebLook MCP 服务器的终端中,按下 'Ctrl+C' 即可停止服务器。

信息

分类

桌面与硬件