项目简介

GBOX MCP 服务器是基于Model Context Protocol (MCP) 构建的后端服务,旨在为AI智能体提供统一的接口,以远程或本地方式控制多种计算环境。它支持Android应用测试、Web自动化以及通用计算任务,能够与Gbox.ai提供的云虚拟机/物理机或用户本地设备进行交互。

主要功能点

  • 多平台支持: 可控制Android设备、Linux桌面环境和浏览器会话。
  • 标准化通信: 通过JSON-RPC协议与LLM客户端通信,遵循MCP规范。
  • 工具调用: 提供丰富的工具集,例如启动/关闭设备、安装/卸载应用、进行点击、滑动、输入、截屏等操作。
  • 会话管理: 支持Streamable HTTP和Stdio等多种传输协议,并具备会话管理能力。
  • 上下文提供: 向LLM提供资源访问、工具执行和Prompt模板渲染能力。
  • 安全认证: 通过JWT实现客户端认证。

安装步骤

  1. 确保您已安装Node.js (v18或更高版本) 和npm。
  2. 通过npm安装GBOX MCP服务器包:
    npm install -g @gbox.ai/mcp-server
  3. 如果您想使用本地Android设备,请确保已安装Scrcpy。服务器会尝试自动安装,但如果失败,请根据您的操作系统手动安装:
    • macOS: 'brew install scrcpy'
    • Linux: 'sudo apt-get update && sudo apt-get install -y scrcpy'
    • Windows: 'choco install scrcpy'

服务器配置

MCP客户端需要配置服务器启动命令及参数。以下是不同平台模式下的配置示例,这些是MCP客户端用于连接GBOX MCP服务器所需的配置信息:

// Android 模式的MCP客户端配置示例
{
  "server_name": "gbox-android", // MCP服务器的名称
  "command": "npx", // 启动服务器的命令
  "args": [ // 启动命令的参数
    "-y",
    "@gbox.ai/mcp-server@latest",
    "--android" // 指定启动Android平台模式
  ],
  "env": { // 环境变量配置
    "GBOX_API_KEY": "YOUR_GBOX_API_KEY", // 替换为您的Gbox API Key
    "GBOX_BASE_URL": "https://gbox.ai/api/v1" // Gbox API基础URL
  },
  "description": "GBOX Android MCP 服务器用于控制Android设备"
}

// Linux 模式的MCP客户端配置示例
{
  "server_name": "gbox-linux",
  "command": "npx",
  "args": [
    "-y",
    "@gbox.ai/mcp-server@latest",
    "--linux" // 指定启动Linux平台模式
  ],
  "env": {
    "GBOX_API_KEY": "YOUR_GBOX_API_KEY",
    "GBOX_BASE_URL": "https://gbox.ai/api/v1"
  },
  "description": "GBOX Linux MCP 服务器用于控制Linux桌面环境"
}

// 浏览器模式的MCP客户端配置示例
{
  "server_name": "gbox-browser",
  "command": "npx",
  "args": [
    "-y",
    "@gbox.ai/mcp-server@latest",
    "--browser" // 指定启动浏览器平台模式
  ],
  "env": {
    "GBOX_API_KEY": "YOUR_GBOX_API_KEY",
    "GBOX_BASE_URL": "https://gbox.ai/api/v1"
  },
  "description": "GBOX Browser MCP 服务器用于Web自动化和浏览器管理"
}

请注意:如果您已在CLI中成功运行'gbox login',可以省略'env'部分。您的API Key可在gbox.ai/dashboard的"Personal"标签页中获取。

基本使用方法

GBOX MCP服务器通常由兼容的MCP客户端(如AI智能体或开发工具)自动连接和调用。一旦服务器按上述配置启动,客户端即可通过JSON-RPC协议发送请求,调用已注册的工具来执行各种操作。例如,客户端可以调用'start_android_box'工具来启动一个Android环境,然后使用'tap'、'type'、'screenshot'等工具与设备进行交互。服务器将处理这些请求并返回执行结果,包括文本和图像(如截屏)。

信息

分类

桌面与硬件