使用说明

项目简介

GPT Computer Assistant (GCA) 是一个开源框架,旨在构建垂直 AI 智能体。它不仅支持多种大型语言模型(LLM),还集成了 Model Context Protocol (MCP) 等新技术,允许用户通过结构化的 API 快速构建自己的垂直 AI 智能体。GCA 可以作为 MCP 服务器,为 LLM 客户端提供资源和工具管理能力,实现计算机操作的自动化和智能化。

主要功能点

  • 资源管理: GCA 作为 MCP 服务器,可以托管和管理各种资源,例如文件系统、内存数据等(通过集成的 MCP server 实现)。
  • 工具注册与执行: 支持注册和执行各种工具,例如网页搜索、终端命令执行、GUI 操作等,允许 LLM 客户端调用这些工具来扩展其功能。
  • Prompt 模板: 虽然文档没有明确提及 Prompt 模板,但 GCA 框架支持灵活的任务定义和 Agent 编排,可以理解为通过代码实现 Prompt 的定制和管理。
  • 多种部署方式: 支持云端、Docker 和本地部署,方便用户根据需求选择合适的运行环境。
  • JSON-RPC over HTTP API: 通过 Flask 提供的 HTTP API 接口与客户端通信,实际通信协议可以视为 JSON-RPC over HTTP。

安装步骤

  1. 安装 Python: 确保已安装 Python 3.10 或更高版本。
  2. 安装 gpt-computer-assistant Python 包:
    pip install gpt-computer-assistant[api]
    或者,如果需要本地 TTS/STT 功能,可以安装包含 'local_tts' 和 'local_stt' extras 的版本。

服务器配置

GCA MCP 服务器可以通过多种方式启动,以下是几种常见的配置,MCP 客户端需要根据这些配置信息连接到 GCA 服务器。

配置示例 (JSON 格式):

[
  {
    "server_name": "gca_local",
    "command": "python",
    "args": [
      "-c",
      "from gpt_computer_assistant import start; start(True);"
    ],
    "description": "本地 GCA 服务器,通过 Python 进程启动 HTTP API 服务"
  },
  {
    "server_name": "gca_docker",
    "command": "docker",
    "args": [
      "run",
      "-d",
      "-p",
      "5901:5901",
      "-p",
      "7541:7541",
      "upsonic/gca_docker_ubuntu:dev0-AMD64"
    ],
    "description": "Docker 部署的 GCA 服务器,需要 Docker 环境"
  },
  {
    "server_name": "gca_cloud_free",
    "command": "curl",
    "args": [
      "https://free_cloud_1.gca.dev/start_instance"
    ],
    "description": "云端免费 GCA 服务器实例(playground.gca.dev 使用的免费云服务器,可能不稳定)"
  }
]

参数注释:

  • 'server_name': MCP 服务器的名称,客户端用于标识和选择连接的服务器。
  • 'command': 启动 MCP 服务器的命令,例如 'python', 'docker', 'npx' 等。
  • 'args': 启动命令的参数列表,用于指定服务器的具体启动方式和配置。
  • 'description': 服务器配置的描述信息,方便用户理解其用途。

基本使用方法

  1. 启动 GCA 服务器: 根据选择的部署方式(本地、Docker、云端),运行相应的启动命令。例如,本地启动可以使用 'python -c 'from gpt_computer_assistant import start; start(True);''。
  2. 配置 MCP 客户端: 在 MCP 客户端中,配置上述 “服务器配置” 信息,指定要连接的 GCA 服务器的 'server_name' 以及相应的 'command' 和 'args'。
  3. 客户端连接与交互: MCP 客户端根据配置信息连接到 GCA 服务器,并可以通过 JSON-RPC 协议发送请求,例如读取资源、调用工具等。具体 API 使用方法请参考 'gpt_computer_assistant.remote.Remote_Client' 类中的方法,例如 'request', 'input', 'screenshot' 等。

关键词

AI 智能体框架, 垂直应用, 计算机控制, 自动化, API 服务

信息

分类

桌面与硬件