使用说明
项目简介
GPT Computer Assistant (GCA) 是一个开源框架,旨在构建垂直 AI 智能体。它不仅支持多种大型语言模型(LLM),还集成了 Model Context Protocol (MCP) 等新技术,允许用户通过结构化的 API 快速构建自己的垂直 AI 智能体。GCA 可以作为 MCP 服务器,为 LLM 客户端提供资源和工具管理能力,实现计算机操作的自动化和智能化。
主要功能点
- 资源管理: GCA 作为 MCP 服务器,可以托管和管理各种资源,例如文件系统、内存数据等(通过集成的 MCP server 实现)。
- 工具注册与执行: 支持注册和执行各种工具,例如网页搜索、终端命令执行、GUI 操作等,允许 LLM 客户端调用这些工具来扩展其功能。
- Prompt 模板: 虽然文档没有明确提及 Prompt 模板,但 GCA 框架支持灵活的任务定义和 Agent 编排,可以理解为通过代码实现 Prompt 的定制和管理。
- 多种部署方式: 支持云端、Docker 和本地部署,方便用户根据需求选择合适的运行环境。
- JSON-RPC over HTTP API: 通过 Flask 提供的 HTTP API 接口与客户端通信,实际通信协议可以视为 JSON-RPC over HTTP。
安装步骤
- 安装 Python: 确保已安装 Python 3.10 或更高版本。
- 安装 gpt-computer-assistant Python 包:
或者,如果需要本地 TTS/STT 功能,可以安装包含 'local_tts' 和 'local_stt' extras 的版本。pip install gpt-computer-assistant[api]
服务器配置
GCA MCP 服务器可以通过多种方式启动,以下是几种常见的配置,MCP 客户端需要根据这些配置信息连接到 GCA 服务器。
配置示例 (JSON 格式):
[ { "server_name": "gca_local", "command": "python", "args": [ "-c", "from gpt_computer_assistant import start; start(True);" ], "description": "本地 GCA 服务器,通过 Python 进程启动 HTTP API 服务" }, { "server_name": "gca_docker", "command": "docker", "args": [ "run", "-d", "-p", "5901:5901", "-p", "7541:7541", "upsonic/gca_docker_ubuntu:dev0-AMD64" ], "description": "Docker 部署的 GCA 服务器,需要 Docker 环境" }, { "server_name": "gca_cloud_free", "command": "curl", "args": [ "https://free_cloud_1.gca.dev/start_instance" ], "description": "云端免费 GCA 服务器实例(playground.gca.dev 使用的免费云服务器,可能不稳定)" } ]
参数注释:
- 'server_name': MCP 服务器的名称,客户端用于标识和选择连接的服务器。
- 'command': 启动 MCP 服务器的命令,例如 'python', 'docker', 'npx' 等。
- 'args': 启动命令的参数列表,用于指定服务器的具体启动方式和配置。
- 'description': 服务器配置的描述信息,方便用户理解其用途。
基本使用方法
- 启动 GCA 服务器: 根据选择的部署方式(本地、Docker、云端),运行相应的启动命令。例如,本地启动可以使用 'python -c 'from gpt_computer_assistant import start; start(True);''。
- 配置 MCP 客户端: 在 MCP 客户端中,配置上述 “服务器配置” 信息,指定要连接的 GCA 服务器的 'server_name' 以及相应的 'command' 和 'args'。
- 客户端连接与交互: MCP 客户端根据配置信息连接到 GCA 服务器,并可以通过 JSON-RPC 协议发送请求,例如读取资源、调用工具等。具体 API 使用方法请参考 'gpt_computer_assistant.remote.Remote_Client' 类中的方法,例如 'request', 'input', 'screenshot' 等。
关键词
AI 智能体框架, 垂直应用, 计算机控制, 自动化, API 服务
信息
分类
桌面与硬件