项目简介

Terminator 是 Mediar.ai 开发的开源桌面自动化解决方案,旨在为 AI 代理提供与桌面应用程序和浏览器交互的能力。它能够以高效率和高成功率执行预训练的工作流,并在需要时通过 AI 进行智能恢复。通过其 MCP (Model Context Protocol) 代理,LLM 客户端可以标准化地访问桌面环境作为资源、调用自动化工具并利用预定义的工作流。

主要功能点

  • 跨平台桌面自动化: 在 Windows、macOS 和 Linux 上自动操作任何桌面应用和浏览器。
  • AI 赋能的工作流: 预训练确定性工作流以实现高速执行和高成功率,结合 AI 进行智能恢复。
  • UI 元素交互: 提供强大的定位器(Locator)和 API,实现对 UI 元素的点击、输入、滚动、值设置等操作。
  • 浏览器脚本执行: 支持在浏览器中直接执行 JavaScript 代码,进行网页内容提取和交互。
  • 系统级操作: 运行 shell 命令、管理应用程序、获取屏幕截图、执行 OCR 等。
  • 可编程接口: 提供 Python 和 Node.js/TypeScript 语言绑定,方便开发者集成和构建复杂自动化。
  • MCP 服务器集成: 通过 'terminator-mcp-agent' 组件,以标准化的 JSON-RPC 协议向 LLM 客户端提供桌面自动化能力。

安装步骤

由于 Terminator 提供多种安装方式,作为 MCP 服务器/代理,其核心是通过 'terminator-mcp-agent' 组件对外提供服务。

  1. 安装 Terminator CLI 工具:
    • macOS/Linux:
      curl -fsSL https://mediar.ai/install.sh | bash
    • Windows (PowerShell):
      irm https://mediar.ai/install.ps1 | iex
  2. 运行设置命令: 安装完成后,执行 'terminator setup' 进行环境配置,包括安装 Chrome 扩展等。
    terminator setup
    此步骤将确保 MCP 代理所需的依赖和浏览器扩展准备就绪。

MCP 服务器配置 (供 MCP 客户端使用)

'terminator-mcp-agent' 作为 MCP 服务器,允许 LLM 客户端通过 JSON-RPC 调用其桌面自动化能力。MCP 客户端(如 Claude Code 或其他支持 MCP 协议的客户端)通常需要配置以下信息来连接到 Terminator MCP 服务器:

  • 服务器名称: 通常配置为 'terminator'。
  • 启动命令: 例如 'npx',因为它是一个 Node.js 包执行器。
  • 启动参数: 例如 '-y terminator-mcp-agent@latest',用于指定运行最新版本的 MCP 代理,并自动确认安装。
  • 会话范围: 例如 'user',表示该 MCP 代理在用户会话中运行。 这些配置信息使 MCP 客户端能够发现并启动 Terminator MCP 服务器,进而与其建立通信。对于 Claude Code 这类客户端,通常通过命令行添加,如:
claude mcp add terminator "npx -y terminator-mcp-agent@latest" -s user

执行此命令后,LLM 客户端即可与 Terminator MCP 服务器通信,调用其提供的桌面自动化功能。

基本使用方法 (LLM 客户端调用示例)

一旦 MCP 服务器配置并运行,LLM 客户端可以通过标准化的 JSON-RPC 请求来调用 Terminator 提供的功能。具体的工具名称、参数和资源结构将由 'terminator-mcp-agent' 在会话开始时向 LLM 客户端声明。

  • 调用工具: LLM 客户端可以发送 JSON-RPC 请求来调用预注册的工具,例如调用 'open_application' 工具打开“计算器”,或调用 'click' 工具点击某个 UI 元素(例如,通过 'name:Seven' 选择器点击数字“7”)。
  • 读取资源: LLM 客户端可以请求读取桌面环境的上下文信息作为资源,例如获取当前桌面或特定应用程序的 UI 元素树('desktop_tree' 资源)来理解界面布局。 LLM 客户端会接收到相应的 JSON-RPC 响应,包含操作结果或错误信息。

信息

分类

桌面与硬件