使用说明

项目简介

Nova Act MCP服务器是一个基于Model Context Protocol (MCP) 构建的应用后端,它利用Amazon Nova Act SDK赋予AI助手控制Web浏览器的能力。通过此服务器,AI助手可以执行复杂的Web自动化工作流程,例如信息搜索、数据填写、网页交互等。该服务器旨在简化AI助手与Web浏览器的集成,提供标准化的接口和会话管理。

主要功能点

  • Web浏览器控制: 允许AI助手通过自然语言指令控制和操作Web浏览器。
  • 多步骤工作流: 支持执行包含多个步骤的浏览器自动化流程,完成复杂的Web任务。
  • 会话管理: 保持浏览器会话状态,允许在多次交互之间维持登录状态、cookies等信息。
  • 工具集成: 作为一个MCP服务器,它提供 'execute_browser_workflow', 'get_browser_sessions', 'test_browser_connection' 等工具供MCP客户端调用。
  • 易于集成: 遵循MCP协议,可以与任何兼容MCP协议的客户端(如Claude、VS Code等)轻松集成。
  • 可配置的用户身份: 支持通过用户身份 (identity) 管理独立的浏览器配置文件,实现会话隔离。

安装步骤

  1. 克隆仓库:
    git clone https://github.com/madtank/nova-act-mcp.git
    cd nova-act-mcp
  2. 安装Python依赖: 确保已安装 Python 3.10 或更高版本。建议使用虚拟环境。
    pip install -r requirements.txt
  3. 安装 'nova-act' SDK (如果尚未安装):
    pip install nova-act
  4. 获取 Amazon Nova Act API 密钥: 访问 https://nova.amazon.com/act 并生成API密钥。

服务器配置

要将 Nova Act MCP 服务器连接到 MCP 客户端,您需要配置客户端以启动服务器。以下是一个通用的配置示例,适用于支持 MCP 协议的客户端。您需要将此配置添加到您的 MCP 客户端的服务器配置中。

{
  "servers": {
    "nova-browser": {
      "command": "uv",
      "args": [
        "--directory",
        "/full/path/to/nova-act-mcp",  //  请替换为 nova-act-mcp 仓库的绝对路径
        "run",
        "nova_mcp.py"
      ],
      "transport": "stdio",
      "env": {
        "NOVA_ACT_API_KEY": "your_api_key_here"  // 请替换为您的 Nova Act API 密钥
      }
    }
  }
}

配置参数说明:

  • '"servers"': 定义可用的 MCP 服务器列表。
  • '"nova-browser"': 为该服务器定义一个名称,客户端将使用此名称来引用它。
  • '"command": "uv"': 指定用于启动服务器的命令。这里使用 'uv',它是一个更快的 pip 和 venv 替代品,如果您的环境中没有 'uv',可以替换为 'python3' 或 'python'。
  • '"args"': 启动命令的参数列表。
    • '"--directory"': 指定服务器代码所在的目录,需要设置为您克隆的 'nova-act-mcp' 仓库的绝对路径
    • '"run"': 'uv run' 命令用于运行 Python 脚本。
    • '"nova_mcp.py"': 指定要运行的服务器脚本文件。
  • '"transport": "stdio"': 指定 MCP 客户端与服务器之间通信的传输协议,这里使用标准输入输出流。
  • '"env"': 设置服务器运行时的环境变量。
    • '"NOVA_ACT_API_KEY"': 务必替换为您的 Amazon Nova Act API 密钥。这是服务器连接 Nova Act 服务的凭证。

请注意:

  • 您需要将 '/full/path/to/nova-act-mcp' 替换为您实际存放 'nova-act-mcp' 仓库的绝对路径
  • 您需要将 'your_api_key_here' 替换为您从 Amazon Nova Act 网站获取的API 密钥
  • 不同的MCP客户端配置方式可能略有不同,请参考您的MCP客户端的文档进行配置。

基本使用方法

配置完成后,在您的 MCP 客户端中,您应该能够看到名为 'nova-browser' 的工具。您可以使用自然语言指示 AI 助手调用此工具执行浏览器自动化任务。

例如,在 Claude 中:

您可以尝试以下指令:

请使用 nova-browser 工具帮我做以下事情:
1. 打开 amazon.com
2. 搜索 "茶壶"
3. 选择第一个搜索结果
4. 加入购物车

AI助手会将这些指令转化为对 'nova-browser' 服务器的调用,从而控制浏览器完成相应的操作。

您还可以使用 'test_browser_connection' 工具来快速测试服务器是否配置正确以及浏览器自动化功能是否正常工作。

请使用 nova-browser 工具运行连接测试。

使用 'get_browser_sessions' 工具可以查看当前活跃的浏览器会话状态。

请使用 nova-browser 工具获取浏览器会话状态。

提示: 编写浏览器指令时,请尽量具体和简洁,参考仓库 'README.md' 中的 "Tips for Effective Browser Automation" 部分,以获得最佳效果。

信息

分类

开发者工具