使用说明

项目简介

本项目是一个MCP服务器示例,旨在展示如何使用Playwright进行Web自动化,并通过MCP协议向LLM客户端提供Web工具能力。该服务器可以与AWS Bedrock等LLM服务集成,实现基于LLM的智能Web Agent。通过该项目,您可以学习如何构建和使用MCP服务器,扩展LLM在Web环境中的应用。

主要功能点

  • Web页面操作工具: 提供页面导航、截图、元素点击、页面滚动、文本输入和文件写入等Web操作工具。
  • 资源管理: 支持对服务器生成的资源(如文件)进行管理和访问。
  • FastMCP框架: 使用FastMCP框架简化MCP服务器的开发。
  • 客户端-服务器架构: 采用标准的MCP客户端-服务器架构,使用stdio进行通信。
  • 会话管理: 支持MCP会话管理,为每个客户端提供独立的服务环境。
  • 对话历史管理 (步骤11): 在步骤11中,增加了对话历史管理功能,包括媒体内容移除和对话总结,以优化长对话的Token使用效率。

安装步骤

  1. 克隆仓库
    git clone https://github.com/aws-samples/sample-agentic-ai-web.git
    cd sample-agentic-ai-web
  2. 创建并激活虚拟环境
    python3.12 -m venv .venv
    source .venv/bin/activate
  3. 安装依赖
    pip install -r requirements.txt
  4. 安装Playwright浏览器
    playwright install chromium

服务器配置

MCP服务器的启动配置已预置在客户端脚本 ('10-mcp-client.py', '11-mcp-client.py') 中。您无需手动配置服务器启动命令和参数。客户端在运行时会自动启动相应的MCP服务器。

预置的服务器配置信息 (JSON 格式) 如下,无需用户手动配置,仅供参考:

{
  "server name": "Web Automation Server",
  "command": "python",
  "args": ["10-mcp-server.py"]  // 或 ["11-mcp-server.py"] (步骤11)
}

这些配置信息在客户端脚本中被自动处理,简化了用户配置流程。

基本使用方法

  1. 激活虚拟环境 (如果尚未激活)
    source .venv/bin/activate
  2. 运行MCP客户端脚本
    • 运行步骤 10 的客户端 (MCP 基础功能):
      python 10-mcp-client.py
    • 运行步骤 11 的客户端 (包含对话历史管理):
      python 11-mcp-client.py
  3. 根据提示操作 客户端脚本会自动启动MCP服务器,并与AWS Bedrock模型进行交互,执行预设的Web自动化任务。您可以在终端中查看模型输出和工具调用过程。

注意: 运行步骤 10 或 11 的客户端脚本前,请确保已配置AWS CLI,并且具有访问AWS Bedrock和相应模型的权限。

信息

分类

开发者工具