-
项目简介 Apify MCP服务器是一个基于Model Context Protocol (MCP)构建的后端服务,旨在让AI智能体能够方便地使用Apify平台上的海量爬虫、数据提取器和自动化工具。它通过提供标准化的工具、资源和Prompt模板,使得AI智能体能够执行复杂的网络数据操作和任务自动化,例如从社交媒体、搜索引擎和电商网站提取数据。
-
主要功能点
- AI工具集成: 将Apify平台上的5000多个Actor(预构建的爬虫和自动化工具)作为AI智能体的工具,实现动态发现和调用。
- 上下文数据提供: 允许AI访问和管理Apify数据集(存储结构化数据)和键值存储(存储非结构化数据)。
- Prompt模板支持: 提供可定制的Prompt模板,优化AI与用户或外部系统的交互模式。
- 会话管理: 支持客户端与服务器之间的会话管理,确保交互的连贯性。
- 多种传输协议: 支持Stdio(标准输入/输出)、SSE(Server-Sent Events)和Streamable HTTP等多种通信协议,适应不同部署环境。
- 文档搜索: 允许AI搜索和获取Apify平台的官方文档内容。
-
安装步骤
- Node.js环境: 确保您的系统已安装Node.js (v18或更高版本)。
- Apify API Token: 访问Apify官网获取您的Apify API Token。
- 环境变量配置: 在运行服务器前,需要设置'APIFY_TOKEN'环境变量。例如:
- Linux/macOS: 'export APIFY_TOKEN="您的Apify API Token"'
- Windows (CMD): 'set APIFY_TOKEN="您的Apify API Token"'
- Windows (PowerShell): '$env:APIFY_TOKEN="您的Apify API Token"'
- 安装服务器: 通过npm安装Apify MCP服务器包: 'npm install -g @apify/actors-mcp-server' (全局安装) 或 'npx @apify/actors-mcp-server' (直接运行)
-
服务器配置 (供MCP客户端配置使用) MCP客户端需要配置MCP服务器的连接信息。以下是两种常用传输协议的配置说明:
1. 标准输入/输出 (Stdio) 模式: 适用于本地集成和命令行工具,例如Claude for Desktop客户端。
- 服务器命令: 在MCP客户端中,将服务器的启动命令配置为'npx'。
- 命令参数: 将命令参数配置为包含'@apify/actors-mcp-server'以及您希望服务器加载的工具选项。例如,如果您想加载默认工具(Apify Actors类别、文档类别和RAG网页浏览器Actor),可以添加参数'--tools actors,docs,apify/rag-web-browser'。其他可选参数包括'--actors <actor1,actor2,...>'(逗号分隔的Apify Actor全名列表)和'--enable-adding-actors true/false'(是否允许AI动态添加Actor作为工具,默认为'false')。
- 环境变量: 确保您的Apify API Token已通过环境变量'APIFY_TOKEN'设置。
- 示例说明 (MCP客户端中填写):
当配置您的MCP客户端时,您需要提供服务器的启动命令,其参数,以及您的Apify API Token环境变量。
- 'serverName': 您为服务器设定的一个显示名称,例如“Apify MCP 服务器”。
- 'command': 应该设置为'npx'。
- 'args': 这是一个字符串数组。第一个元素是'@apify/actors-mcp-server',后续元素是您希望传递给服务器的启动参数,例如'--tools'及其值('actors,docs,apify/rag-web-browser')。
- 'env': 这是一个包含环境变量的对象,其中必须有一个键为'APIFY_TOKEN',其值为您的Apify API Token。
2. HTTPS Endpoint 模式 (mcp.apify.com): 适用于远程连接和支持OAuth的客户端,如Claude.ai或Visual Studio Code。
- 服务器URL: 将服务器的连接URL配置为'https://mcp.apify.com'。
- URL查询参数: 您可以通过在URL后面添加查询参数来配置服务器加载哪些工具。例如,要加载默认工具,URL可以是'https://mcp.apify.com?tools=actors,docs,apify/rag-web-browser'。其他查询参数包括'actors=<actor1,actor2,...>'和'enableAddingActors=true/false',其作用与Stdio模式中的命令行参数相同。
- 认证:
- OAuth: 大多数支持OAuth的客户端(如Claude.ai)可以直接使用此URL进行连接,客户端会引导您完成Apify账户的授权流程。
- Bearer Token: 如果您的客户端支持Bearer Token认证,您可以在客户端的认证配置中提供您的Apify API Token作为Bearer Token。
- 示例说明 (MCP客户端中填写):
当配置您的MCP客户端时,您需要提供服务器的URL,以及可选的认证信息。
- 'serverName': 您为服务器设定的一个显示名称,例如“Apify MCP 托管服务器”。
- 'url': 完整的服务器URL,可以包含查询参数来指定加载的工具。
- 'authentication': 这是一个可选的认证配置。如果客户端支持OAuth,您可以选择'oauth'类型。如果客户端需要您直接提供Token,您可以选择'bearer'类型,并在此处填入您的Apify API Token。
-
基本使用方法
- 连接AI助手: 将您的MCP客户端(如Claude Desktop, VS Code Genie)配置到Apify MCP服务器(使用上述配置信息)。
- 发现工具: 一旦连接成功,AI智能体将自动发现服务器提供的Apify Actor工具和内置辅助工具。您可以让AI询问“我能用哪些Apify Actor?”或“搜索Apify商店中的网络爬虫”。
- 调用工具: AI智能体将根据用户请求自动选择并调用合适的Apify Actor工具或辅助工具。例如:
- "搜索网页并总结AI代理的最新趋势。" (调用'apify/rag-web-browser'工具)
- "查找旧金山排名前10的意大利餐厅。" (调用'apify/google-maps-scraper'等工具)
- "分析The Rock的Instagram个人资料。" (调用'apify/instagram-scraper'工具)
- "提供一个关于使用Model Context Protocol的分步指南,包括源URL。" (调用'search-apify-docs'和'fetch-apify-docs'工具)
- 动态添加工具: 如果服务器启用了'add-actor'工具,您可以让AI动态添加Apify商店中的任何Actor。例如:“添加'apify/facebook-posts-scraper'作为工具。”
信息
分类
网页与API