Firecrawl MCP Server 使用说明

项目简介

Firecrawl MCP Server 是一个实现了 Model Context Protocol (MCP) 的服务器,它利用 Firecrawl API 为大型语言模型 (LLM) 客户端提供强大的网络数据访问能力。通过标准化的 MCP 协议,该服务器允许 LLM 客户端调用工具来执行网页抓取、内容搜索、网站爬取和数据提取等任务,从而扩展 LLM 的上下文理解和功能范围。

主要功能点

  • 网页抓取 (Web Scraping): 从任何网页提取内容,支持多种自定义选项,例如模拟移动设备、阻止广告和弹窗、内容过滤和结构化数据提取,并提供多种输出格式。
  • 内容搜索 (Content Search): 提供智能搜索能力,支持多语言、基于位置的结果、自定义结果数量限制和结构化输出格式。
  • 网站爬取 (Site Crawling): 提供高级网站爬取功能,包括深度控制、路径过滤、速率限制、进度跟踪和站点地图集成。
  • 站点地图 (Site Mapping): 生成网站结构地图,支持子域名、搜索过滤和链接分析,并呈现可视化的层级结构。
  • 数据提取 (Data Extraction): 从多个URL批量提取结构化数据,支持Schema验证、批量处理、网络搜索增强和自定义提取Prompt。

安装步骤

  1. 全局安装 (推荐):
    npm install -g @modelcontextprotocol/mcp-server-firecrawl
    或者
  2. 本地项目安装:
    npm install @modelcontextprotocol/mcp-server-firecrawl

服务器配置 (MCP 客户端配置)

为了让 MCP 客户端(例如 Claude 桌面应用或 VSCode 插件)连接到 Firecrawl MCP Server,您需要在客户端的 MCP 配置中添加以下信息。请确保您已安装 Firecrawl MCP Server 并获取了 Firecrawl API 密钥。

Claude 桌面应用配置示例:

{
  "firecrawl": {
    "command": "mcp-server-firecrawl",
    "env": {
      "FIRECRAWL_API_KEY": "YOUR_API_KEY"  // 替换为您的 Firecrawl API 密钥
    }
  }
}

Claude VSCode 扩展配置示例:

{
  "mcpServers": {
    "firecrawl": {
      "command": "mcp-server-firecrawl",
      "env": {
        "FIRECRAWL_API_KEY": "YOUR_API_KEY"  // 替换为您的 Firecrawl API 密钥
      }
    }
  }
}

配置参数说明:

  • 'server name': 客户端中用于标识和调用此 MCP 服务器的名称,例如 "firecrawl"。
  • 'command': 启动 Firecrawl MCP Server 的命令。全局安装时通常为 'mcp-server-firecrawl'。
  • 'env': 环境变量配置,用于传递 Firecrawl API 密钥等敏感信息。

基本使用方法

  1. 设置 API 密钥: 您需要先获取 Firecrawl API 密钥,并将其设置为环境变量 'FIRECRAWL_API_KEY'。具体方法请参考仓库 README 文档的 "Quick Start" 部分,根据您的操作系统选择合适的命令设置环境变量,或者使用 '.env' 文件。

  2. 启动服务器: 在终端中运行命令 'mcp-server-firecrawl' 启动服务器。服务器成功启动后,会在控制台输出 "Firecrawl MCP server running on stdio"。

  3. 在 MCP 客户端中使用工具: 在您的 MCP 客户端(例如 Claude)中,您可以使用以下工具名称和参数来调用 Firecrawl MCP Server 提供的功能。以下是一些示例,您可以根据需要调整参数。

    网页抓取示例 (scrape_url):

    {
      "name": "scrape_url",
      "arguments": {
        "url": "https://example.com",
        "formats": ["markdown"],
        "onlyMainContent": true
      }
    }

    网站爬取示例 (crawl):

    {
      "name": "crawl",
      "arguments": {
        "url": "https://example.com",
        "maxDepth": 2,
        "limit": 100
      }
    }

    站点地图示例 (map):

    {
      "name": "map",
      "arguments": {
        "url": "https://example.com",
        "includeSubdomains": true,
        "limit": 1000
      }
    }

    数据提取示例 (extract):

    {
      "name": "extract",
      "arguments": {
        "urls": ["https://example.com/product1", "https://example.com/product2"],
        "prompt": "Extract product details",
        "schema": {
          "name": "string",
          "price": "number",
          "description": "string"
        }
      }
    }

    内容搜索示例 (search_content):

    {
      "name": "search_content",
      "arguments": {
        "query": "latest developments in artificial intelligence"
      }
    }

    请参考仓库的 "Usage Examples" 和 "API Documentation" 获取更详细的工具参数和使用方法。

信息

分类

网页与API