使用说明

项目简介

JigsawStack MCP服务器是一个基于Model Context Protocol (MCP) 的应用后端，旨在通过标准化的方式向LLM客户端提供丰富的AI工具能力。该服务器集成了JigsawStack提供的多种AI服务，包括图像光学字符识别 (vOCR)、文本翻译、图像生成、AI网页抓取和AI网络搜索，方便LLM应用快速接入和使用这些功能。

主要功能点

vOCR工具: 识别图像中的文本内容。
翻译工具: 支持多语言文本翻译。
图像生成工具: 根据文本提示生成图像。
AI网页抓取工具: 根据用户指定的元素抓取网页内容。
AI网络搜索工具: 执行AI驱动的网络搜索并返回结果。
基于MCP协议: 采用标准的MCP协议与客户端通信，易于集成和扩展。
使用JigsawStack API: 底层能力由JigsawStack API提供，保证服务质量和稳定性。

安装步骤

前提条件: 确保已安装 Node.js 和 npm 或 yarn。
获取代码: 从 GitHub 克隆仓库 'https://github.com/JigsawStack/jigsawstack-mcp-server' 到本地。
安装依赖: 在仓库根目录下，根据需要进入不同的工具目录（如 'vOCR', 'translation', 'image-generation', 'ai-web-scraper', 'ai-web-search'），并分别执行 'npm install' 或 'yarn install' 安装项目依赖。
配置环境变量: 在每个工具目录下的 '.env' 文件中（如果存在）或系统环境变量中设置 'JIGSAWSTACK_API_KEY' 环境变量，替换为你的 JigsawStack API 密钥。

服务器配置

MCP客户端需要配置服务器的启动命令和参数才能连接。以下是一些工具的配置示例。请注意，你需要根据实际使用的工具选择相应的配置，并确保在相应的工具目录下启动服务器。

vOCR Server 配置:
```
{
  "serverName": "vOCR Server",
  "command": "node",
  "args": ["dist/index.js"],
  "cwd": "./vOCR"
}
```
- 'serverName': 服务器名称，可以自定义。
- 'command': 启动服务器的命令，这里使用 'node' 运行 JavaScript 代码。
- 'args': 命令参数，'dist/index.js' 是编译后的服务器入口文件。
- 'cwd': 工作目录，需要设置为 'vOCR'，确保在正确的目录下执行命令。

Translation Server 配置:

{
  "serverName": "Translation Server",
  "command": "node",
  "args": ["dist/index.js"],
  "cwd": "./translation"
}

Image Generation Server 配置:

{
  "serverName": "Image Generation Server",
  "command": "node",
  "args": ["dist/index.js"],
  "cwd": "./image-generation"
}

AI Web Scraper Server 配置:

{
  "serverName": "AI Web Scraper Server",
  "command": "node",
  "args": ["dist/index.js"],
  "cwd": "./ai-web-scraper"
}

AI Web Search Server 配置:

{
  "serverName": "AI Web Search Server",
  "command": "node",
  "args": ["dist/index.js"],
  "cwd": "./ai-web-search"
}

基本使用方法

启动服务器: 在每个工具的目录下，执行 'npm run build' 编译 TypeScript 代码，然后执行 'npm start' 或 'node dist/index.js' 启动相应的 MCP 服务器。例如，启动 vOCR 服务器，需要在 'vOCR' 目录下执行这些命令。
配置 MCP 客户端: 在你的 MCP 客户端应用中，根据上述 "服务器配置" 部分提供的 JSON 配置，配置要连接的 MCP 服务器。确保客户端能够通过 Stdio 协议与服务器通信。
调用工具: 通过 MCP 客户端向服务器发送符合 MCP 协议的请求，例如 'tools/list' 获取可用工具列表，'tools/call' 调用特定工具。具体的请求格式和参数请参考 MCP 协议文档和每个工具的 'inputSchema' 定义。例如，调用 'vOCR' 工具可能需要提供 base64 编码的图像数据和提示词。

关键词