使用说明
项目简介
JigsawStack MCP服务器是一个基于Model Context Protocol (MCP) 的应用后端,旨在通过标准化的方式向LLM客户端提供丰富的AI工具能力。该服务器集成了JigsawStack提供的多种AI服务,包括图像光学字符识别 (vOCR)、文本翻译、图像生成、AI网页抓取和AI网络搜索,方便LLM应用快速接入和使用这些功能。
主要功能点
- vOCR工具: 识别图像中的文本内容。
- 翻译工具: 支持多语言文本翻译。
- 图像生成工具: 根据文本提示生成图像。
- AI网页抓取工具: 根据用户指定的元素抓取网页内容。
- AI网络搜索工具: 执行AI驱动的网络搜索并返回结果。
- 基于MCP协议: 采用标准的MCP协议与客户端通信,易于集成和扩展。
- 使用JigsawStack API: 底层能力由JigsawStack API提供,保证服务质量和稳定性。
安装步骤
- 前提条件: 确保已安装 Node.js 和 npm 或 yarn。
- 获取代码: 从 GitHub 克隆仓库 'https://github.com/JigsawStack/jigsawstack-mcp-server' 到本地。
- 安装依赖: 在仓库根目录下,根据需要进入不同的工具目录(如 'vOCR', 'translation', 'image-generation', 'ai-web-scraper', 'ai-web-search'),并分别执行 'npm install' 或 'yarn install' 安装项目依赖。
- 配置环境变量: 在每个工具目录下的 '.env' 文件中(如果存在)或系统环境变量中设置 'JIGSAWSTACK_API_KEY' 环境变量,替换为你的 JigsawStack API 密钥。
服务器配置
MCP客户端需要配置服务器的启动命令和参数才能连接。以下是一些工具的配置示例。请注意,你需要根据实际使用的工具选择相应的配置,并确保在相应的工具目录下启动服务器。
-
vOCR Server 配置:
{ "serverName": "vOCR Server", "command": "node", "args": ["dist/index.js"], "cwd": "./vOCR" }- 'serverName': 服务器名称,可以自定义。
- 'command': 启动服务器的命令,这里使用 'node' 运行 JavaScript 代码。
- 'args': 命令参数,'dist/index.js' 是编译后的服务器入口文件。
- 'cwd': 工作目录,需要设置为 'vOCR',确保在正确的目录下执行命令。
-
Translation Server 配置:
{ "serverName": "Translation Server", "command": "node", "args": ["dist/index.js"], "cwd": "./translation" } -
Image Generation Server 配置:
{ "serverName": "Image Generation Server", "command": "node", "args": ["dist/index.js"], "cwd": "./image-generation" } -
AI Web Scraper Server 配置:
{ "serverName": "AI Web Scraper Server", "command": "node", "args": ["dist/index.js"], "cwd": "./ai-web-scraper" } -
AI Web Search Server 配置:
{ "serverName": "AI Web Search Server", "command": "node", "args": ["dist/index.js"], "cwd": "./ai-web-search" }
基本使用方法
- 启动服务器: 在每个工具的目录下,执行 'npm run build' 编译 TypeScript 代码,然后执行 'npm start' 或 'node dist/index.js' 启动相应的 MCP 服务器。例如,启动 vOCR 服务器,需要在 'vOCR' 目录下执行这些命令。
- 配置 MCP 客户端: 在你的 MCP 客户端应用中,根据上述 "服务器配置" 部分提供的 JSON 配置,配置要连接的 MCP 服务器。确保客户端能够通过 Stdio 协议与服务器通信。
- 调用工具: 通过 MCP 客户端向服务器发送符合 MCP 协议的请求,例如 'tools/list' 获取可用工具列表,'tools/call' 调用特定工具。具体的请求格式和参数请参考 MCP 协议文档和每个工具的 'inputSchema' 定义。例如,调用 'vOCR' 工具可能需要提供 base64 编码的图像数据和提示词。
信息
分类
AI与计算