项目简介
这是一个基于 Model Context Protocol (MCP) 的服务器实现,专注于提供将指定URL的网页内容或完整HTML转换为Markdown格式的工具。它使得支持MCP协议的LLM客户端能够方便地通过调用工具来获取网页的Markdown版本。
主要功能点
- 提取文章内容转Markdown: 根据URL智能识别网页的主要文章内容,并将其转换为整洁的Markdown格式。
- 完整HTML转Markdown: 根据URL获取网页的全部HTML源代码,并将其转换为Markdown格式。
安装步骤
- 确保您已安装 Go 语言环境。
- 通过 Go 命令下载并构建服务器程序:
这将在您的 Go bin 目录下生成可执行文件 'go_mcp_server_mdurl'。go install github.com/hightemp/go_mcp_server_mdurl@latest
服务器配置
MCP客户端通常需要配置如何启动一个MCP服务器进程。您需要在客户端配置中指定服务器的名称、可执行命令及其启动参数。
本服务器名为 'go_mcp_server_mdurl'。其启动参数主要取决于您希望使用的传输模式(Stdio 或 SSE)。
Stdio模式配置示例(适用于大多数客户端)
{ "name": "go_mcp_server_mdurl", "command": "go_mcp_server_mdurl", "args": ["-t", "stdio"] }
- 'name': 服务器注册名,客户端通常用此名称引用服务器。
- 'command': 服务器可执行文件的名称,确保其在系统PATH中或提供完整路径。
- 'args': 传递给服务器的启动参数。'-t stdio' 指定使用标准输入输出进行通信。
SSE模式配置示例(如果客户端支持并偏好SSE)
{ "name": "go_mcp_server_mdurl", "command": "go_mcp_server_mdurl", "args": ["-t", "sse", "-h", "0.0.0.0", "-p", "8888"] }
- 'name', 'command': 同上。
- 'args': '-t sse' 指定使用Server-Sent Events模式。'-h' 和 '-p' 分别指定服务器监听的主机和端口。客户端需要知道这个地址来建立连接(通常基于服务器的capabilities声明,但启动参数决定了服务器监听的位置)。
基本使用方法
一旦通过MCP客户端配置并启动了此服务器,LLM客户端即可调用其提供的工具:
- 调用 'markdown_content_of_url' 工具,并提供参数 '{"url": "目标网页URL"}' 来获取网页文章内容的Markdown。
- 调用 'markdown_all_html_of_url' 工具,并提供参数 '{"url": "目标网页URL"}' 来获取网页完整HTML内容的Markdown。
客户端将接收到JSON-RPC响应,其中包含工具执行结果,即转换后的Markdown文本。
信息
分类
网页与API