使用说明
项目简介
Higress 是一款基于 Istio 和 Envoy 构建的云原生 API 网关,专注于 AI 场景,并具备托管 MCP (Model Context Protocol) 服务器的能力。它旨在为 AI 应用提供高性能、安全、可扩展的 API 管理和上下文服务框架。通过 Higress,可以简化 AI 应用的开发和部署,并实现对 LLM 工具调用的统一管理。
主要功能点
- AI 网关能力: 支持国内外主流 LLM 模型提供商,提供 AI 可观测性、多模型负载均衡/回退、AI Token 限流、AI 缓存等功能。
- MCP 服务器托管: 支持通过插件机制托管 MCP 服务器,为 AI Agents 提供统一的身份验证、授权、限流和可观测性能力,简化 AI 工具的调用和管理。
- 通用 API 网关: 除 AI 网关能力外,还具备 Kubernetes Ingress Controller、微服务网关、安全网关等通用 API 网关的功能。
- 生产级高可用: 基于阿里巴巴内部产品,经过大规模生产验证,配置变更毫秒级生效,消除 Nginx Reload 抖动,尤其适用于 AI 等长连接场景。
- 易于扩展: 基于 Wasm 插件扩展,支持 Go/Rust/JS 等多种语言,插件热更新,保证内存安全和流量无损。
安装步骤
Higress 可以通过 Docker 快速启动,方便个人开发者本地学习或搭建简单站点:
- 创建工作目录:
mkdir higress; cd higress - 启动 Higress:
docker run -d --rm --name higress-ai -v ${PWD}:/data \ -p 8001:8001 -p 8080:8080 -p 8443:8443 \ higress-registry.cn-hangzhou.cr.aliyuncs.com/higress/all-in-one:latest- 端口说明:
- '8001': Higress UI 控制台入口
- '8080': Gateway HTTP 协议入口
- '8443': Gateway HTTPS 协议入口
- 端口说明:
更多安装方式 (如 Kubernetes Helm 部署) 请参考 官方快速开始文档。
服务器配置 (MCP 客户端配置)
MCP 客户端需要配置以下信息以连接到 Higress MCP 服务器:
{ "server_name": "higress-ai-gateway", "command": "http", "args": [ "higress-gateway-address:8080" ], "notes": "配置 MCP 客户端连接 Higress AI Gateway,command 指定通信协议 (http/https),args 指定 Higress 网关的访问地址和端口 (默认为 8080/HTTP 或 8443/HTTPS)。请将 'higress-gateway-address' 替换为实际 Higress 网关的部署地址。" }
配置说明:
- 'server_name': MCP 服务器名称,可自定义。
- 'command': 指定 MCP 客户端与 Higress 服务器通信的协议,通常为 'http' 或 'https'。
- 'args': 参数列表,用于配置连接地址。
- '"higress-gateway-address:8080"': Higress 网关的访问地址和端口。请将 'higress-gateway-address' 替换为实际部署地址。如果使用 HTTPS,请将端口更改为 '8443' 并将 'command' 设置为 'https'。
- 'notes': 配置说明,用于帮助用户理解配置信息。
基本使用方法
- 访问 Higress 控制台: 通过浏览器访问 'http://<宿主机IP>:8001' 进入 Higress UI 控制台进行配置管理。
- 配置路由规则: 在 Higress 控制台中,您可以配置路由规则,将客户端请求转发到后端的 MCP 服务器或 LLM 模型提供商。
- 部署 MCP Server 插件: 根据 Higress 官方文档,您可以通过 Wasm 插件机制部署自定义的 MCP Server 插件,以扩展 Higress 的 MCP 服务器功能。
- MCP 客户端发起请求: 配置 MCP 客户端,使用上述服务器配置信息连接到 Higress 网关,并按照 MCP 协议规范发送请求,例如资源读取、工具调用、Prompt 获取等。
具体操作和更高级用法,请参考 Higress 官方文档。
信息
分类
网页与API