Claude Code Nexus - AI 代理服务平台需求文档 (PRD)

August 15, 2025 · View on GitHub

版本: 3.0 (最终实现版)
日期: 2025年1月20日
项目代号: "Claude Code Nexus"

1. 项目愿景与目标

1.1. 核心愿景

Claude Code Nexus 是一个部署在 Cloudflare 上的 Claude API 代理服务平台，旨在为开发者提供统一的 Claude API 接口，同时支持将请求转发到任何 OpenAI 兼容的后端服务。

1.2. 解决的核心问题

Claude Code CLI 兼容性: 让 claude code CLI 能够使用用户自定义的 OpenAI 兼容 API 服务（如 OneAPI、Azure OpenAI、本地 Ollama 等）
供应商解锁: 打破对特定 AI 服务提供商的依赖，提供灵活的模型映射能力
统一接口体验: 为开发者提供一个标准的 Claude API 接口，屏蔽底层服务差异
个性化配置: 每个用户都有独立的配置空间，支持自定义模型映射规则

1.3. 目标用户

使用 claude code CLI 进行日常开发的软件工程师
希望使用自建或第三方 OpenAI 兼容服务的开发者
需要灵活模型映射和成本控制的 AI 应用开发团队

2. 核心功能架构

2.1. 服务架构图

Claude Code CLI → https://claude.nekro.ai/v1/messages → 用户的 OpenAI 兼容 API
     ↑                        ↑                           ↑
 用户客户端              我们的代理服务                用户的后端服务
(使用我们的API Key)     (请求转换+路由)              (OneAPI/Azure/etc)

2.2. 数据流详解

用户配置阶段:
- 用户在我们网站注册并获得专属 API Key (ak-xxx)
- 用户配置自己的 OpenAI 兼容服务提供商(Base URL + API Key)
- 用户设置模型映射规则(haiku→gpt-4o-mini, sonnet→gpt-4o, opus→gpt-4o)
请求转发阶段:
- Claude Code CLI 发送请求到 https://claude.nekro.ai/v1/messages
- 使用用户的专属 API Key 进行认证
- 我们的服务根据用户的映射规则确定目标模型
- 将 Claude 格式请求转换为 OpenAI 格式
- 转发到用户配置的后端服务
- 将响应转换回 Claude 格式返回

2.3. 核心技术特性

完整 Claude API 兼容: 支持 /v1/messages 端点的所有功能
流式响应 (SSE): 完美模拟 Claude 的流式事件格式
工具使用支持: 完整支持 Function Calling/Tool Use
多模态支持: 支持图片等多媒体内容
实时转换: 请求和响应的双向格式转换

2.2. 用户系统与个性化配置

用户认证:
- 系统必须支持通过 GitHub OAuth 进行用户注册和登录。
- 用户的 GitHub 账户信息（如用户名、头像）将用于界面展示。
- 每个用户在系统中拥有独立的数据空间。
API 服务提供商管理:
- 登录后，用户可以在管理界面上添加、编辑和删除自己的 API 服务提供商配置。
- 每个配置项至少包含：
  - 名称 (例如: "我的 OneAPI 服务", "Azure GPT-4o")
  - Base URL (例如: https://api.oneapi.com, https://my-resource.openai.azure.com)
  - API Key (必须加密存储)
模型转发规则自定义:
- 用户可以创建自定义的模型映射规则。
- 规则定义应为 "当 Claude 请求的模型名称包含某个关键词时，将其转发到我指定的某个 API 服务提供商的某个目标模型上"。
- 示例:
  - 规则1: 如果模型名包含 haiku，则使用我的 OneAPI 服务的 gpt-4o-mini 模型。
  - 规则2: 如果模型名包含 sonnet，则使用 Azure GPT-4o 的 gpt-4o-deployment 模型。
  - 规则3 (默认): 对于其他所有请求，使用 OpenAI 官方的 gpt-4o 模型。
- UI 应该允许用户方便地添加、编辑、删除和排序这些规则。规则按顺序匹配，第一个匹配的规则生效。

2.3. 用户界面 (UI/UX)

整体风格: 简洁、现代、友好。采用响应式设计，在桌面和移动设备上都有良好体验。技术栈推荐使用 React/Vue/Svelte 等现代前端框架。
页面设计:
1. 首页 (Landing Page):
  - 清晰地介绍服务功能、优势和目标用户。
  - 醒目的 "使用 GitHub 登录" 按钮。
2. 仪表盘 (Dashboard):
  - 用户登录后的主页面。
  - 核心展示区: 清晰地展示用户专属的 ANTHROPIC_BASE_URL 和 ANTHROPIC_API_KEY。
  - 提供一键复制功能。
  - 提供简明的 claude code CLI 配置教程。
  - 导航到“设置”页面的入口。
3. 设置页面 (Settings):
  - API 提供商管理:
    - 以卡片或列表形式展示已配置的 API 提供商。
    - 提供 "添加新提供商" 的按钮，点击后弹出表单（名称, Base URL, API Key）。
    - API Key 输入框应为密码类型，并且在保存后不应明文显示。
    - 每个提供商卡片上应有 "编辑" 和 "删除" 按钮。
  - 模型映射规则管理:
    - 以可拖拽排序的列表形式展示模型映射规则。
    - 每条规则包含: 匹配关键词 (输入框), API 提供商 (下拉选择已配置的提供商), 目标模型名称 (输入框)。
    - 提供 "添加新规则" 和 "保存更改" 的按钮。

3. 技术架构与实现细节

3.1. 技术栈

前端: Cloudflare Pages (部署 React/Vue/Svelte 等静态站点)。
后端: Cloudflare Workers (处理 API 请求、用户认证、配置管理)。
数据存储: Cloudflare KV (存储用户配置数据，如 API 提供商和模型映射规则)。
认证: Cloudflare Workers 内置的 OAuth 客户端或手动实现 GitHub OAuth 流程。

3.2. 数据流

claude code CLI 将请求发送到用户的专属 ANTHROPIC_BASE_URL (即 Cloudflare Worker 的 URL)。
Worker 验证请求头中的 ANTHROPIC_API_KEY，并解析出用户身份。
Worker 从 KV 中读取该用户的 API 提供商和模型映射规则。
根据请求中的 model 名称和用户的映射规则，确定要使用的 Base URL、API Key 和目标模型名称。
Worker 将 Claude 请求体转换为 OpenAI 格式。
Worker 将转换后的请求发送到目标 API 服务提供商。
Worker 接收响应，如果是流式，则通过 TransformStream 实时转换；如果是非流式，则等待完整响应后转换。
Worker 将转换后的 Claude 格式响应返回给 claude code CLI。

3.3. 数据模型 (KV 存储)

User Session: session:{session_id} -> { "github_user_id": "...", "expires_at": ... }
User Profile: user:{github_user_id} -> { "username": "...", "avatar_url": "..." }
User API Providers: providers:{github_user_id} -> [{ "id": "uuid", "name": "...", "baseUrl": "...", "apiKey": "encrypted_key" }, ...]
User Model Mappings: mappings:{github_user_id} -> [{ "id": "uuid", "keyword": "haiku", "providerId": "uuid", "targetModel": "gpt-4o-mini" }, ...]

3.4. 安全考量

API 密钥加密: 用户在前端输入的 API Key 应该在发送到 Worker 后立即加密，再存入 KV。Worker 在使用时解密。可以使用 Cloudflare Workers 的 SubtleCrypto API。
用户数据隔离: 所有 KV 键都必须以用户 ID 为前缀，确保用户只能访问自己的数据。
CORS: Worker 需要配置正确的 CORS 策略，允许来自前端页面的请求。

4. AI 开发所需背景知识

Cloudflare Workers: 你需要理解其无服务器、事件驱动的本质。熟悉 fetch 事件处理、Request 和 Response 对象、环境变量和 Secrets 的使用，以及如何与 KV 交互。
流式处理 (Streaming): claude code 的体验高度依赖于流式响应。你必须熟练使用 Web Streams API，特别是 TransformStream，以便在 Worker 中实现低延迟的、实时的 SSE 格式转换。这是本项目的技术难点和核心。
API 格式差异: 你需要深刻理解 Claude Messages API 和 OpenAI Chat Completions API 在请求结构、响应结构、特别是流式事件格式上的细微差别。参考我们之前分析的 Python 项目逻辑是最佳实践。
GitHub OAuth: 你需要了解标准的 OAuth 2.0 授权码流程，以便在 Worker 中实现安全的 GitHub 登录。
OneAPI 等聚合服务: 你需要知道这类服务本身就是一个 OpenAI 接口的代理和统一管理平台。我们的应用是架设在这类服务之上的更高层代理，为 claude code 等特定工具提供兼容性。

5. 技术实现附录 (Technical Implementation Appendix)

引言: 本附录旨在为 AI 开发者提供将 Claude API 请求/响应与 OpenAI API 格式进行双向转换所需的全部技术细节。所有规则和接口定义均基于 claude-code-proxy Python 项目的成功实践，以确保最终实现的兼容性。

{
"model": "claude-3-5-sonnet-20240620",
"max_tokens": 4096,
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Hello, world" },
{
"type": "image",
"source": {
"type": "base64",
"media_type": "image/jpeg",
"data": "<base64_encoded_image_data>"
}
}
]
},
{
"role": "assistant",
"content": [
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "get_weather",
"input": { "location": "San Francisco" }
}
]
},
{
"role": "user",
"content": [
{
"type": "tool_result",
"tool_use_id": "toolu_01A09q90qw90lq917835lq9",
"content": "{\"temperature\": 72, \"unit\": \"fahrenheit\"}"
}
]
}
],
"system": "You are a helpful assistant.",
"temperature": 1.0,
"stream": false,
"tools": [
{
"name": "get_weather",
"description": "Get the current weather in a given location",
"input_schema": {
"type": "object",
"properties": {
"location": { "type": "string", "description": "The city and state, e.g. San Francisco, CA" }
},
"required": ["location"]
}
}
],
"tool_choice": { "type": "auto" }
}

5.1.2. OpenAI API (Chat Completions) - 请求体

{
"model": "gpt-4o",
"max_tokens": 4096,
"messages": [
{ "role": "system", "content": "You are a helpful assistant." },
{
"role": "user",
"content": [
{ "type": "text", "text": "Hello, world" },
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64,<base64_encoded_image_data>"
}
}
]
},
{
"role": "assistant",
"content": null,
"tool_calls": [
{
"id": "toolu_01A09q90qw90lq917835lq9",
"type": "function",
"function": {
"name": "get_weather",
"arguments": "{\"location\":\"San Francisco\"}"
}
}
]
},
{
"role": "tool",
"tool_call_id": "toolu_01A09q90qw90lq917835lq9",
"content": "{\"temperature\": 72, \"unit\": \"fahrenheit\"}"
}
],
"temperature": 1.0,
"stream": false,
"tools": [
{
"type": "function",
"function": {
"name": "get_weather",
"description": "Get the current weather in a given location",
"parameters": {
"type": "object",
"properties": {
"location": { "type": "string", "description": "The city and state, e.g. San Francisco, CA" }
},
"required": ["location"]
}
}
}
],
"tool_choice": "auto"
}

5.2. 请求转换规则 (Claude -> OpenAI)

Claude 字段	OpenAI 字段	转换规则
model	model	根据用户自定义的模型映射规则进行转换。
system	messages 数组首位	转换为 { "role": "system", "content": "..." } 并置于 messages 数组的第一个元素。
messages	messages	逐条转换，详见下方的 Message 转换规则。
max_tokens	max_tokens	直接映射。
temperature	temperature	直接映射。
stream	stream	直接映射。
tools	tools	转换为 [{ "type": "function", "function": { ... } }] 格式。input_schema 字段重命名为 parameters。
tool_choice	tool_choice	{"type": "auto"} -> "auto"; {"type": "any"} -> "required"; {"type": "tool", "name": "..."} -> {"type": "function", "function": {"name": "..."}}。

Message 转换规则 (Claude -> OpenAI)

Claude Message content 类型	OpenAI Message 格式
role: "user", content: [{ "type": "text", ... }]	{ "role": "user", "content": "..." }
role: "user", content: [{ "type": "image", ... }]	{ "role": "user", "content": [{ "type": "image_url", "image_url": { "url": "data:..." } }] }
role: "assistant", content: [{ "type": "tool_use", ... }]	{ "role": "assistant", "tool_calls": [{ "id": ..., "type": "function", "function": { "name": ..., "arguments": JSON.stringify(...) } }] }
role: "user", content: [{ "type": "tool_result", ... }]	{ "role": "tool", "tool_call_id": ..., "content": "..." }

5.3. 响应转换规则 (OpenAI -> Claude)

5.3.1. 非流式响应

OpenAI 响应字段	Claude 响应字段	转换规则
id	id	直接映射。
model	model	直接映射。
choices[0].message.content	content 数组	转换为 { "type": "text", "text": "..." } 并放入 content 数组。
choices[0].message.tool_calls	content 数组	遍历 tool_calls，每个都转换为 { "type": "tool_use", "id": ..., "name": ..., "input": JSON.parse(...) } 并放入 content 数组。
choices[0].finish_reason	stop_reason	"stop" -> "end_turn"; "length" -> "max_tokens"; "tool_calls" -> "tool_use".
usage.prompt_tokens	usage.input_tokens	直接映射。
usage.completion_tokens	usage.output_tokens	直接映射。

5.3.2. 流式响应 (SSE) - 核心实现

代理必须严格按照以下顺序和格式生成 SSE 事件流，以模拟 Claude API。

步骤	触发条件	发送的 Claude 事件	事件 data 示例
1	收到 OpenAI 流的第一个数据块	ping	{ "type": "ping" }
2	(紧随步骤1之后)	message_start	{ "type": "message_start", "message": { "id": "...", "role": "assistant", ... } }
3	OpenAI 流中出现第一个 delta.content	content_block_start (for text)	{ "type": "content_block_start", "index": 0, "content_block": { "type": "text", "text": "" } }
4	OpenAI 流中每个 delta.content	content_block_delta (text_delta)	{ "type": "content_block_delta", "index": 0, "delta": { "type": "text_delta", "text": "..." } }
5	OpenAI 流中出现第一个 delta.tool_calls[i] (包含 id 和 name)	content_block_start (for tool_use)	{ "type": "content_block_start", "index": i+1, "content_block": { "type": "tool_use", "id": "...", "name": "...", "input": {} } }
6	OpenAI 流中每个 delta.tool_calls[i].function.arguments	content_block_delta (input_json_delta)	{ "type": "content_block_delta", "index": i+1, "delta": { "type": "input_json_delta", "partial_json": "..." } }
7	OpenAI 流结束 ([DONE])	content_block_stop (for each block)	{ "type": "content_block_stop", "index": ... }
8	(紧随步骤7之后)	message_delta	{ "type": "message_delta", "delta": { "stop_reason": "...", ... }, "usage": { ... } }
9	(紧随步骤8之后)	message_stop	{ "type": "message_stop" }

关键实现要点:

状态管理: 在处理流的过程中，需要维护状态，例如当前已经开启了哪些 content block（文本或工具），以及每个 tool call 累积的 arguments 字符串。
索引计数: index 字段必须正确递增。通常第一个文本块是 index: 0，后续的工具使用块依次为 1, 2, ...。
事件顺序: 必须严格保证 _start, _delta, _stop 事件的正确配对和顺序。