Go to file

hubian 3f463f2f98 feat: 添加自定义Auto配置功能

新增功能:
- Auto配置管理页面 (/auto-profiles)
- 创建自定义auto模式，如auto-fast, auto-cheap
- 指定候选提供商和优先级
- 支持按优先级/随机选择策略

API:
- GET/POST /api/auto-profiles
- GET/PUT/DELETE /api/auto-profiles/<name>

改进:
- 主服务支持自定义auto模式路由
- 模型列表显示所有auto配置

2026-04-09 17:46:47 +08:00

admin

feat: 添加自定义Auto配置功能

2026-04-09 17:46:47 +08:00

config

feat: 添加自定义Auto配置功能

2026-04-09 17:46:47 +08:00

data

feat: 后台管理增加提供商动态管理功能

2026-04-08 18:14:09 +08:00

.gitignore

feat: 添加自定义Auto配置功能

2026-04-09 17:46:47 +08:00

app.py

feat: 添加自定义Auto配置功能

2026-04-09 17:46:47 +08:00

README.md

新增后台管理系统

2026-04-08 15:49:47 +08:00

requirements.txt

初始化大模型API中转系统

2026-04-08 15:39:19 +08:00

README.md

大模型API中转系统

兼容OpenAI API格式的多提供商代理系统，支持优先级自动切换

功能特点

🔄 多提供商支持

支持配置多个上游大模型提供商
按优先级自动选择可用提供商
故障自动切换到备用提供商

📡 OpenAI API 兼容

完全兼容 OpenAI API 格式
支持 Chat Completions API
支持 Embeddings API
支持流式和非流式响应

🎯 智能路由

auto 模型自动选择可用提供商
支持模型别名映射
请求参数自动适配

🛡️ 高可用

自动健康检查
错误计数与熔断
自动重试机制

快速开始

安装依赖

pip install -r requirements.txt

启动服务

python app.py

访问地址

http://localhost:19007

API 使用

Chat Completions

curl http://localhost:19007/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer any-key" \
  -d '{
    "model": "auto",
    "messages": [{"role": "user", "content": "Hello!"}],
    "stream": false
  }'

列出模型

curl http://localhost:19007/v1/models

流式响应

curl http://localhost:19007/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.5-4b",
    "messages": [{"role": "user", "content": "Hello!"}],
    "stream": true
  }'

配置说明

编辑 config/settings.py:

UPSTREAM_PROVIDERS = [
    {
        "name": "provider-name",
        "priority": 1,           # 优先级，数字越小越高
        "base_url": "https://api.example.com/v1",
        "api_key": "sk-xxx",
        "models": ["model-1", "model-2"],
        "default_model": "model-1",
        "timeout": 120,
        "enabled": True,
    },
]

模型别名

MODEL_ALIASES = {
    "auto": "auto",            # 自动选择
    "gpt-4": "actual-model",   # 别名映射
}

端点

端点	方法	说明
`/`	GET	服务信息
`/v1/chat/completions`	POST	聊天完成
`/v1/embeddings`	POST	文本嵌入
`/v1/models`	GET	模型列表
`/health`	GET	健康检查
`/status`	GET	详细状态

使用示例

Python (OpenAI SDK)

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:19007/v1",
    api_key="any-key"
)

response = client.chat.completions.create(
    model="auto",
    messages=[
        {"role": "user", "content": "你好！"}
    ]
)

print(response.choices[0].message.content)

流式响应

stream = client.chat.completions.create(
    model="qwen3.5-4b",
    messages=[{"role": "user", "content": "讲个笑话"}],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

优先级机制

当使用 model="auto" 时：

按配置的优先级顺序选择提供商
跳过不可用的提供商
请求失败自动切换到下一个提供商
连续失败3次的提供商暂时标记为不可用

监控

健康检查

curl http://localhost:19007/health

详细状态

curl http://localhost:19007/status

项目结构

llm-proxy/
├── app.py              # 主程序
├── requirements.txt    # 依赖
├── config/
│   └── settings.py     # 配置
├── logs/              # 日志目录
└── README.md

后台管理

后台管理系统提供可视化监控和配置查看。

启动后台：

python admin/app.py

后台地址: http://localhost:19008

功能模块

模块	功能
仪表盘	统计数据、提供商状态、调用流程
提供商管理	查看提供商、测试连接、详情
模型管理	模型别名、目标模型、提供商映射
日志查看	实时日志、自动刷新
系统配置	配置查看

版本历史

v0.2.0 (2026-04-08)

新增后台管理系统
仪表盘统计
提供商管理
模型管理
日志查看

v0.1.0 (2026-04-08)

初始版本
多提供商支持
OpenAI API 兼容
优先级自动切换
流式响应支持

License

MIT

README.md Unescape Escape

大模型API中转系统

功能特点

🔄 多提供商支持

📡 OpenAI API 兼容

🎯 智能路由

🛡️ 高可用

快速开始

安装依赖

启动服务

访问地址

API 使用

Chat Completions

列出模型

流式响应

配置说明

模型别名

端点

使用示例

Python (OpenAI SDK)

流式响应

优先级机制

监控

健康检查

详细状态

项目结构

后台管理

功能模块

版本历史

v0.2.0 (2026-04-08)

v0.1.0 (2026-04-08)

License

README.md