通用对话接口
OpenAI Chat Completions 兼容格式,适用于 GPT / Claude / Gemini
POST
使用 OpenAI Chat Completions 兼容格式发起对话请求,可统一调用 GPT、Claude、Gemini 等文本与多模态模型。
接口说明
该接口用于以统一对话格式调用 OpenAI、Claude、Gemini 等上游模型。默认返回完整 JSON;如需边生成边展示,请在请求体中传入"stream": true。
模型可用范围取决于 API Key 的分组权限。完整模型清单以
GET /v1/models 返回为准。请求头
API Key 鉴权信息,格式为
Bearer YOUR_API_KEY。固定为
application/json。请求体
模型 ID,例如
gpt-4o、claude-sonnet-4-20250514、gemini-2.5-pro。可通过 GET /v1/models 查询当前 API Key 可用模型。是否使用 SSE 流式返回,默认
false。流式模式下是否在结束前返回 token 用量信息。
采样温度,常用范围为
0 到 2。数值越高,输出越发散。最大输出 token 数。
响应体
本次请求的唯一 ID。
对象类型。非流式响应通常为
chat.completion,流式片段通常为 chat.completion.chunk。实际参与生成的模型 ID。
模型输出结果数组。非流式响应中可读取
choices[0].message.content;流式响应中可逐段读取 choices[0].delta.content。token 用量统计,通常包含
prompt_tokens、completion_tokens 与 total_tokens。多模态输入
Vision 模型支持 OpenAI 兼容的图片输入格式:错误码
| 状态码 | 含义 | 处理建议 |
|---|---|---|
401 | API Key 无效或未传 | 检查 Authorization 请求头 |
403 | 无权限访问该模型 | 确认 API Key 分组是否包含目标模型 |
402 | 余额不足 | 充值或调整调用配额 |
429 | 触发限速 | 降低请求频率或联系管理员 |
5xx | 上游或网关异常 | 稍后重试,并查看控制台日志 |
