DataEyesAI
官网首页文档首页快速开始开发工具接入AI大模型API
官网首页文档首页快速开始开发工具接入AI大模型API
  1. OpenAI格式(支持各大原厂模型)
  • OpenAI格式(支持各大原厂模型)
    • 批量推理 (Chat) API 文档
    • 聊天(Response)
      • 创建模型响应
      • 创建模型响应(流式返回)
      • 创建网络搜索
      • 创建模型响应 gpt-5启用思考
      • 创建函数调用
      • 创建模型响应 (控制思考长度)
    • ChatGPT接口
      • ChatGPT音频(Audio)
        • 音频转文字 gpt-4o-transcribe
        • GPT-4o-audio
        • 音频转文字 whisper-1
        • 音频转文字 gpt-4o-transcribe
        • 创建语音 gpt-4o-mini-tts
      • ChatGPT聊天(Chat)
        • 创建聊天识图 (非流)
        • 创建聊天识图 (流式)
        • 创建聊天识图 (流式) base64
        • 官方N测试
        • 创建结构化输出
        • 控制推理模型努力程度
        • 创建聊天函数调用
        • deepseek-ocr 识别
        • 创建聊天补全 (非流)
      • ChatGPT自动补全(Completions)
        • ChatGPT自动补全(Completions)
        • 创建完成
    • 图像
      • GPT Image 2
      • 图像编辑 API 文档
      • 文生图片
      • 创建聊天补全 (流式)
      • 创建聊天补全 qwen-mt-turbo
      • 创建聊天补全 deepseek v3.1思考程度 (流式)
    • 语音
      • 语音识别(audio)
      • 语音合成(audio)
      • 官方Function calling调用
      • 创建聊天创作图 (非流)
    • 向量化
      • 文本向量化
  • Anthropic格式
    • 聊天
    • 聊天(prompt cache)
    • 流式返回
    • 聊天(旧模型-深度思考)
    • 聊天(新模型-深度思考)
    • 工具调用(function call)
    • 分析图片
  • Midjourney格式
    • Midjourney API 接口文档
    • 任务查询接口
    • 获取种子(Seed)
    • 上传图片(upload)
    • 文生图(Imagine)
    • 根据ID列表查询任务
    • 换脸(FaceSwap)
    • 执行Action动作
    • 提交Blend任务
    • 提交Describe任务
    • 提交Modal
    • 刷新链接(Refresh)
    • 编辑图片(Edit)
    • 根据任务ID 查询任务状态
    • 获取任务图片的seed
  • NanoBanana
    • OpenAI请求方式
      • 编辑图像
      • OpenAI 图像格式
    • Gemini请求方式
      • 生成图片
      • 编辑图片
  • 视频生成接口API
    • 豆包Seedance视频生成
      • 00-概述
      • 01-创建视频生成任务
      • 02-查询视频生成任务
      • 03-查询视频生成任务列表
      • 04-取消或删除视频生成任务
      • Seedance 私域素材库 API
    • 海螺Hailuo视频生成
      • 00-概述
      • 01-文生视频-T2V
      • 02-图生视频-I2V
      • 03-首尾帧生成视频-FL2V
      • 04-主体参考视频-S2V
      • 05-查询任务状态
      • 06-视频下载
      • 07-附录-运镜指令与回调
    • 可灵AI视频生成
      • 00-概述
      • 01-文生视频
      • 02-图生视频
      • 03-视频Omni
      • 04-多图参考生视频
      • 05-动作控制
      • 06-多模态视频编辑
      • 07-视频延长
      • 08-对口型
      • 09-数字人
      • 10-文生音效
      • 11-视频配音效
      • 12-语音合成
      • 13-音色克隆
      • 14-图像识别
      • 15-主体管理
      • 16-视频特效
    • Vidu视频生成
      • 00-概述
      • 01-文生视频
      • 02-图生视频
      • 03-参考生视频
      • 04-首尾帧
      • 05-智能多帧
      • 06-场景特效模板
      • 07-模板成片
      • 08-查询任务
    • 即梦视频生成
      • 00-概述
      • 01-3.0Pro视频生成
      • 02-720P文生视频
      • 03-720P图生视频-首帧
      • 04-720P图生视频-首尾帧
      • 05-720P图生视频-运镜
      • 06-1080P文生视频
      • 07-1080P图生视频-首帧
      • 08-1080P图生视频-首尾帧
      • 09-错误码
    • Grok视频生成
      • 00-概述
      • 01-文生视频
      • 02-图生视频
      • 03-参考图生视频
      • 04-视频编辑
      • 05-视频延长
    • HappyHorse
      • HappyHorse文生视频
      • HappyHorse图生视频-基于首帧
      • HappyHorse参考生视频
      • HappyHorse视频编辑
    • 通用视频生成API
      • 通用视频生成 API 接口调用文档
  • 语音接口API文档
    • 语音接口API
    • Gemini TTS 调用API
    • Google DeepMind Lyria API文档
  • 豆包系列-绘画
    • doubao-seededit-3-0-i2i-250628
    • doubao-seedream-4-0-250828-文生图
    • doubao-seedream-4-0-250828-图生图
    • doubao-seedream-4-0-250828-多图生图
  • Rerank重排序模型
    • 重排序
  • 文生音乐Suno
    • 任务提交
      • 生成歌曲(灵感模式)
      • 生成歌曲(自定义模式)
      • 生成歌曲(续写模式)
      • 生成歌曲(歌手风格)
      • 生成歌曲(上传歌曲二次创作)
      • 生成歌曲(拼接歌曲)
      • 生成歌词
      • 歌曲拼接
    • 查询接口
      • 批量获取任务
      • 查询单个任务
  • flux系列
    • flux-kontext-max
  • 谷歌Gemini接口
    • 原生格式
      • 文生图片 控制宽高比 +清晰度
      • 生成图片
      • 文本生成
      • 文本生成-流
      • 文本生成+思考-流
      • 图片生成
      • 格式化输出
      • 函数调用
      • 文档理解
      • URL context [原生格式]
      • 代码执行
      • 视频理解
      • URL context
      • 视频理解-url [原生格式]
      • Imagen 4
      • 音频理解
      • Embeddings
      • 聊天
      • 编辑图片
    • 图生图Base64请求方式
      • 多图融合片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
      • 图片编辑
      • 单图片 gemini-3-pro-image-preview 控制宽高比 +清晰度
      • 图片生成 gemini-2.5-flash-image
      • 图片生成 gemini-2.5-flash-image 控制宽高比
      • 图片理解
    • 图生图URL请求返回 URL请求格式OpenAI
      • 单图生图 gemini-3-pro-image-preview 控制宽高比 +清晰度
      • 多图融合片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
      • 图片理解
  1. OpenAI格式(支持各大原厂模型)

批量推理 (Chat) API 文档

DataEyes AI 批量推理 (Chat) API 文档#

概述#

批量推理 (Batch Chat) 是DataEyes AI 平台提供的大规模数据处理能力,底层基于火山方舟批量推理服务。与在线推理相比,批量推理具有以下优势:
更低成本:输入输出单价为在线推理的 50%,命中缓存的输入单价可进一步降低 60%。
改造简单:接口参数与标准 Chat Completions 接口一致,只需关注超时时间和并发策略,无需修改业务逻辑。
适用场景:大批量文本处理、离线数据分析、内容审核、批量翻译、文档摘要等不需要实时响应的场景。

重要说明:多条推理如何处理?#

批量推理 ≠ 一个请求处理多条数据。
每次 API 调用仍然只处理一条推理请求,请求体格式与标准 Chat Completions 完全一致。"批量"的含义是:
价格更低(在线推理的 50%)
超时容忍度更高(服务端会排队调度,高峰期可能需等待)
如果您需要处理多条数据,请通过并发发送多个独立的 API 请求来实现(参见下方"批量并发调用示例"章节)。每条数据对应一次独立的 HTTP 请求,互不影响。

接入信息#

配置项值
API 地址https://platform.dataeyes.ai/v1/chat/completions
请求方法POST
模型名称pl-ByteDance-Seed-1.8
鉴权方式Bearer Token(API Key)

鉴权说明#

所有请求需在 HTTP Header 中携带 API Key:
Authorization: Bearer 您的API Key
API Key 可在DataEyes AI 平台控制台获取。

请求参数#

Header#

参数类型必选说明
Authorizationstring是Bearer {API_KEY}
Content-Typestring是application/json

Body#

参数类型必选默认值说明
modelstring是—模型名称,使用 pl-ByteDance-Seed-1.8
messagesobject[]是—对话消息列表,支持 system、user、assistant 角色
thinkingobject否{"type":"enabled"}控制是否开启深度思考模式。默认开启,可设置 {"type":"disabled"} 关闭
max_tokensinteger | null否4096模型回复最大长度(单位 token),不可与 max_completion_tokens 同时设置
max_completion_tokensinteger | null否—控制模型输出最大长度(含思维链),取值 [0, 64k]。设置后 max_tokens 与思维链最大长度失效,不可与 max_tokens 同时设置
temperaturefloat | null否1采样温度,取值 [0, 2]。值越高输出越随机,值越低越确定。建议不与 top_p 同时调整
top_pfloat | null否0.7核采样概率阈值,取值 [0, 1]。建议不与 temperature 同时调整
stopstring | string[] | null否null停止词,最多 4 个字符串。深度思考模式不支持此字段
frequency_penaltyfloat | null否0频率惩罚系数,取值 [-2.0, 2.0]。正值降低重复
presence_penaltyfloat | null否0存在惩罚系数,取值 [-2.0, 2.0]。正值增加新主题概率
logprobsboolean | null否false是否返回输出 token 的对数概率
top_logprobsinteger | null否0每个位置返回最可能的 token 数量,取值 [0, 20]。仅当 logprobs=true 时有效
logit_biasmap | null否null调整指定 token 出现概率,键为 token ID,值为偏差 [-100, 100]
toolsobject[] | null否null工具调用列表,模型可返回待调用工具信息
streamboolean否false是否使用流式输出

messages 结构#

[
  {"role": "system", "content": "你是一个有用的助手。"},
  {"role": "user", "content": "你好,请介绍一下你自己。"}
]

thinking 结构#

// 开启深度思考(默认)
{"type": "enabled"}

// 关闭深度思考
{"type": "disabled"}

响应参数#

非流式返回#

参数类型说明
idstring本次请求的唯一标识
modelstring实际使用的模型名称和版本
createdinteger请求创建时间(Unix 时间戳,秒)
objectstring固定为 chat.completion
choicesobject[]模型输出内容
usageobject本次请求的 token 用量

choices 结构#

参数类型说明
indexinteger选项索引
messageobject模型回复消息,含 role 和 content
finish_reasonstring结束原因:stop(正常结束)、length(达到长度限制)、tool_calls(工具调用)

usage 结构#

参数类型说明
prompt_tokensinteger输入 token 数
completion_tokensinteger输出 token 数
total_tokensinteger总 token 数

请求示例#

cURL#

Python (requests)#

Python (OpenAI SDK)#

关闭深度思考示例#

流式调用示例 (Python)#

批量并发调用示例 (Python asyncio)#

处理多条数据时,通过并发发送多个请求来实现批量推理:
并发数建议:根据业务量合理控制,推荐 5~20。并发过高可能触发上游 429 限流错误(server overload),此时需降低并发或实现指数退避重试。

响应示例#

非流式响应#

{
  "id": "chatcmpl-xxxxxxxxxxxx",
  "object": "chat.completion",
  "created": 1719700000,
  "model": "doubao-seed-1-8",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "天空呈现蓝色是因为"瑞利散射"现象。当太阳光进入地球大气层时,波长较短的蓝光比波长较长的红光更容易被空气分子散射,因此我们看到的天空是蓝色的。"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 68,
    "total_tokens": 93
  }
}

注意事项#

1.
每次请求只处理一条:批量推理不支持在一个请求体中发送多条数据,多条数据请通过并发多个请求实现。
2.
超时设置:批量推理响应时间可能较长(高峰期服务端会排队调度),建议客户端超时设置为 24~72 小时(取值支持 1~72 小时)。设置较长超时不会影响配额使用,可放心设置;设置过短则在深度思考、长文本输出等场景容易中途超时断开,既浪费 token 又无法获得输出。
3.
429 限流处理:高峰期上游可能返回 429 server overload 错误,这是正常的流量调度行为。建议:
降低并发数(推荐 5~20)
实现指数退避重试:首次等待 1 秒,之后 2 秒、4 秒、8 秒...,最大等待 60 秒
在超时范围内持续重试,服务端会在负载降低后处理请求
4.
深度思考:默认开启深度思考模式,如不需要可通过 "thinking": {"type": "disabled"} 关闭以节省 token 和响应时间。
5.
Token 计费:批量推理单价为在线推理的 50%,命中缓存的输入 token 可进一步享受 60% 折扣。
6.
兼容性:本接口完全兼容 OpenAI Chat Completions API 格式,可直接使用 OpenAI SDK 调用。

错误码#

HTTP 状态码错误说明处理建议
400请求参数错误检查请求体格式和参数取值范围
401认证失败检查 API Key 是否正确
403无权访问确认 API Key 是否有该模型的访问权限
429请求过多(限流)降低请求频率,实现退避重试
500服务器内部错误稍后重试,如持续出现请联系技术支持
503服务过载实现指数退避重试策略

联系支持#

如在使用过程中遇到问题,请联系DataEyes AI 技术支持团队。
下一页
创建模型响应