DataEyesAI
官网首页文档首页
快速开始开发工具接入AI大模型API
官网首页文档首页
快速开始开发工具接入AI大模型API
  1. 图像
  • 快速开始
    • 平台简介
    • 控制台(入门)
    • API key
    • Base URL
    • 全网大模型支持与通道能力说明
  • 开发工具接入
    • OpenClaw
    • Claude Code
    • Claude Code IDE
    • Codex
    • OpenCode
    • Cline
    • Grok CLI
    • Gemini CLI
    • N8N
    • AutoClaw
    • 其他工具
    • 常见问题
      • Claude Code 400 错误排查指南
  • AI大模型API
    • OpenAI格式(支持各大原厂模型)
      • 聊天(Response)
        • 创建模型响应
        • 创建模型响应(流式返回)
        • 创建网络搜索
        • 创建模型响应 gpt-5启用思考
        • 创建函数调用
        • 创建模型响应 (控制思考长度)
      • ChatGPT接口
        • ChatGPT音频(Audio)
          • 音频转文字 gpt-4o-transcribe
          • GPT-4o-audio
          • 音频转文字 whisper-1
          • 音频转文字 gpt-4o-transcribe
          • 创建语音 gpt-4o-mini-tts
        • ChatGPT聊天(Chat)
          • 创建聊天识图 (非流)
          • 创建聊天识图 (流式)
          • 创建聊天识图 (流式) best64
          • 官方N测试
          • 创建结构化输出
          • 控制推理模型努力程度
          • 创建聊天函数调用
          • deepseek-ocr 识别
          • 创建聊天补全 (非流)
        • ChatGPT自动补全(Completions)
          • ChatGPT自动补全(Completions)
          • 创建完成
      • 图像
        • GPT Image 2
        • 图像编辑 API 文档
        • 文生图片
          POST
        • 修改图片(images)
          POST
        • 创建聊天补全 (流式)
          POST
        • 创建聊天补全 qwen-mt-turbo
          POST
        • 创建聊天补全 deepseek v3.1思考程度 (流式)
          POST
      • 语音
        • 语音识别(audio)
        • 语音合成(audio)
        • 官方Function calling调用
        • 创建聊天创作图 (非流)
      • 向量化
        • 文本向量化
    • Anthropic格式
      • 聊天
      • 聊天(prompt cache)
      • 流式返回
      • 聊天(旧模型-深度思考)
      • 聊天(新模型-深度思考)
      • 工具调用(function call)
      • 分析图片
    • Midjourney格式
      • 任务查询接口
      • 获取种子(Seed)
      • 上传图片(upload)
      • 文生图(Imagine)
      • 根据ID列表查询任务
      • 换脸(FaceSwap)
      • 执行Action动作
      • 提交Blend任务
      • 提交Describe任务
      • 提交Modal
      • 刷新链接(Refresh)
      • 编辑图片(Edit)
      • 根据任务ID 查询任务状态
      • 获取任务图片的seed
    • NanoBanana
      • OpenAI请求方式
        • 编辑图像
        • OpenAI 图像格式
      • Gemini请求方式
        • 生成图片
        • 编辑图片
    • 通用视频生成API
      • 通用视频生成 API 接口调用文档
      • Veo视频生成
        • OpenAI视频格式(推荐使用)
          • OpenAI创建视频,带图片
          • OpenAI查询任务
          • OpenAI下载视频
      • Kling快手可灵
        • 文生视频
        • 图生视频
        • 查询任务(免费)
      • Wan通义千问
        • 创建视频,带图片 Wan
        • 查询视频 Wan
      • MiniMax视频生成
        • 文生视频生成任务
        • 图生视频任务
        • 查询视频生成任务状态
        • 视频下载
      • Vidu视频生成
        • Vidu 生成视频
        • Vidu 查询
    • 官方视频生成API
      • Sora视频生成
        • OpenAI官方视频格式(推荐使用)
          • sora-2/sora-2-pro
            • OpenAI查询任务
            • OpenAI下载视频
            • OpenAI创建视频,带图片
            • OpenAI创建视频(带Character)
            • OpenAI编辑视频
        • Chat格式
          • 创建视频
          • 创建视频+图片
          • 连续修改生成视频
    • 语音接口技术文档
      • 语音接口API
      • Gemini TTS 调用API
    • 豆包系列-视频生成
      • 文生视频示例
      • 图生视频示例
      • 查询单个任务
    • 豆包系列-绘画
      • doubao-seededit-3-0-i2i-250628
      • doubao-seedream-4-0-250828-文生图
      • doubao-seedream-4-0-250828-图生图
      • doubao-seedream-4-0-250828-多图生图
    • Rerank重排序模型
      • 重排序
    • 文生音乐Suno
      • 任务提交
        • 生成歌曲(灵感模式)
        • 生成歌曲(自定义模式)
        • 生成歌曲(续写模式)
        • 生成歌曲(歌手风格)
        • 生成歌曲(上传歌曲二次创作)
        • 生成歌曲(拼接歌曲)
        • 生成歌词
        • 歌曲拼接
      • 查询接口
        • 批量获取任务
        • 查询单个任务
    • flux系列
      • flux-kontext-max
    • 谷歌Gemini接口
      • 原生格式
        • 文生图片 控制宽高比 +清晰度
        • 生成图片
        • 文本生成
        • 文本生成-流
        • 文本生成+思考-流
        • 图片生成
        • 格式化输出
        • 函数调用
        • 文档理解
        • URL context [原生格式]
        • 代码执行
        • 视频理解
        • URL context
        • 视频理解-url [原生格式]
        • Imagen 4
        • 音频理解
        • Embeddings
        • 聊天
        • 编辑图片
      • 图生图Base64请求方式
        • 多图融合片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 图片编辑
        • 单图片 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 图片生成 gemini-2.5-flash-image
        • 图片生成 gemini-2.5-flash-image 控制宽高比
        • 图片理解
      • 图生图URL请求返回 URL请求格式OpenAI
        • 单图生图 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 多图融合片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 图片理解
    • grok视频
      POST
  • 搜索/阅读API
    • 网页阅读API
      • Web Reader API
      • Web Reader API (HK)
    • 联网搜索API
      • 模态卡API
        • 天气
          • 国内外城市ID
          • 天气查询API
        • 热搜API
      • 谷歌/bing搜索API
      • youtube搜索API
    • 文档OCR解析API
      • PDF文件
      • URL解析
  • 进阶与系统接口
    • DataEyesAI 模型能力与通道矩阵
    • HTTP注意事项
    • CODE&错误码
    • 数据更新相关
    • API 密钥与额度查询接口
    • Models(列出模型)
    • 查询账户信息
  1. 图像

GPT Image 2

GPT Image 2 图片生成#

接口概述#

GPT Image 2 是 OpenAI 最新一代图片生成模型,支持根据文本描述生成高质量图片。本平台完全兼容 OpenAI 官方接口规范,您可以使用已有的 OpenAI SDK 或 HTTP 请求直接调用。
本平台提供两种接口和两种模型版本:
接口:
接口地址用途
Images APIPOST /v1/images/generations纯文本生图
Responses APIPOST /v1/responses文本生图 + 图片重绘编辑,支持多轮对话
模型版本:
模型说明
gpt-image-2标准版,与 OpenAI 官方 API 行为完全一致
gpt-image-2-sp扩展版,可尝试自定义分辨率、多种返回格式
两个模型使用同一接口地址,通过 model 参数区分。请根据您的 API Key 对应的模型选择正确的名称。

一、Images API — 文本生图#

基本信息#

项目说明
请求地址POST https://cloud.dataeyes.ai/v1/images/generations
认证方式Authorization: Bearer YOUR_API_KEY
请求格式Content-Type: application/json

快速开始#

cURL#

Python#

Node.js#

请求参数#

参数类型必填默认值说明
modelstring是—模型名称:gpt-image-2 或 gpt-image-2-sp
promptstring是—图片描述文本,支持中英文
sizestring否1024x1024图片尺寸,详见下文
qualitystring否auto图片质量:auto / high / medium / low
ninteger否1生成图片数量,详见下文
response_formatstring否b64_json返回格式,详见下文

返回结构#

b64_json 格式(默认):
{
  "created": 1777120429,
  "data": [
    {
      "b64_json": "iVBORw0KGgo..."
    }
  ],
  "usage": {
    "total_tokens": 780,
    "input_tokens": 15,
    "output_tokens": 765
  }
}
url 格式(仅 gpt-image-2-sp):
{
  "created": 1777195145,
  "data": [
    {
      "url": "https://example.com/generated-image.png"
    }
  ],
  "usage": {
    "total_tokens": 780,
    "input_tokens": 15,
    "output_tokens": 765
  }
}
字段类型说明
createdinteger请求创建的 Unix 时间戳
dataarray图片数据数组
data[].b64_jsonstringbase64 编码的图片数据(PNG)
data[].urlstring图片下载链接(仅 url 格式时返回)
usage.total_tokensinteger总 Token 消耗
usage.input_tokensinteger输入 Token 数
usage.output_tokensinteger输出 Token 数

二、Responses API — 生图与重绘#

Responses API 支持更丰富的图片生成场景,包括文本生图和图片重绘编辑(基于已有图片进行修改)。
Responses API 的图片生成功能当前仅 gpt-image-2(标准版)支持。

基本信息#

项目说明
请求地址POST https://cloud.dataeyes.ai/v1/responses
认证方式Authorization: Bearer YOUR_API_KEY
请求格式Content-Type: application/json
支持模型gpt-5.5、gpt-4o、gpt-4.1、gpt-4.1-mini 等(通过 image_generation 工具调用 GPT Image 2)

文本生图#

通过 Responses API 生成图片时,需在 tools 中声明 image_generation 工具:

图片重绘 / 编辑#

传入已有图片和修改指令,即可对图片进行编辑。支持传入图片 URL 或 base64 Data URI:

Responses API 返回结构#

{
  "id": "resp_xxx",
  "object": "response",
  "status": "completed",
  "model": "gpt-5.5",
  "output": [
    {
      "type": "image_generation_call",
      "status": "completed",
      "action": "generate",
      "size": "1024x1024",
      "quality": "high",
      "result": "iVBORw0KGgo...",
      "revised_prompt": "模型优化后的提示词..."
    },
    {
      "type": "message",
      "content": [
        {
          "type": "output_text",
          "text": "模型的文本回复..."
        }
      ]
    }
  ]
}
字段说明
output[].typeimage_generation_call(图片)或 message(文本)
output[].actiongenerate(新生成)或 edit(编辑已有图片)
output[].resultbase64 编码的图片数据
output[].size生成的图片尺寸
output[].revised_prompt模型实际使用的优化后提示词

三、参数详细说明#

图片尺寸(size)#

标准尺寸#

所有模型版本均支持以下尺寸:
size宽高比适用场景
1024x10241:1头像、图标、社交媒体配图
1536x10243:2横版海报、网页 Banner、风景图
1024x15362:3竖版海报、手机壁纸、人像图

自定义尺寸(gpt-image-2-sp)#

gpt-image-2-sp 可尝试自定义分辨率。自定义尺寸需满足以下条件:
条件要求
最低像素宽 × 高 ≥ 1,048,576(约 1024×1024)
对齐规则宽和高均为 16 的整数倍
最大边长单边不超过 2048 像素(推荐上限)
常用自定义尺寸:
size宽高比适用场景
1280x72016:9视频封面、演示文稿
1792x10247:4宽幅海报
2048x20481:1高清方图
不支持的尺寸示例:
size失败原因
512x512总像素低于最低要求
1920x10801080 不是 16 的整数倍(1080 ÷ 16 = 67.5)
4096x4096单边超过限制
自定义尺寸为扩展能力,支持范围可能随平台版本更新调整,请以实际调用结果为准。

图片质量(quality)#

quality说明
auto模型自动选择(默认)
high高质量,细节丰富,耗时较长
medium中等质量,兼顾效果与速度
low低质量,生成速度快,适合草稿预览

批量生成(n)#

模型支持范围说明
gpt-image-21 ~ 10单次请求生成多张图片,data 数组包含对应数量的结果
gpt-image-2-sp1当前版本每次请求生成 1 张图片
gpt-image-2 批量生成示例:
批量生成时,耗时和 Token 消耗与图片数量成正比。
gpt-image-2-sp 生成多张图片:
gpt-image-2-sp 需通过多次请求实现:

返回格式(response_format)#

仅适用于 Images API。
模型支持的格式默认值
gpt-image-2b64_jsonb64_json(固定)
gpt-image-2-spb64_json、urlb64_json
b64_json:返回 base64 编码的图片数据,解码后为 PNG 格式
url:返回图片下载链接(仅 gpt-image-2-sp 支持)
高分辨率图片(2048×2048)的 base64 数据量较大(约 8MB),使用 gpt-image-2-sp 时建议指定 response_format=url 以降低传输压力和超时风险。
如果需要返回 base64 编码的图片,可指定"response_format": "b64_json"
url 格式请求示例:
base64 格式请求示例:

四、模型能力对比#

Images API#

能力gpt-image-2gpt-image-2-sp
标准尺寸1024×1024 / 1536×1024 / 1024×15361024×1024 / 1536×1024 / 1024×1536
批量生成 (n)1~101
返回格式b64_jsonb64_json / url
qualityauto / high / medium / lowauto / high / medium / low
size=auto支持—

Responses API#

能力gpt-image-2gpt-image-2-sp
文本生图支持(通过 gpt-5.5 / gpt-4o / gpt-4.1)暂不支持
图片重绘 / 编辑支持(通过 gpt-5.5 / gpt-4o / gpt-4.1)暂不支持

五、性能参考#

以下数据基于实际测试,供参考:
尺寸质量单张耗时Token 消耗图片大小
1024×1024high20~30s~7801~2 MB
1024×1024low20~30s~780~1 MB
1536×1024high50~70s~1,1202~3 MB
1024×1536high50~70s~1,1202~3 MB
2048×2048high80~140s~7807~9 MB
以上为典型参考值,实际耗时受提示词复杂度和服务负载影响。

六、错误处理#

常见错误码#

HTTP 状态码说明处理建议
400参数不合法(如尺寸格式错误)检查请求参数
401API Key 无效或已过期核实 Key 是否正确
403无权访问该模型确认 Key 与模型名称匹配
429请求频率超限降低频率后重试
500服务端错误稍后重试,持续出现请联系技术支持

错误返回示例#

{
  "error": {
    "message": "错误描述信息",
    "type": "server_error"
  }
}

七、最佳实践#

1.
提示词:使用具体、详细的描述,包含主体、风格、构图、光线等关键词。
2.
尺寸选择:优先使用标准尺寸。使用自定义尺寸时,确保宽高为 16 的整数倍。
3.
超时设置:客户端超时建议 120 秒以上;高分辨率或批量请求建议 300 秒以上。
4.
高分辨率传输:2048 尺寸的 base64 数据量大(约 8MB),建议使用 gpt-image-2-sp 的 url 返回格式。
5.
错误重试:5xx 错误等待 3~5 秒后重试,最多 3 次。
6.
批量生成:gpt-image-2 使用 n 参数;gpt-image-2-sp 通过多次请求实现,建议间隔 1~2 秒。
7.
图片编辑:需要重绘或修改已有图片时,使用 Responses API,传入原图和修改指令。单次图片编辑可使用接口/v1/images/edits。
上一页
创建完成
下一页
图像编辑 API 文档