DataEyesAI
官网首页文档首页
快速开始开发工具接入AI大模型API
官网首页文档首页
快速开始开发工具接入AI大模型API
  1. 可灵AI视频生成
  • 快速开始
    • 平台简介
    • 控制台(入门)
    • API key
    • Base URL
    • 模型矩阵
  • 开发工具接入
    • OpenClaw
    • Claude Code
    • Claude Code IDE
    • Codex
    • OpenCode
    • Cline
    • Grok CLI
    • Gemini CLI
    • N8N
    • AutoClaw
    • 其他工具
    • 常见问题
      • Claude Code 400 错误排查指南
  • AI大模型API
    • OpenAI格式(支持各大原厂模型)
      • 聊天(Response)
        • 创建模型响应
        • 创建模型响应(流式返回)
        • 创建网络搜索
        • 创建模型响应 gpt-5启用思考
        • 创建函数调用
        • 创建模型响应 (控制思考长度)
      • ChatGPT接口
        • ChatGPT音频(Audio)
          • 音频转文字 gpt-4o-transcribe
          • GPT-4o-audio
          • 音频转文字 whisper-1
          • 音频转文字 gpt-4o-transcribe
          • 创建语音 gpt-4o-mini-tts
        • ChatGPT聊天(Chat)
          • 创建聊天识图 (非流)
          • 创建聊天识图 (流式)
          • 创建聊天识图 (流式) best64
          • 官方N测试
          • 创建结构化输出
          • 控制推理模型努力程度
          • 创建聊天函数调用
          • deepseek-ocr 识别
          • 创建聊天补全 (非流)
        • ChatGPT自动补全(Completions)
          • ChatGPT自动补全(Completions)
          • 创建完成
      • 图像
        • GPT Image 2
        • 图像编辑 API 文档
        • 文生图片
        • 创建聊天补全 (流式)
        • 创建聊天补全 qwen-mt-turbo
        • 创建聊天补全 deepseek v3.1思考程度 (流式)
      • 语音
        • 语音识别(audio)
        • 语音合成(audio)
        • 官方Function calling调用
        • 创建聊天创作图 (非流)
      • 向量化
        • 文本向量化
    • Anthropic格式
      • 聊天
      • 聊天(prompt cache)
      • 流式返回
      • 聊天(旧模型-深度思考)
      • 聊天(新模型-深度思考)
      • 工具调用(function call)
      • 分析图片
    • Midjourney格式
      • Midjourney API 接口文档
      • 任务查询接口
      • 获取种子(Seed)
      • 上传图片(upload)
      • 文生图(Imagine)
      • 根据ID列表查询任务
      • 换脸(FaceSwap)
      • 执行Action动作
      • 提交Blend任务
      • 提交Describe任务
      • 提交Modal
      • 刷新链接(Refresh)
      • 编辑图片(Edit)
      • 根据任务ID 查询任务状态
      • 获取任务图片的seed
    • NanoBanana
      • OpenAI请求方式
        • 编辑图像
        • OpenAI 图像格式
      • Gemini请求方式
        • 生成图片
        • 编辑图片
    • 视频生成接口API
      • 通用视频生成API
        • 通用视频生成 API 接口调用文档
      • 豆包Seedance视频生成
        • 00-概述
        • 01-创建视频生成任务
        • 02-查询视频生成任务
        • 03-查询视频生成任务列表
        • 04-取消或删除视频生成任务
      • 海螺Hailuo视频生成
        • 00-概述
        • 01-文生视频-T2V
        • 02-图生视频-I2V
        • 03-首尾帧生成视频-FL2V
        • 04-主体参考视频-S2V
        • 05-查询任务状态
        • 06-视频下载
        • 07-附录-运镜指令与回调
      • 可灵AI视频生成
        • 00-概述
        • 01-文生视频
        • 02-图生视频
        • 03-视频Omni
        • 04-多图参考生视频
        • 05-动作控制
        • 06-多模态视频编辑
        • 07-视频延长
        • 08-对口型
        • 09-数字人
        • 10-文生音效
        • 11-视频配音效
        • 12-语音合成
        • 13-音色克隆
        • 14-图像识别
        • 15-主体管理
        • 16-视频特效
      • Vidu视频生成
        • 00-概述
        • 01-文生视频
        • 02-图生视频
        • 03-参考生视频
        • 04-首尾帧
        • 05-智能多帧
        • 06-场景特效模板
        • 07-模板成片
        • 08-查询任务
      • 即梦视频生成
        • 00-概述
        • 01-3.0Pro视频生成
        • 02-720P文生视频
        • 03-720P图生视频-首帧
        • 04-720P图生视频-首尾帧
        • 05-720P图生视频-运镜
        • 06-1080P文生视频
        • 07-1080P图生视频-首帧
        • 08-1080P图生视频-首尾帧
        • 09-错误码
      • Grok视频生成
        • 00-概述
        • 01-文生视频
        • 02-图生视频
        • 03-参考图生视频
        • 04-视频编辑
        • 05-视频延长
    • 语音接口API文档
      • 语音接口API
      • Gemini TTS 调用API
    • 豆包系列-绘画
      • doubao-seededit-3-0-i2i-250628
      • doubao-seedream-4-0-250828-文生图
      • doubao-seedream-4-0-250828-图生图
      • doubao-seedream-4-0-250828-多图生图
    • Rerank重排序模型
      • 重排序
    • 文生音乐Suno
      • 任务提交
        • 生成歌曲(灵感模式)
        • 生成歌曲(自定义模式)
        • 生成歌曲(续写模式)
        • 生成歌曲(歌手风格)
        • 生成歌曲(上传歌曲二次创作)
        • 生成歌曲(拼接歌曲)
        • 生成歌词
        • 歌曲拼接
      • 查询接口
        • 批量获取任务
        • 查询单个任务
    • flux系列
      • flux-kontext-max
    • 谷歌Gemini接口
      • 原生格式
        • 文生图片 控制宽高比 +清晰度
        • 生成图片
        • 文本生成
        • 文本生成-流
        • 文本生成+思考-流
        • 图片生成
        • 格式化输出
        • 函数调用
        • 文档理解
        • URL context [原生格式]
        • 代码执行
        • 视频理解
        • URL context
        • 视频理解-url [原生格式]
        • Imagen 4
        • 音频理解
        • Embeddings
        • 聊天
        • 编辑图片
      • 图生图Base64请求方式
        • 多图融合片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 图片编辑
        • 单图片 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 图片生成 gemini-2.5-flash-image
        • 图片生成 gemini-2.5-flash-image 控制宽高比
        • 图片理解
      • 图生图URL请求返回 URL请求格式OpenAI
        • 单图生图 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 多图融合片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 图片理解
    • grok视频
      POST
  • 搜索/阅读API
    • 网页阅读API
      • Web Reader API
      • Web Reader API (HK)
    • 联网搜索API
      • 模态卡API
        • 天气
          • 国内外城市ID
          • 天气查询API
        • 热搜API
      • 谷歌/bing搜索API
      • youtube搜索API
    • 文档OCR解析API
      • PDF文件
      • URL解析
  • 进阶与系统接口
    • DataEyesAI 模型能力与通道矩阵
    • HTTP注意事项
    • CODE&错误码
    • 数据更新相关
    • API 密钥与额度查询接口
    • Models(列出模型)
    • 查询账户信息
  1. 可灵AI视频生成

14-图像识别

图像识别#

文档版本:v1.0.0 | 最后更新:2026-06-11
本平台已完整适配可灵 AI 系列官方视频生成接口,请求与响应均为透传,参数语义与官方一致。

图像识别#

POST https://platform.dataeyes.ai/kling/v1/videos/image-recognize

请求头#

参数类型必填默认值说明
Content-Typestring是application/json数据交换格式
Authorizationstring是鉴权信息,参考接口鉴权

请求体#

参数类型必填默认值说明
imagestring是待识别的图片
支持传入图片Base64编码或图片URL(确保可访问)
请注意,若您使用base64的方式,请确保您传递的所有图像数据参数均采用Base64编码格式。在提交数据时,请不要在Base64编码字符串前添加任何前缀,例如data:image/png;base64,。正确的参数格式应该直接是Base64编码后的字符串。请仅提供Base64编码的字符串部分,以便系统能够正确处理和解析您的数据。
图片格式支持.jpg / .jpeg / .png。图片文件大小不能超过10MB,图片宽高尺寸不小于300px,图片宽高比介于1:2.5 ~ 2.5:1之间

请求示例#

curl --request POST \
  --url https://platform.dataeyes.ai/kling/v1/videos/image-recognize \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '{
    "image": "https://p2-kling.klingai.com/kcdn/cdn-kcdn112452/kling-qa-test/multi-1.png"
  }'

响应示例#

{
  "code": 0, // 错误码;具体定义见错误码
  "message": "string", // 错误信息
  "request_id": "string", // 请求ID,系统生成,用于跟踪请求、排查问题
  "data": {
    "task_result": {
      "images": [
        {
          "type": "object_seg", // 主体识别结果标识
          "is_contain": true, // 是否识别到主体;布尔值
          "url": "string" //识别后图片的URL,例如https://p1.a.kwimgs.com/bs2/upload-ylab-stunt/special-effect/output/HB1_PROD_ai_web_46554461/-2878350957757294165/output.png(请注意,为保障信息安全,生成的图片/视频会在30天后被清理,请及时转存)
        },
        {
          "type": "head_seg", // 含头发的人物面部识别结果标识
          "is_contain": true, // 是否识别到主体;布尔值
          "url": "string" //识别后图片的URL,例如https://p1.a.kwimgs.com/bs2/upload-ylab-stunt/special-effect/output/HB1_PROD_ai_web_46554461/-2878350957757294165/output.png(请注意,为保障信息安全,生成的图片/视频会在30天后被清理,请及时转存)
        },
        {
          "type": "face_seg", // 不含头发的人物面部识别结果标识
          "is_contain": true, // 是否识别到主体;布尔值
          "url": "string" //识别后图片的URL,例如https://p1.a.kwimgs.com/bs2/upload-ylab-stunt/special-effect/output/HB1_PROD_ai_web_46554461/-2878350957757294165/output.png(请注意,为保障信息安全,生成的图片/视频会在30天后被清理,请及时转存)
        },
        {
          "type": "cloth_seg", // 服装识别结果标识
          "is_contain": true, // 是否识别到主体;布尔值
          "url": "string" //识别后图片的URL,例如https://p1.a.kwimgs.com/bs2/upload-ylab-stunt/special-effect/output/HB1_PROD_ai_web_46554461/-2878350957757294165/output.png(请注意,为保障信息安全,生成的图片/视频会在30天后被清理,请及时转存)
        }
      ]
    },
    "final_unit_deduction": "string" // 任务最终扣减积分数值
  }
}
上一页
13-音色克隆
下一页
15-主体管理