DataEyesAI
官网首页文档首页快速开始开发工具接入AI大模型API
官网首页文档首页快速开始开发工具接入AI大模型API
  1. Vidu视频生成
  • OpenAI格式(支持各大原厂模型)
    • 聊天(Response)
      • 创建模型响应
      • 创建模型响应(流式返回)
      • 创建网络搜索
      • 创建模型响应 gpt-5启用思考
      • 创建函数调用
      • 创建模型响应 (控制思考长度)
    • ChatGPT接口
      • ChatGPT音频(Audio)
        • 音频转文字 gpt-4o-transcribe
        • GPT-4o-audio
        • 音频转文字 whisper-1
        • 音频转文字 gpt-4o-transcribe
        • 创建语音 gpt-4o-mini-tts
      • ChatGPT聊天(Chat)
        • 创建聊天识图 (非流)
        • 创建聊天识图 (流式)
        • 创建聊天识图 (流式) best64
        • 官方N测试
        • 创建结构化输出
        • 控制推理模型努力程度
        • 创建聊天函数调用
        • deepseek-ocr 识别
        • 创建聊天补全 (非流)
      • ChatGPT自动补全(Completions)
        • ChatGPT自动补全(Completions)
        • 创建完成
    • 图像
      • GPT Image 2
      • 图像编辑 API 文档
      • 文生图片
      • 创建聊天补全 (流式)
      • 创建聊天补全 qwen-mt-turbo
      • 创建聊天补全 deepseek v3.1思考程度 (流式)
    • 语音
      • 语音识别(audio)
      • 语音合成(audio)
      • 官方Function calling调用
      • 创建聊天创作图 (非流)
    • 向量化
      • 文本向量化
  • Anthropic格式
    • 聊天
    • 聊天(prompt cache)
    • 流式返回
    • 聊天(旧模型-深度思考)
    • 聊天(新模型-深度思考)
    • 工具调用(function call)
    • 分析图片
  • Midjourney格式
    • Midjourney API 接口文档
    • 任务查询接口
    • 获取种子(Seed)
    • 上传图片(upload)
    • 文生图(Imagine)
    • 根据ID列表查询任务
    • 换脸(FaceSwap)
    • 执行Action动作
    • 提交Blend任务
    • 提交Describe任务
    • 提交Modal
    • 刷新链接(Refresh)
    • 编辑图片(Edit)
    • 根据任务ID 查询任务状态
    • 获取任务图片的seed
  • NanoBanana
    • OpenAI请求方式
      • 编辑图像
      • OpenAI 图像格式
    • Gemini请求方式
      • 生成图片
      • 编辑图片
  • 视频生成接口API
    • 通用视频生成API
      • 通用视频生成 API 接口调用文档
    • 豆包Seedance视频生成
      • 00-概述
      • 01-创建视频生成任务
      • 02-查询视频生成任务
      • 03-查询视频生成任务列表
      • 04-取消或删除视频生成任务
    • 海螺Hailuo视频生成
      • 00-概述
      • 01-文生视频-T2V
      • 02-图生视频-I2V
      • 03-首尾帧生成视频-FL2V
      • 04-主体参考视频-S2V
      • 05-查询任务状态
      • 06-视频下载
      • 07-附录-运镜指令与回调
    • 可灵AI视频生成
      • 00-概述
      • 01-文生视频
      • 02-图生视频
      • 03-视频Omni
      • 04-多图参考生视频
      • 05-动作控制
      • 06-多模态视频编辑
      • 07-视频延长
      • 08-对口型
      • 09-数字人
      • 10-文生音效
      • 11-视频配音效
      • 12-语音合成
      • 13-音色克隆
      • 14-图像识别
      • 15-主体管理
      • 16-视频特效
    • Vidu视频生成
      • 00-概述
      • 01-文生视频
      • 02-图生视频
      • 03-参考生视频
      • 04-首尾帧
      • 05-智能多帧
      • 06-场景特效模板
      • 07-模板成片
      • 08-查询任务
    • 即梦视频生成
      • 00-概述
      • 01-3.0Pro视频生成
      • 02-720P文生视频
      • 03-720P图生视频-首帧
      • 04-720P图生视频-首尾帧
      • 05-720P图生视频-运镜
      • 06-1080P文生视频
      • 07-1080P图生视频-首帧
      • 08-1080P图生视频-首尾帧
      • 09-错误码
    • Grok视频生成
      • 00-概述
      • 01-文生视频
      • 02-图生视频
      • 03-参考图生视频
      • 04-视频编辑
      • 05-视频延长
  • 语音接口API文档
    • 语音接口API
    • Gemini TTS 调用API
  • 豆包系列-绘画
    • doubao-seededit-3-0-i2i-250628
    • doubao-seedream-4-0-250828-文生图
    • doubao-seedream-4-0-250828-图生图
    • doubao-seedream-4-0-250828-多图生图
  • Rerank重排序模型
    • 重排序
  • 文生音乐Suno
    • 任务提交
      • 生成歌曲(灵感模式)
      • 生成歌曲(自定义模式)
      • 生成歌曲(续写模式)
      • 生成歌曲(歌手风格)
      • 生成歌曲(上传歌曲二次创作)
      • 生成歌曲(拼接歌曲)
      • 生成歌词
      • 歌曲拼接
    • 查询接口
      • 批量获取任务
      • 查询单个任务
  • flux系列
    • flux-kontext-max
  • 谷歌Gemini接口
    • 原生格式
      • 文生图片 控制宽高比 +清晰度
      • 生成图片
      • 文本生成
      • 文本生成-流
      • 文本生成+思考-流
      • 图片生成
      • 格式化输出
      • 函数调用
      • 文档理解
      • URL context [原生格式]
      • 代码执行
      • 视频理解
      • URL context
      • 视频理解-url [原生格式]
      • Imagen 4
      • 音频理解
      • Embeddings
      • 聊天
      • 编辑图片
    • 图生图Base64请求方式
      • 多图融合片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
      • 图片编辑
      • 单图片 gemini-3-pro-image-preview 控制宽高比 +清晰度
      • 图片生成 gemini-2.5-flash-image
      • 图片生成 gemini-2.5-flash-image 控制宽高比
      • 图片理解
    • 图生图URL请求返回 URL请求格式OpenAI
      • 单图生图 gemini-3-pro-image-preview 控制宽高比 +清晰度
      • 多图融合片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
      • 图片理解
  • grok视频
    POST
  1. Vidu视频生成

03-参考生视频

参考生视频#

文档版本:v1.0.0 | 最后更新:2026-06-11
本平台已完整适配 Vidu 系列官方视频生成接口,请求与响应均为透传,参数语义与官方一致。
以参考图片/视频的主体一致性生成视频,支持主体库功能。该接口包含两种调用方式:使用主体调用(通过 subjects 参数)和非主体调用(通过 images/videos 参数)。
POST https://platform.dataeyes.ai/vidu/ent/v2/reference2video

请求参数#

请求头#

头部必填说明
Content-Type是application/json
Authorization是Token {API_KEY}

方式一:使用主体调用#

通过 subjects 参数传入主体信息,在提示词中通过 @主体名称 引用。

请求体#

参数子参数类型必填说明
modelString是模型名称。可选值:viduq3-turbo、viduq3、viduq2-pro、viduq2、viduq1、vidu2.0。
- viduq3-turbo:支持智能切镜,音画同出,生成速度最快
- viduq3:支持智能切镜,音画同出,多机位一致性更出色
- viduq2-pro:支持参考视频,视频编辑,视频替换
- viduq2:动态效果好,细节丰富
- viduq1:画面清晰,平滑转场,运镜稳定
- vidu2.0:生成速度快
auto_subjectsBool可选是否使用智能主体库能力。默认 false。
subjectsArray是主体列表。q3/q2/q1/2.0 模型仅支持图片和文字主体(最多 7 个);q2-pro 可额外使用视频主体(图片/文字最多 4 个,视频最多 2 个)。
nameString是主体名称。后续在 prompt 中通过 @name 引用。
imagesArray[String]可选主体图片 URL 或 Base64。最多 3 张。与 videos 至少填一个。
支持 png、jpeg、jpg、webp 格式,Base64 须含内容类型前缀。
videosArray[String]可选主体视频 URL 或 Base64。与 images 至少填一个。
仅 viduq2-pro 支持,支持 1 个 5 秒视频。
支持 mp4、avi、mov 格式。
voice_idString可选音色 ID。为空时系统自动推荐。q3 参考生模型不生效。
server_idString可选通过创建主体 API 获取的主体 ID,使用已有主体时必传。
promptString是文本提示词。字符长度不超过 5000 个字符。
使用 subjects 时可通过 @主体name 引用,例如:"@角色A 和 @角色B 在一起吃火锅"
audioBool可选是否使用音视频直出。viduq3、viduq3-turbo 默认 true,其他模型默认 false。
audio_typeString可选音频类型,audio 为 true 时生效。默认 all。
可选值:all(音效+人声)、speech_only(仅人声)、sound_effect_only(仅音效)
durationInt可选视频时长(秒):
- viduq3-turbo、viduq3:默认 5,可选 3–16
- viduq2-pro:默认 5,可选 0–10(0 为自动判断时长)
- viduq2:默认 5,可选 1–10
- viduq1:默认 5,可选 5
- vidu2.0:默认 4,可选 4
seedInt可选随机种子。不传或传 0 时使用随机数。
aspect_ratioString可选宽高比。默认 16:9,可选值:16:9、9:16、1:1。
注:q2 模型支持任意宽高比
resolutionString可选分辨率:
- viduq3-turbo、viduq3(3–16s):默认 720p,可选 540p、720p、1080p
- viduq2、viduq2-pro:默认 720p,可选 540p、720p、1080p
- viduq1:默认 1080p,可选 1080p
- vidu2.0:默认 360p,可选 360p、720p
movement_amplitudeString可选运动幅度。默认 auto。注:q2、q3 模型不生效
off_peakBool可选错峰模式。默认 false。
注:q3 模型 audio 为 true 时支持错峰;q2/q1/2.0 系列 audio 为 false 时支持错峰
watermarkBool可选是否添加水印。默认不加。
wm_positionInt可选水印位置。1:左上,2:右上,3:右下(默认),4:左下
wm_urlString可选自定义水印图片 URL。
payloadString可选透传参数。最多 1048576 个字符。
meta_dataString可选元数据标识,JSON 格式字符串,透传字段。
callback_urlString可选回调地址。

请求示例(主体调用)#


方式二:非主体调用#

直接传入参考图片/视频,模型自动提取主体一致性生成视频。

请求体#

参数类型必填说明
modelString是模型名称。可选值:viduq3-mix、viduq3-turbo、viduq3、viduq2-pro、viduq2、viduq1、vidu2.0。
- viduq3-mix:画面质感强,智能切镜,音画同出,均衡性最强
imagesArray[String]是参考图片。支持 1–7 张图片(URL 或 Base64)。
注:viduq2-pro 模型上传视频时最多 1–4 张图
支持 png、jpeg、jpg、webp 格式,像素不小于 128×128
videosArray[String]可选参考视频。仅 viduq2-pro 支持。
最多 1 个 8 秒视频或 2 个 5 秒视频。
支持 mp4、avi、mov 格式,大小不超过 100M
promptString是文本提示词。字符长度不超过 2000 个字符。
audioBool可选是否使用音视频直出。非主体调用时仅 q3 模型支持,默认 true。
bgmBool可选是否添加背景音乐。默认 false。
注:q2 系列 duration 为 9s/10s 时不生效;q3 系列不生效
durationInt可选视频时长(秒):
- viduq3-turbo、viduq3-mix:默认 5,可选 3–16
- viduq3:默认 5,可选 3–16
- viduq2-pro:默认 5,可选 0–10(0 为自动判断时长)
- viduq2:默认 5,可选 1–10
- viduq1:默认 5,可选 5
- vidu2.0:默认 4,可选 4
seedInt可选随机种子。
aspect_ratioString可选宽高比。默认 16:9,可选值:16:9、9:16、4:3、3:4、1:1。
注:4:3、3:4 仅支持 q2 系列模型
resolutionString可选分辨率:
- viduq3-mix(3–16s):默认 720p,可选 720p、1080p
- viduq3-turbo(3–16s):默认 720p,可选 540p、720p、1080p
- viduq3(3–16s):默认 720p,可选 540p、720p、1080p
- viduq2、viduq2-pro:默认 720p,可选 540p、720p、1080p
- viduq1:默认 1080p,可选 1080p
- vidu2.0:默认 360p,可选 360p、720p
movement_amplitudeString可选运动幅度。默认 auto。注:q2、q3 系列不生效
off_peakBool可选错峰模式。默认 false。
注:viduq3-mix 不支持错峰
watermarkBool可选是否添加水印。
wm_positionInt可选水印位置。
wm_urlString可选自定义水印图片 URL。
payloadString可选透传参数。
meta_dataString可选元数据标识。
callback_urlString可选回调地址。

请求示例(非主体调用)#


响应参数#

字段类型说明
task_idString任务 ID
stateString处理状态:created、queueing、processing、success、failed
modelString本次调用的模型名称
promptString提示词
imagesArray[String]图像参数
videosArray[String]视频参数(非主体调用 viduq2-pro 时返回)
durationInt视频时长
seedInt随机种子
aspect_ratioString宽高比
resolutionString分辨率
bgmBool是否添加背景音乐
audioBool是否开启音视频直出
audio_typeString音频类型
movement_amplitudeString运动幅度
payloadString透传参数
off_peakBool是否使用错峰模式
creditsInt本次调用消耗的积分数
watermarkBool是否使用水印
created_atString任务创建时间

响应示例#

{
  "task_id": "{task_id}",
  "state": "created",
  "model": "viduq3-mix",
  "images": ["https://example.com/ref1.png", "https://example.com/ref2.png"],
  "prompt": "Santa Claus and the bear hug by the lakeside.",
  "duration": 5,
  "seed": 123456,
  "aspect_ratio": "3:4",
  "resolution": "720p",
  "credits": 8,
  "created_at": "2025-01-01T15:41:31.968916Z"
}
上一页
02-图生视频
下一页
04-首尾帧