model | string | 是 | — | 模型名称,使用 pl-ByteDance-Seed-1.8 |
messages | object[] | 是 | — | 对话消息列表,支持 system、user、assistant 角色 |
thinking | object | 否 | {"type":"enabled"} | 控制是否开启深度思考模式。默认开启,可设置 {"type":"disabled"} 关闭 |
max_tokens | integer | null | 否 | 4096 | 模型回复最大长度(单位 token),不可与 max_completion_tokens 同时设置 |
max_completion_tokens | integer | null | 否 | — | 控制模型输出最大长度(含思维链),取值 [0, 64k]。设置后 max_tokens 与思维链最大长度失效,不可与 max_tokens 同时设置 |
temperature | float | null | 否 | 1 | 采样温度,取值 [0, 2]。值越高输出越随机,值越低越确定。建议不与 top_p 同时调整 |
top_p | float | null | 否 | 0.7 | 核采样概率阈值,取值 [0, 1]。建议不与 temperature 同时调整 |
stop | string | string[] | null | 否 | null | 停止词,最多 4 个字符串。深度思考模式不支持此字段 |
frequency_penalty | float | null | 否 | 0 | 频率惩罚系数,取值 [-2.0, 2.0]。正值降低重复 |
presence_penalty | float | null | 否 | 0 | 存在惩罚系数,取值 [-2.0, 2.0]。正值增加新主题概率 |
logprobs | boolean | null | 否 | false | 是否返回输出 token 的对数概率 |
top_logprobs | integer | null | 否 | 0 | 每个位置返回最可能的 token 数量,取值 [0, 20]。仅当 logprobs=true 时有效 |
logit_bias | map | null | 否 | null | 调整指定 token 出现概率,键为 token ID,值为偏差 [-100, 100] |
tools | object[] | null | 否 | null | 工具调用列表,模型可返回待调用工具信息 |
stream | boolean | 否 | false | 是否使用流式输出 |