高级图像生成
增强版图像生成任务类型,支持图像编辑和更多细粒度参数。任务离开等待队列后通常会在几秒内完成。当 model_version 为 flux.1_kontext_pro、flux.1_dev、gpt_4o 或 gemini_2.5_flash_image_preview 时,单次消耗 5 积分;当为 gpt_image_1.5、gpt_image_2、midjourney、gemini_3_pro_image_preview 或 gemini_3.1_flash_image_preview 时,单次消耗 10 积分。参数不会产生额外计费。
接口地址
参数
必填参数
type: Must be set to generate_image.
prompt: 用于引导模型生成的 text 文本。 prompt 最长 1024 个字符,约等于 100 个英文单词。 API 支持多语言输入,但不支持 emoji 和部分特殊 Unicode 字符。
建议
当通过 files 传入多张参考图时,你可以在 prompt 中使用 [image number] 语法指定引用哪张图(例如:"Use the style of image[1] with colors from image[2]")。
可选参数
model_version: 图像模型版本。可选版本如下;不设置时使用默认版本:
flux.1_kontext_pro(default)flux.1_dev(无法与图像文件同时使用;若请求中包含图像文件,将自动升级为默认版本)gpt_4o(gpt-image-1)gpt_image_1.5gpt_image_2midjourney(无法与图像文件同时使用)gemini_2.5_flash_image_preview(也称 nano banana)gemini_3_pro_image_preview(别名:nano banana pro)gemini_3.1_flash_image_preview(别名:nano banana 2)
注意
flux.1_kontext_pro 不支持 WebP 输入图像。
template: 图像模板的 slug,用于应用预设风格包。设置后,系统会将模板的提示词附加到你的 prompt 之前,并将模板图像作为额外参考图合并传入。可选值如下:
| 模板值 | 说明 |
|---|---|
asset_extraction | 将场景元素提取为独立资产,用于 3D 生成。 推荐搭配:Nano Banana 2、图像输入、ar 16:9、Smart Mesh |
character_completion | 补全缺失部位,还原完整角色形象。 推荐搭配:Nano Banana、图像输入 |
t_pose | 将角色转换为标准 T-Pose,便于绑定与动画制作。 推荐搭配:Nano Banana、ar 1:1、Smart Mesh |
head_extraction | 提取头部以增强面部细节,用于高保真 3D 生成。 推荐搭配:Nano Banana、ar 1:1、图像输入 |
3d_enhance | 增强 3D 结构与细节(2D → 3D)。 推荐搭配:Nano Banana、图像输入 |
variants | 基于原始输入生成多个风格一致的变体。 推荐搭配:Nano Banana 2、文本/图像输入 |
print_clay | 转换为高对比度粘土风格,适合 3D 打印。 推荐搭配:Nano Banana 2、图像输入、HD 模型 |
figure | 将照片转换为风格化手办角色。 推荐搭配:Nano Banana 2、图像输入、HD 模型 |
file: 指定图像输入。
type: 表示文件类型。虽然当前不会严格校验,但强烈建议填写正确的文件类型。file_token: 从上传接口获得的标识,请参考直接上传部分。与url和object互斥。url: 图像的直链 URL。支持 JPEG 和 PNG,最大 20MB。与file_token和object互斥。object(强烈推荐): 从上传接口获取的对象信息,请参考 Upload in STS。与url和file_token互斥。bucket: 通常固定为tripo-data。key: 返回值中的resource_uri。
files: 指定图像输入,为 file 列表。对于 flux.1_kontext_pro 最多可传 4 张;对于 gpt_4o、gpt_image_2 和 gemini_2.5_flash_image_preview 最多可传 10 张。
t_pose: bool 值。将对象在保留主要特征的前提下转为 T Pose。默认值为 false。
sketch_to_render: bool 值。将草图转换为渲染图。默认值为 false。
返回值
task_id: 成功提交任务后的唯一标识。