Skip to content

高级图像生成

增强版图像生成任务类型,支持图像编辑和更多细粒度参数。任务离开等待队列后通常会在几秒内完成。当 model_versionflux.1_kontext_proflux.1_devgpt_4ogemini_2.5_flash_image_preview 时,单次消耗 5 积分;当为 gpt_image_1.5gpt_image_2midjourneygemini_3_pro_image_previewgemini_3.1_flash_image_preview 时,单次消耗 10 积分。参数不会产生额外计费。

接口地址

参数

必填参数

type: Must be set to generate_image.

prompt: 用于引导模型生成的 text 文本。 prompt 最长 1024 个字符,约等于 100 个英文单词。 API 支持多语言输入,但不支持 emoji 和部分特殊 Unicode 字符。

建议

当通过 files 传入多张参考图时,你可以在 prompt 中使用 [image number] 语法指定引用哪张图(例如:"Use the style of image[1] with colors from image[2]")。

可选参数

model_version: 图像模型版本。可选版本如下;不设置时使用默认版本:

  • flux.1_kontext_pro (default)
  • flux.1_dev(无法与图像文件同时使用;若请求中包含图像文件,将自动升级为默认版本)
  • gpt_4o (gpt-image-1)
  • gpt_image_1.5
  • gpt_image_2
  • midjourney(无法与图像文件同时使用)
  • gemini_2.5_flash_image_preview(也称 nano banana)
  • gemini_3_pro_image_preview(别名:nano banana pro)
  • gemini_3.1_flash_image_preview(别名:nano banana 2)

注意

flux.1_kontext_pro 不支持 WebP 输入图像。

template: 图像模板的 slug,用于应用预设风格包。设置后,系统会将模板的提示词附加到你的 prompt 之前,并将模板图像作为额外参考图合并传入。可选值如下:

模板值说明
asset_extraction将场景元素提取为独立资产,用于 3D 生成。
推荐搭配:Nano Banana 2、图像输入、ar 16:9、Smart Mesh
character_completion补全缺失部位,还原完整角色形象。
推荐搭配:Nano Banana、图像输入
t_pose将角色转换为标准 T-Pose,便于绑定与动画制作。
推荐搭配:Nano Banana、ar 1:1、Smart Mesh
head_extraction提取头部以增强面部细节,用于高保真 3D 生成。
推荐搭配:Nano Banana、ar 1:1、图像输入
3d_enhance增强 3D 结构与细节(2D → 3D)。
推荐搭配:Nano Banana、图像输入
variants基于原始输入生成多个风格一致的变体。
推荐搭配:Nano Banana 2、文本/图像输入
print_clay转换为高对比度粘土风格,适合 3D 打印。
推荐搭配:Nano Banana 2、图像输入、HD 模型
figure将照片转换为风格化手办角色。
推荐搭配:Nano Banana 2、图像输入、HD 模型

file: 指定图像输入。

  • type: 表示文件类型。虽然当前不会严格校验,但强烈建议填写正确的文件类型。
  • file_token: 从上传接口获得的标识,请参考直接上传部分。urlobject 互斥
  • url: 图像的直链 URL。支持 JPEG 和 PNG,最大 20MB。file_tokenobject 互斥
  • object (强烈推荐): 从上传接口获取的对象信息,请参考 Upload in STSurlfile_token 互斥
    • bucket: 通常固定为 tripo-data
    • key: 返回值中的 resource_uri

files: 指定图像输入,为 file 列表。对于 flux.1_kontext_pro 最多可传 4 张;对于 gpt_4ogpt_image_2gemini_2.5_flash_image_preview 最多可传 10 张。

t_pose: bool 值。将对象在保留主要特征的前提下转为 T Pose。默认值为 false

sketch_to_render: bool 值。将草图转换为渲染图。默认值为 false

返回值

task_id: 成功提交任务后的唯一标识。