使用 Imagen 与 Gemini 图像模型进行文生图创作。
imagen-3.0-generate-001):专业文生图模型,使用 /gemini/v1beta/models/{model}:predict + instances 协议gemini-2.5-flash-image-preview、gemini-3-pro-image-preview):多模态推理 + 图像生成,推荐通过 OpenAI 风格 /v1/images/generations 调用,由网关转换为 generateContent + imageConfigPOST /gemini/v1beta/models/{model}:predict 用于调用 Imagen 系列模型生成图像,支持多种宽高比和批量生成。
aspectRatio 参数控制图像比例:
1:1:正方形(1024x1024)16:9:横向宽屏(1792x1024)9:16:竖向(1024x1792)4:3:传统横向(1536x1152)3:4:传统竖向(1152x1536)sampleCount 参数一次生成多张图片:
sampleCount 最大值取决于模型限制,通常为 4。生成的每张图片都会单独计费。personGeneration 参数控制是否允许生成人物:
allow_adult:允许生成成年人物dont_allow:不允许生成人物negativePrompt 排除不想要的元素:
seed 参数实现可复现的生成结果:
size → aspectRatio(1024x1024 → 1:1,1792x1024 → 16:9,1024x1792 → 9:16)n → sampleCountresponse_format 支持 url 和 b64_jsonprompt:图像描述文本(必填)negativePrompt:负面提示词(可选)aspectRatio:宽高比(默认 1:1)sampleCount:生成数量(默认 1)seed:随机种子(可选)personGeneration:人物生成控制(可选)gemini-2.5-flash-image-preview、gemini-3-pro-image-preview)结合了多模态推理与图像生成能力,推荐通过 OpenAI 兼容接口调用:
openai 官方 SDK,通过配置 base_url 与 api_key 调用网关的 OpenAI 兼容接口:
gemini-2.5-flash-image-preview:快速生成,适合原型验证gemini-3-pro-image-preview:高质量生成,适合生产环境size 或 aspect_ratio 参数控制图像比例:
1:1:正方形(默认)16:9:横向宽屏9:16:竖向generateContent 调用:
请求转换:
/gemini/v1beta/models/{model}:generateContentprompt → contents[].parts[].textsize / aspect_ratio → generationConfig.imageConfig.aspectRatiogenerationConfig.imageConfig.imageSize: "4K"(高保真)inlineData(官方标准格式))UsageMetadata.promptTokenCount 获取)UsageMetadata 中提取文本 tokens,并叠加图像 tokens(1290/张),确保计费准确。| 特性 | Gemini 图像模型 | Imagen 系列 |
|---|---|---|
| 推理能力 | ✅ 支持复杂提示词理解 | ❌ 纯文生图 |
| 图像质量 | 高保真(4K) | 高质量 |
| 宽高比 | 1:1 / 16:9 / 9:16 | 1:1 / 16:9 / 9:16 / 4:3 / 3:4 |
| 批量生成 | ❌ 单张 | ✅ 最多 4 张 |
| 计费模式 | 文本 + 图像 tokens | 仅图像 tokens |
| 推荐场景 | 需要理解复杂语义 | 批量生成、简单提示词 |
gemini-3-pro-image-preview;对于批量生成或简单文生图,使用 imagen-3.0-generate-001 更经济。OpenAI 风格认证(Authorization: Bearer
模型名称
imagen-3.0-generate-001, gemini-2.5-flash-image-preview, gemini-3-pro-image-preview "gemini-3-pro-image-preview"
图像描述文本
4000"A futuristic cityscape at sunset with flying cars, cyberpunk style, highly detailed"
生成图片数量(Imagen 支持 1-4,Gemini 仅支持 1)
1 <= x <= 4图像尺寸
1024x1024, 1792x1024, 1024x1792 "1024x1024"
宽高比(优先级高于 size)
1:1, 16:9, 9:16 "1:1"
响应格式
url, b64_json