Skip to main content
kapon 支持以下 Gemini 图像生成模型:
模型最大分辨率特点
gemini-3-pro-image-preview4K高质量,支持复杂提示词理解和参考图编辑
gemini-2.5-flash-image1K快速生成,低延迟,适合原型验证

选择调用方式

根据您的使用场景和技术偏好,选择合适的 API 调用方式:

快速对比

特性OpenAI 兼容接口Gemini 原生 API
学习成本低(兼容 OpenAI SDK)
文生图
参考图编辑
多参考图融合✅ 最多 14 张✅ 最多 15 张
自动分辨率推断

模型对比

模型最大分辨率推荐场景
gemini-3-pro-image-preview4K (4096×4096)复杂提示词、参考图编辑、高质量生产
gemini-2.5-flash-image1K (1024×1024)快速原型验证、低延迟场景
对于需要理解复杂语义或进行风格迁移的场景,优先使用 gemini-3-pro-image-preview

分辨率与宽高比

Gemini 2.5 Flash 图片

gemini-2.5-flash-image 为单档位 1K 输出,不同宽高比对应的典型分辨率如下(单张固定约 1K image tokens):
宽高比分辨率令牌
1:11024x10241290
2:3832x12481290
3:21248x8321290
3:4864x11841290
4:31184x8641290
4:5896x11521290
5:41152x8961290
9:16768x13441290
16:91344x7681290
21:91536x6721290

Gemini 3 Pro Image 预览版

gemini-3-pro-image-preview 支持 1K / 2K / 4K 三个分辨率档位,不同宽高比对应的典型分辨率如下(仅展示上游当前公开栅格,实际可能随官方更新而调整):
宽高比1K 分辨率1,000 个令牌2K 分辨率2,000 个令牌4K 分辨率4,000 个令牌
1:11024x102412102048x204812104096x40962000
2:3848x126412101696x252812103392x50562000
3:21264x84812102528x169612105056x33922000
3:4896x120012101792x240012103584x48002000
4:31200x89612102400x179212104800x35842000
4:5928x115212101856x230412103712x46082000
5:41152x92812102304x185612104608x37122000
9:16768x137612101536x275212103072x55042000
16:91376x76812102752x153612105504x30722000
21:91584x67212103168x134412106336x26882000

计费说明

计费项说明
文本输入按提示词 tokens 数量计费
图像输出按上游 image tokens 计费(不同模型 / 分辨率档位的 image tokens 见上表;未提供细分时,网关会按统一的每张图片 image tokens 近似折算)
kapon 会自动从响应中提取 token 使用量并计费,无需手动处理。