/ 目录 / 演练场 / MCP Image
● 社区 shinpr 🔑 需要你的密钥

MCP Image

作者 shinpr · shinpr/mcp-image

通过Gemini ( Nano Banana 2/Pro )生成和编辑图像—自动提示优化、4K输出、自然语言编辑、字符一致性。

mcp-image将Google的Gemini图像模型( Nano Banana 2/Nano Banana Pro )包裹在单个“generate_image”工具后面。提供简单的提示;服务器在调用模型之前使用Subject-Context-Style框架丰富它,选择质量层(快速/平衡/质量) ,支持通过自然语言编辑图像,并保持各代人之间的字符一致性。高达4K输出, 1: 1至21: 9宽高比。需要免费的Gemini API密钥。

为什么要用

核心特性

实时演示

实际使用效果

mcp-image.replay ▶ 就绪
0/0

安装

选择你的客户端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "mcp-image": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ],
      "env": {
        "GEMINI_API_KEY": "<from aistudio.google.com/apikey>",
        "IMAGE_OUTPUT_DIR": "/absolute/path/to/images"
      }
    }
  }
}

打开 Claude Desktop → Settings → Developer → Edit Config。保存后重启应用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "mcp-image": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ],
      "env": {
        "GEMINI_API_KEY": "<from aistudio.google.com/apikey>",
        "IMAGE_OUTPUT_DIR": "/absolute/path/to/images"
      }
    }
  }
}

Cursor 使用与 Claude Desktop 相同的 mcpServers 格式。项目级配置优先于全局。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "mcp-image": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ],
      "env": {
        "GEMINI_API_KEY": "<from aistudio.google.com/apikey>",
        "IMAGE_OUTPUT_DIR": "/absolute/path/to/images"
      }
    }
  }
}

点击 Cline 侧栏中的 MCP Servers 图标,然后选 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "mcp-image": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ],
      "env": {
        "GEMINI_API_KEY": "<from aistudio.google.com/apikey>",
        "IMAGE_OUTPUT_DIR": "/absolute/path/to/images"
      }
    }
  }
}

格式与 Claude Desktop 相同。重启 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "mcp-image",
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ]
    }
  ]
}

Continue 使用服务器对象数组,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "mcp-image": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "mcp-image"
        ]
      }
    }
  }
}

加入 context_servers。Zed 保存后热重载。

claude mcp add mcp-image -- npx -y mcp-image

一行命令搞定。用 claude mcp list 验证,claude mcp remove 卸载。

使用场景

实战用法: MCP Image

生成然后迭代着陆页的英雄图片

👤 设计师、创始人、营销人员 ⏱ ~15 min beginner

何时使用: 您想要一个全新的英雄形象,不想兼顾5个选项卡。

前置条件
  • Gemini API密钥 — https://aistudio.google.com/apikey
  • 输出目录 — mkdir -p ~/images/mcp
步骤
  1. 生成v1
    生成英雄形象:最小的工作空间,温暖的黄金时光, 16: 9 ,质量等级, 2048px。✓ 已复制
    → 图像已保存到IMAGE_OUTPUT_DIR ,并回显了丰富的提示
  2. 就地编辑
    编辑它—在地平线上添加一条细线的树木,保留其他一切。✓ 已复制
    → 变体已保存;合成已保留
  3. 变种
    相同的场景但更凉爽的色调,保持主题相同。✓ 已复制
    → 字符一致性保持;颜色偏移

结果: 只需几分钟即可发货的英雄形象,而不是通过Midjourney的付费座位往返行程。

注意事项
  • 过度提示优化器 — 让Subject-Context-Style增强器发挥作用;停止用5行形容词覆盖
搭配使用: filesystem

制作一组品牌一致的插图

👤 没有品牌资产库的独奏创始人和设计师 ⏱ ~45 min intermediate

何时使用: 您需要6–12张看起来像是属于同一个人的插图。

步骤
  1. 定义样式表
    生成风格参考:平面插图、柔和的粉彩调色板、双字晕影。✓ 已复制
    → 种子图片捕捉风格
  2. 创造变化
    使用这种风格,为我们的部分制作6个插图:入门、计费、团队、集成、安全性、分析。✓ 已复制
    → 6张风格一致的图片+字符

结果: 一套有凝聚力的插图集,无需聘请插画师一天。

注意事项
  • 图像之间的漂移 — 始终引用种子图像并使用“保持种子样式”

使用自然语言编辑产品照片

👤 电商运营商、小品牌 ⏱ ~20 min beginner

何时使用: 您有一张原始产品照片,并希望在没有Photoshop的情况下享受英雄般的待遇。

步骤
  1. 上传/参考照片
    使用product.jpg作为基础。去除杂乱的背景;保持阴影;工作室照明。✓ 已复制
    → 用自然阴影拍摄的干净产品
  2. 添加{{context}}
    相同的产品在温暖的大理石表面上,自上而下。✓ 已复制
    → 新环境下一致的产品

结果: 只需几分钟即可获得适合目录的图像。

搭配使用: filesystem

组合

与其他 MCP 搭配,撬动十倍杠杆

mcp-image + filesystem

生成、列出、标记和组织图像库

将今天的集合生成到~/images/mcp/2026-04-21/;然后按替代文本列出并重命名。✓ 已复制
mcp-image + magic-ui-mcp

将生成的英雄图片放入Magic UI登陆

生成英雄图像,然后将其连接到Magic UI英雄组件中。✓ 已复制
mcp-image + comfyui-mcp-server

一次性使用mcp-image ;流水线使用ComfyUI

通过mcp-image的快速变体;通过ComfyUI的生产工作流程。✓ 已复制

工具

此 MCP 暴露的能力

工具输入参数何时调用成本
generate_image prompt: str, tier?: fast|balanced|quality, aspect?: '1:1'|'16:9'|..., base_image?: path, size?: '1K'|'2K'|'4K' 使用自然语言生成新图像或编辑现有图像 1 Gemini image call

成本与限制

运行它的成本

API 配额
受Gemini API计划的图像生成配额限制
每次调用 Token 数
可忽略文本;图像字节占主导地位
费用
通过Gemini API按图像付费;免费会员等级可供开发
提示
仅对最终守门员使用tier = fast进行迭代和tier = quality。

安全

权限、密钥、影响范围

凭据存储: 仅env中的GEMINI_API_KEY —从不提交。如果泄漏,请从Google AI Studio旋转。
数据出站: 提示和可选的基本图像转到Google的Gemini API。生成的字节返回并保存在本地。

故障排查

常见错误与修复

401/API密钥无效

确认GEMINI_API_KEY是来自AI Studio的原始API密钥(不是OAuth令牌) ,并且已启用图像生成。

验证: curl https://generativelanguage.googleapis.com/v1beta/models?key=$GEMINI_API_KEY
输出已保存但为空

IMAGE_OUTPUT_DIR可能不可写或缺失。创建并重试。

验证: touch $IMAGE_OUTPUT_DIR/.probe && rm $IMAGE_OUTPUT_DIR/.probe
代与代之间的性格漂移

始终传递相同的base_image ,并在提示中包含“保持主题相同”。

验证: Diff two generations visually

替代方案

MCP Image 对比其他方案

替代方案何时用它替代权衡
everart您有经过风格训练的Everart模型不同的提供商,不同的风格覆盖范围
comfyui-mcp-server您需要自定义SD/FLUX工作流程和完整的管道控制设置要重得多
higgsfield-ai-prompt-skill您需要为其他提供商提供及时的工程帮助仅提示—无推断

更多

资源

📖 阅读 GitHub 上的官方 README

🐙 查看未解决的 issue

🔍 浏览全部 400+ MCP 服务器和 Skills