/ 目錄 / 演練場 / MCP Image
● 社群 shinpr 🔑 需要你的金鑰

MCP Image

作者 shinpr · shinpr/mcp-image

透過Gemini (Nano Banana 2/Pro)產生和編輯影像—自動提示最佳化、4K輸出、自然語言編輯、字元一致性。

mcp-image將Google的Gemini圖像模型( Nano Banana 2/Nano Banana Pro )包裝在單個「generate_image」工具後面。提供簡單的提示;伺服器在呼叫模型之前,會使用Subject-Context-Style架構豐富它,選擇品質層級(快速/平衡/品質) ,支援透過自然語言編輯影像,並保持各代人之間的字元一致性。高達4K輸出, 1: 1至21: 9長寬比。需要免費的Gemini API金鑰。

為什麼要用

核心特性

即時演示

實際使用效果

mcp-image.replay ▶ 就緒
0/0

安裝

選擇你的客戶端

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "mcp-image": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ],
      "env": {
        "GEMINI_API_KEY": "<from aistudio.google.com/apikey>",
        "IMAGE_OUTPUT_DIR": "/absolute/path/to/images"
      }
    }
  }
}

開啟 Claude Desktop → Settings → Developer → Edit Config。儲存後重啟應用。

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "mcp-image": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ],
      "env": {
        "GEMINI_API_KEY": "<from aistudio.google.com/apikey>",
        "IMAGE_OUTPUT_DIR": "/absolute/path/to/images"
      }
    }
  }
}

Cursor 使用與 Claude Desktop 相同的 mcpServers 格式。專案級設定優先於全域。

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "mcp-image": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ],
      "env": {
        "GEMINI_API_KEY": "<from aistudio.google.com/apikey>",
        "IMAGE_OUTPUT_DIR": "/absolute/path/to/images"
      }
    }
  }
}

點擊 Cline 側欄中的 MCP Servers 圖示,然後選 "Edit Configuration"。

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "mcp-image": {
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ],
      "env": {
        "GEMINI_API_KEY": "<from aistudio.google.com/apikey>",
        "IMAGE_OUTPUT_DIR": "/absolute/path/to/images"
      }
    }
  }
}

格式與 Claude Desktop 相同。重啟 Windsurf 生效。

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "mcp-image",
      "command": "npx",
      "args": [
        "-y",
        "mcp-image"
      ]
    }
  ]
}

Continue 使用伺服器物件陣列,而非映射。

~/.config/zed/settings.json
{
  "context_servers": {
    "mcp-image": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "mcp-image"
        ]
      }
    }
  }
}

加入 context_servers。Zed 儲存後熱重載。

claude mcp add mcp-image -- npx -y mcp-image

一行命令搞定。用 claude mcp list 驗證,claude mcp remove 移除。

使用場景

實戰用法: MCP Image

產生登陸頁面,然後迭代英雄圖片

👤 設計師、創始人、行銷人員 ⏱ ~15 min beginner

何時使用: 你想要一個全新的英雄形象,不想雜耍5個標籤。

前置條件
  • Gemini API金鑰 — https://aistudio.google.com/apikey
  • 輸出目錄 — mkdir -p ~/images/mcp
步驟
  1. 生成v1
    產生英雄形象:最小工作空間、溫暖的黃金時段光線、16: 9、品質層級、2048px。✓ 已複製
    → 圖像已保存到IMAGE_OUTPUT_DIR ,並回應了豐富的提示
  2. 就地編輯
    編輯它—在地平線上添加一條細線的樹木,保留其他一切。✓ 已複製
    → 變體已儲存;組合已保留
  3. 嘗試變體
    相同的場景,但更涼爽的色調,保持主題相同。✓ 已複製
    → 字符一致性保持不變;顏色已移動

結果: 只需幾分鐘即可發送的英雄形象,而非Midjourney的付費座位往返行程。

注意事項
  • 過度提示優化器 — 讓Subject-Context-Style增強器發揮作用;停止使用5行形容詞覆蓋
搭配使用: filesystem

製作一組與品牌一致的插圖

👤 沒有品牌資產庫的獨立創始人和設計師 ⏱ ~45 min intermediate

何時使用: 你需要6到12個插圖,看起來像是屬於一起的插圖。

步驟
  1. 定義樣式表
    產生樣式參考:平面插圖、柔和的粉彩調色板、雙字暈影。✓ 已複製
    → 種子圖像捕捉風格
  2. 建立變化類型
    使用這種風格,為我們的部分製作6個插圖:引導、帳單、團隊、整合、安全性、分析。✓ 已複製
    → 6張風格一致+字元的圖片

結果: 一套有凝聚力的插畫集,無需聘請插畫師一天。

注意事項
  • 影像之間的漂移 — 始終引用種子圖像並使用“保持種子樣式”

使用自然語言編輯產品相片

👤 電子商務營運商、小品牌 ⏱ ~20 min beginner

何時使用: 您有一張原始產品照片,並且希望在不使用 Photoshop 的情況下進行英雄處理。

步驟
  1. 上傳/參考照片
    使用product.jpg 作為基礎。 去除雜亂的背景;保持陰影;工作室照明。✓ 已複製
    → 使用自然陰影拍攝乾淨的產品
  2. 新增上下文
    相同的產品在溫暖的大理石表面上,自上而下。✓ 已複製
    → 與新環境保持一致的產品

結果: 幾分鐘內即可準備好目錄影像。

搭配使用: filesystem

組合

與其他 MCP 搭配,撬動十倍槓桿

mcp-image + filesystem

生成、列出、標記和組織圖像庫

將今天的集合產生到 ~/images/mcp/2026-04-21/;然後透過替代文字列出並重新命名。✓ 已複製
mcp-image + magic-ui-mcp

將生成的英雄圖像放入 Magic UI 登陸中

生成英雄圖像,然後將其連接到 Magic UI 英雄元件。✓ 已複製
mcp-image + comfyui-mcp-server

使用 mcp-image 進行一次性生成;用於管道的 ComfyUI

透過 mcp-image 進行快速變體;透過 ComfyUI 的生產工作流程。✓ 已複製

工具

此 MCP 暴露的能力

工具輸入參數何時呼叫成本
generate_image prompt: str, tier?: fast|balanced|quality, aspect?: '1:1'|'16:9'|..., base_image?: path, size?: '1K'|'2K'|'4K' 使用自然語言產生新圖像或編輯現有圖像 1 Gemini image call

成本與限制

運行它的成本

API 配額
受 Gemini API 計劃的圖像生成配額的約束
每次呼叫 Token 數
文字可以忽略不計;圖像位元組占主導地位
費用
透過 Gemini API 按圖片付費;可用於開發的免費層
提示
對迭代使用 tier=fast,僅對最終的 keeper 使用 tier=quality。

安全

權限、密鑰、影響範圍

憑證儲存: GEMINI_API_KEY 僅在環境中 - 從不提交。 如果洩露,請從 Google AI Studio 輪換。
資料出站: 提示和可選的基本映像將轉到 Google 的 Gemini API。 產生的位元組返回並保存在本地。

故障排查

常見錯誤與修復

401 / API 金鑰無效

確認 GEMINI_API_KEY 是來自 AI Studio 的原始 API 金鑰(不是 OAuth 令牌),並且已啟用映像產生。

驗證: curl https://generativelanguage.googleapis.com/v1beta/models?key=$GEMINI_API_KEY
輸出已儲存但為空

IMAGE_OUTPUT_DIR 可能不可寫或遺失。 創建它並重試。

驗證: touch $IMAGE_OUTPUT_DIR/.probe && rm $IMAGE_OUTPUT_DIR/.probe
性格在代間漂移

始終傳遞相同的基本圖像並在提示中包含“保持主題相同”。

驗證: Diff two generations visually

替代方案

MCP Image 對比其他方案

替代方案何時用它替代權衡
everart您擁有受過風格訓練的 Everart 模特不同的提供者,不同的覆蓋風格
comfyui-mcp-server您需要自訂 SD/FLUX 工作流程和完整的管道控制更重的設定
higgsfield-ai-prompt-skill您需要其他提供者提供及時的工程協助僅提示——無推論

更多

資源

📖 閱讀 GitHub 上的官方 README

🐙 查看未解決的 issue

🔍 瀏覽全部 400+ MCP 伺服器和 Skills