/ Verzeichnis / Playground / Windows MCP
● Community CursorTouch ⚡ Sofort

Windows MCP

von CursorTouch · CursorTouch/Windows-MCP

Computer-Use für Windows — Claude liest den UI-Automation-Baum (nicht nur Pixel), kann also Excel, Outlook und Legacy-LOB-Apps zuverlässig steuern.

Windows MCP stellt die Windows-UI-Automation-API sowie Screenshot- und Input-Synthese als MCP-Tools bereit. Im Gegensatz zu reinem pixel-basiertem Computer-Use gibt es Claude eine strukturierte Ansicht des Desktop-Baums — Fenster, Steuerelemente, Namen, Automation-IDs —, sodass Klicks auch bei verschobenen Layouts auf das richtige Element treffen. Gebaut für die Automatisierung interner Windows-Software, die keine API hat.

Warum nutzen

Hauptfunktionen

Live-Demo

In der Praxis

windows-mcp-cursortouch.replay ▶ bereit
0/0

Installieren

Wählen Sie Ihren Client

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "windows-mcp-cursortouch": {
      "command": "uvx",
      "args": [
        "windows-mcp"
      ]
    }
  }
}

Öffne Claude Desktop → Settings → Developer → Edit Config. Nach dem Speichern neu starten.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "windows-mcp-cursortouch": {
      "command": "uvx",
      "args": [
        "windows-mcp"
      ]
    }
  }
}

Cursor nutzt das gleiche mcpServers-Schema wie Claude Desktop. Projektkonfiguration schlägt die globale.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "windows-mcp-cursortouch": {
      "command": "uvx",
      "args": [
        "windows-mcp"
      ]
    }
  }
}

Klicken Sie auf das MCP-Servers-Symbol in der Cline-Seitenleiste, dann "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "windows-mcp-cursortouch": {
      "command": "uvx",
      "args": [
        "windows-mcp"
      ]
    }
  }
}

Gleiche Struktur wie Claude Desktop. Windsurf neu starten zum Übernehmen.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "windows-mcp-cursortouch",
      "command": "uvx",
      "args": [
        "windows-mcp"
      ]
    }
  ]
}

Continue nutzt ein Array von Serverobjekten statt einer Map.

~/.config/zed/settings.json
{
  "context_servers": {
    "windows-mcp-cursortouch": {
      "command": {
        "path": "uvx",
        "args": [
          "windows-mcp"
        ]
      }
    }
  }
}

In context_servers hinzufügen. Zed lädt beim Speichern neu.

claude mcp add windows-mcp-cursortouch -- uvx windows-mcp

Einzeiler. Prüfen mit claude mcp list. Entfernen mit claude mcp remove.

Anwendungsfälle

Praxisnahe Nutzung: Windows MCP

Eine Windows-only-LOB-App ohne API automatisieren

👤 RPA-Engineers, die UiPath-Lizenzen leid sind ⏱ ~60 min advanced

Wann einsetzen: Ein interner App-Anbieter stellt keine API bereit; Claude soll täglich Daten eingeben.

Voraussetzungen
  • Windows 10/11 mit der Ziel-App installiert — Standard-Installation
  • Python 3.10+ für uvx — winget install Python.Python.3.12
Ablauf
  1. Den UI-Baum inspizieren
    Die App BookingSystem.exe starten, dann den UI-Baum des Hauptfensters ausgeben. Automation-IDs anzeigen.✓ Kopiert
    → Baum zeigt Steuerelemente mit AutomationId — keine namenlosen Schaltflächen
  2. Den Happy Path einmal durchlaufen
    Jetzt: Dialog "New Booking" öffnen, Kunde "Acme Inc" eingeben, Datum 2026-05-12, speichern. Am Ende einen Screenshot machen.✓ Kopiert
    → Buchung gespeichert; Screenshot bestätigt
  3. Verallgemeinern und in Schleife laufen
    /work/bookings.csv lesen. Für jede Zeile den Buchungsablauf wiederholen. Screenshots in /work/runs/ speichern.✓ Kopiert
    → Jede Zeile verarbeitet; Screenshots pro Buchung

Ergebnis: Headless-Automatisierung einer Vendor-App, wiederholbar aus einer CSV-Datei.

Fallstricke
  • App verwendet eigene Steuerelemente (z. B. WinForms ListView ohne AutomationId) — Auf Koordinaten-Klicks an fester Fensterposition zurückfallen; Brüchigkeit dokumentieren
  • Modaler Dialog stiehlt Fokus mitten in der Schleife — Immer aktives Fenster prüfen vor send_keys; abbrechen, wenn unerwartet
Kombinieren mit: filesystem

Daten aus Excel extrahieren ohne Excel-API

👤 Analysten, bei denen die IT COM/Office-API nicht freigibt ⏱ ~15 min intermediate

Wann einsetzen: Excel kann geöffnet werden, aber nicht programmatisch angesprochen.

Ablauf
  1. Die Datei öffnen
    Excel starten, C:\reports\Q2.xlsx öffnen, Tabellenblatt "Sales" fokussieren.✓ Kopiert
    → Fenstertitel zeigt den Dateinamen
  2. Den Bereich kopieren
    A1:D200 markieren, in Zwischenablage kopieren, dann Zwischenablage-Text lesen.✓ Kopiert
    → Tab-getrennte Tabelle zurückgegeben
  3. Als CSV über Filesystem speichern
    In Zeilen parsen und nach /tmp/Q2-sales.csv speichern.✓ Kopiert
    → CSV erstellt

Ergebnis: Excel-Daten als CSV, ohne die COM-API anzusprechen oder Drittanbieter-Pakete zu installieren.

Fallstricke
  • Zwischenablage-Formate variieren je nach Excel-Version — Zuerst CSV versuchen; bei Bedarf auf TSV via Zwischenablage-Varianten zurückfallen
Kombinieren mit: filesystem

Einen Desktop-Bug für einen Kollegen erfassen, während man selbst im Fokus bleibt

👤 Entwickler, die nebenbei Support leisten ⏱ ~5 min beginner

Wann einsetzen: Ein Flake reproduziert sich auf der Windows-Box und man will einen sauberen Screenshot mit Repro-Schritten.

Ablauf
  1. Repro und Erfassen
    Screenshot des aktiven App-Fensters machen. Als bug.png speichern.✓ Kopiert
    → PNG geschrieben
  2. Schritte annotieren
    Die letzten 5 sichtbaren UI-Elemente auflisten, mit denen interagiert wurde — Fenstertitel, Dialog-Labels — zum Einfügen in das Ticket.✓ Kopiert
    → Konkrete elementbasierte Repro-Schritte

Ergebnis: Eng begrenztes Bug-Ticket ohne Alt-Tab.

Fallstricke
  • Screenshot enthält private Informationen — Nur das aktive Fenster beschneiden, nicht den ganzen Desktop
Kombinieren mit: github

Kombinationen

Mit anderen MCPs für 10-fache Wirkung

windows-mcp-cursortouch + filesystem

Desktop-App aus einer CSV-Eingabe steuern

/work/orders.csv lesen. Für jede Zeile durch die Buchungs-App klicken.✓ Kopiert
windows-mcp-cursortouch + github

Desktop-Bug erfassen und Issue öffnen

Aktives Fenster screenshoten, dann ein GitHub-Issue mit dem PNG und Repro-Schritten erstellen.✓ Kopiert

Werkzeuge

Was dieses MCP bereitstellt

WerkzeugEingabenWann aufrufenKosten
list_windows (keine) Ziel-App finden kostenlos
get_ui_tree window_id? Discovery vor dem Klicken kostenlos
click automation_id | x,y Bekanntes Steuerelement klicken kostenlos
type_text text: str Text in fokussiertes Feld eingeben kostenlos
send_keys keys: str (z. B. "ctrl+s") Hotkeys / Modifikatoren kostenlos
screenshot window_id?, region? Visuelle Bestätigung kostenlos
launch_process exe: str Ziel-App starten kostenlos
read_clipboard (keine) Nach dem Kopieren kostenlos

Kosten & Limits

Was der Betrieb kostet

API-Kontingent
Keine — lokale Automatisierung
Tokens pro Aufruf
50–500 (UI-Baum-Dumps können größer sein)
Kosten in €
Kostenloser Open Source
Tipp
Den vollständigen UI-Baum nicht bei jedem Schritt ausgeben — nach window_id eingrenzen

Sicherheit

Rechte, Secrets, Reichweite

Minimale Scopes: Kontrolle der lokalen Desktop-Session
Credential-Speicherung: Keine — aber Claude sieht, was auf dem Bildschirm ist
Datenabfluss: Lokal; nichts verlässt die Maschine, außer wenn auch ein Netzwerk-MCP gewährt wird
Niemals gewähren: Administrator-Account Auto-Launch Remote-Access-Pairing

Fehlerbehebung

Häufige Fehler und Lösungen

Steuerelement nicht per automation_id gefunden

App verwendet dynamische IDs oder keine IDs. get_ui_tree verwenden und nach Name/Rollen-Hierarchie abgleichen

Prüfen: Mit Microsoft inspect.exe prüfen
Klick landet auf falschem Fenster

Immer set_focus auf das Zielfenster aufrufen bevor Klick; aktives Fenster danach prüfen

uvx-Installation schlägt mit wheel-Fehler fehl

Visual C++ Build Tools installieren; einige pywin32-Abhängigkeiten benötigen sie

Alternativen

Windows MCP vs. andere

AlternativeWann stattdessenKompromiss
Anthropic Computer Use (pixel)Plattformübergreifende pixel-basierte Steuerung benötigt wirdWeniger zuverlässig unter Windows als UIA-basiert; anfälliger für Layout-Änderungen
AutoIt / PowerShellSkripten außerhalb eines LLMKeine Agent-Schicht; nur manuelles Scripting
Peekaboo (macOS)macOS statt WindowsAnderes Betriebssystem; nicht austauschbar

Mehr

Ressourcen

📖 Offizielle README auf GitHub lesen

🐙 Offene Issues ansehen

🔍 Alle 400+ MCP-Server und Skills durchsuchen