/ Verzeichnis / Playground / MarkItDown MCP
● Offiziell microsoft ⚡ Sofort

MarkItDown MCP

von microsoft · microsoft/markitdown

Microsofts MarkItDown als MCP — PDF, DOCX, PPTX, XLSX, Audio und HTML in sauberes Markdown für Claude konvertieren.

MarkItDown ist Microsofts universeller Dokument-zu-Markdown-Konverter, als MCP-Server verpackt. Übergib beliebige Office-Dokumente, PDFs, Bilder, Audiodateien, ZIPs, EPubs oder URLs und erhalte strukturiertes Markdown das Claude verarbeiten kann. Das MCP-Layer (markitdown-mcp) ist ein separates Paket im selben Monorepo.

Warum nutzen

Hauptfunktionen

Live-Demo

In der Praxis

markitdown-mcp.replay ▶ bereit
0/0

Installieren

Wählen Sie Ihren Client

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

Öffne Claude Desktop → Settings → Developer → Edit Config. Nach dem Speichern neu starten.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

Cursor nutzt das gleiche mcpServers-Schema wie Claude Desktop. Projektkonfiguration schlägt die globale.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

Klicken Sie auf das MCP-Servers-Symbol in der Cline-Seitenleiste, dann "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

Gleiche Struktur wie Claude Desktop. Windsurf neu starten zum Übernehmen.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "markitdown-mcp",
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  ]
}

Continue nutzt ein Array von Serverobjekten statt einer Map.

~/.config/zed/settings.json
{
  "context_servers": {
    "markitdown-mcp": {
      "command": {
        "path": "uvx",
        "args": [
          "markitdown-mcp"
        ]
      }
    }
  }
}

In context_servers hinzufügen. Zed lädt beim Speichern neu.

claude mcp add markitdown-mcp -- uvx markitdown-mcp

Einzeiler. Prüfen mit claude mcp list. Entfernen mit claude mcp remove.

Anwendungsfälle

Praxisnahe Nutzung: MarkItDown MCP

Ein 200-seitiges PDF als lesbares Markdown vor Claude legen

👤 Forscher, Juristen und alle mit PDF-lastigen Workflows ⏱ ~15 min beginner

Wann einsetzen: Du möchtest Details aus einem PDF besprechen ohne seitenweise copy-pasten zu müssen.

Ablauf
  1. Konvertieren
    Use markitdown. Convert ~/Downloads/whitepaper.pdf to Markdown. Tell me total length and section count.✓ Kopiert
    → Markdown mit Inhaltsverzeichnis-Zusammenfassung zurückgegeben
  2. Spezifisches besprechen
    From section 3, what claims do they make about throughput? Quote the exact lines.✓ Kopiert
    → Direkte Zitate mit Abschnittsreferenzen
  3. Mit anderem Dokument vergleichen
    Now convert competitor.pdf the same way. Compare their throughput claims.✓ Kopiert
    → Pro-Dokument-Tabelle der Behauptungen

Ergebnis: Zwei PDFs eingelesen, verglichen und im Chat zitierbar.

Fallstricke
  • Gescannte PDFs kommen leer heraus — MarkItDown macht einfaches OCR — für bildbasierte PDFs vorher OCR vorgeschaltet laufen lassen
Kombinieren mit: filesystem

Beliebige URL in sauberes Markdown ohne Browser-Scraping konvertieren

👤 Alle, die Artikel oder Dokumente per URL einlesen möchten ⏱ ~10 min beginner

Wann einsetzen: Artikel ist dynamisch gerendert oder hinter einer Paywall; du möchtest strukturierte Ausgabe, kein rohes HTML.

Ablauf
  1. Abrufen und konvertieren
    Use markitdown to convert https://example.com/long-article. Strip nav and footer.✓ Kopiert
    → Artikel-Text in Markdown
  2. Zusammenfassen oder zitieren
    Give me the core claim and the strongest evidence cited.✓ Kopiert
    → Strukturierte Zusammenfassung

Ergebnis: URL in analyse-taugliches Markdown umgewandelt.

Fallstricke
  • JS-lastige SPAs geben leere Ausgabe — Browser-basierten MCP (browser-act, mcp-chrome) für SPAs verwenden, dann an markitdown weiterleiten

Einen Ordner gemischter Office-Dokumente als Wissensbasis batch-konvertieren

👤 Wissensmanagement- und Support-Teams, die interne Korpora aufbauen ⏱ ~30 min intermediate

Wann einsetzen: Du hast einen Dropbox/SharePoint-Ordner mit gemischten Dokumenten und möchtest sie alle lesbar machen.

Ablauf
  1. Inventarisieren
    List ~/docs/ — group by extension. How many PDFs, DOCXs, PPTXs?✓ Kopiert
    → Anzahl pro Erweiterung
  2. Alle konvertieren
    Convert every doc in ~/docs/ to Markdown into ~/docs-md/. Preserve folder structure.✓ Kopiert
    → Gespiegelte Verzeichnisstruktur mit .md-Dateien
  3. Für Abruf indexieren
    Now give me a single index.md listing each doc's title and 2-line summary.✓ Kopiert
    → Wissensbasis-Indexdatei

Ergebnis: Gemischt-format Ordner in homogenes Markdown-Korpus umgewandelt.

Kombinieren mit: filesystem

Kombinationen

Mit anderen MCPs für 10-fache Wirkung

markitdown-mcp + filesystem

Quelldateien lesen dann in Batch konvertieren

markitdown-mcp + office-word-mcp

Word-Dokument zu Markdown konvertieren für Bearbeitung dann zurückkonvertieren

Werkzeuge

Was dieses MCP bereitstellt

WerkzeugEingabenWann aufrufenKosten
convert_to_markdown uri (file:// or http://) Beliebiges Dokument das als Text benötigt wird 0 (LLM-Hooks optional, kostenpflichtig)

Kosten & Limits

Was der Betrieb kostet

API-Kontingent
Nicht zutreffend — lokal
Tokens pro Aufruf
Variabel — große PDFs können zehntausende Markdown-Zeilen ergeben
Kosten in €
Kostenlos (MIT). Optionale LLM/Whisper-Hooks werden separat berechnet.
Tipp
Große Anhänge überspringen — Seitenbereiche konvertieren wenn das SDK es für deinen Dateityp unterstützt

Sicherheit

Rechte, Secrets, Reichweite

Minimale Scopes: filesystem-read outbound:url-fetch
Credential-Speicherung: Standardmäßig keine; LLM-Hooks brauchen eigene Keys
Datenabfluss: URLs die abgerufen werden sollen; LLM-Endpunkte wenn Hooks aktiviert

Fehlerbehebung

Häufige Fehler und Lösungen

ImportError bei seltenen Formaten

MarkItDown hat optionale Extras: pip install markitdown[all] um Parser wie youtube/azure-docs einzuschließen

Kodierungsfehler bei alten DOC-Dateien

In Office als DOCX neu speichern vor der Konvertierung; .doc-Unterstützung ist Best-Effort

Tabellen sehen gequetscht aus

MarkItDown erhält die Tabellenstruktur aber Claude braucht eventuell expliziten Prompt zum Rendern — nach HTML-Tabellenmodus fragen

Alternativen

MarkItDown MCP vs. andere

AlternativeWann stattdessenKompromiss
Docling / UnstructuredDu brauchst PDF-Layout-Treue für komplexe wissenschaftliche DokumenteSchwerere Abhängigkeiten; genauer bei Tabellen
kreuzbergReine Textextraktion mit OCR bei gescannten DokumentenAnderes Optimierungsziel

Mehr

Ressourcen

📖 Offizielle README auf GitHub lesen

🐙 Offene Issues ansehen

🔍 Alle 400+ MCP-Server und Skills durchsuchen