/ Directorio / Playground / MarkItDown MCP
● Oficial microsoft ⚡ Instantáneo

MarkItDown MCP

por microsoft · microsoft/markitdown

MarkItDown de Microsoft como MCP — convierte PDF, DOCX, PPTX, XLSX, audio y HTML a Markdown limpio para que Claude pueda leerlos.

MarkItDown es el conversor universal de documentos a Markdown de Microsoft, empaquetado como servidor MCP. Pásale cualquier documento de Office, PDF, imagen, archivo de audio, ZIP, EPub o URL y obtendrás Markdown estructurado sobre el que Claude puede razonar. La capa MCP (markitdown-mcp) es un paquete separado en el mismo monorepo.

Por qué usarlo

Características clave

Demo en vivo

Cómo se ve en la práctica

markitdown-mcp.replay ▶ listo
0/0

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "markitdown-mcp",
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json
{
  "context_servers": {
    "markitdown-mcp": {
      "command": {
        "path": "uvx",
        "args": [
          "markitdown-mcp"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add markitdown-mcp -- uvx markitdown-mcp

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: MarkItDown MCP

Poner un PDF de 200 páginas frente a Claude como Markdown legible

👤 Investigadores, abogados y cualquiera con flujos de trabajo pesados en PDF ⏱ ~15 min beginner

Cuándo usarlo: Necesitas discutir detalles específicos de un PDF y no quieres copiar y pegar páginas.

Flujo
  1. Convertir
    Usa markitdown. Convierte ~/Downloads/whitepaper.pdf a Markdown. Dime la longitud total y el número de secciones.✓ Copiado
    → Markdown devuelto con resumen de TOC
  2. Discutir detalles específicos
    De la sección 3, ¿qué afirmaciones hacen sobre el rendimiento? Cita las líneas exactas.✓ Copiado
    → Citas directas con referencias de sección
  3. Comparar con otro documento
    Ahora convierte competitor.pdf de la misma manera. Compara sus afirmaciones de rendimiento.✓ Copiado
    → Tabla comparativa de afirmaciones por documento

Resultado: Dos PDFs ingeridos, comparados y citables en el chat.

Errores comunes
  • Los PDFs escaneados salen vacíos — MarkItDown hace OCR básico — para PDFs solo de imagen, ejecuta OCR upstream primero
Combinar con: filesystem

Convertir cualquier URL a Markdown limpio sin scraping del navegador

👤 Cualquiera que quiera ingerir artículos o documentación por URL ⏱ ~10 min beginner

Cuándo usarlo: El artículo se renderiza dinámicamente o está detrás de un paywall; quieres salida estructurada, no HTML crudo.

Flujo
  1. Obtener y convertir
    Usa markitdown para convertir https://example.com/long-article. Elimina nav y footer.✓ Copiado
    → Cuerpo del artículo en Markdown
  2. Resumir o citar
    Dame la afirmación central y la evidencia más sólida citada.✓ Copiado
    → Resumen estructurado

Resultado: URL convertida a Markdown apto para razonamiento.

Errores comunes
  • Los SPAs con mucho JavaScript devuelven contenido vacío — Usa un MCP basado en navegador (browser-act, mcp-chrome) para SPAs, luego pasa el resultado a markitdown

Convertir en lote una carpeta de documentos de Office mixtos a una base de conocimiento

👤 Equipos de gestión del conocimiento y soporte que construyen corpus internos ⏱ ~30 min intermediate

Cuándo usarlo: Tienes una carpeta de Dropbox/SharePoint con documentos mixtos y quieres que todos sean legibles.

Flujo
  1. Inventariar
    Lista ~/docs/ — agrupa por extensión. ¿Cuántos PDFs, DOCXs, PPTXs hay?✓ Copiado
    → Conteos por extensión
  2. Convertir todo
    Convierte cada documento en ~/docs/ a Markdown en ~/docs-md/. Preserva la estructura de carpetas.✓ Copiado
    → Árbol espejo con archivos .md
  3. Indexar para recuperación
    Ahora dame un único index.md listando el título y un resumen de 2 líneas de cada documento.✓ Copiado
    → Archivo de índice de base de conocimiento

Resultado: Carpeta de formatos mixtos convertida en un corpus Markdown homogéneo.

Combinar con: filesystem

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

markitdown-mcp + filesystem

Leer archivos fuente y luego convertir en lote

markitdown-mcp + office-word-mcp

Convertir documento Word a Markdown para editar y luego convertir de vuelta

Herramientas

Lo que expone este MCP

HerramientaEntradasCuándo llamarCoste
convert_to_markdown uri (file:// or http://) Cualquier documento que quieras como texto 0 (hooks LLM opcionales, de pago)

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API
N/A — local
Tokens por llamada
Variable — PDFs grandes pueden generar decenas de miles de líneas de MD
Monetario
Gratuito (MIT). Hooks LLM/Whisper opcionales se facturan por separado.
Consejo
Omite apéndices grandes — convierte rangos de páginas si el SDK lo soporta para tu tipo de archivo

Seguridad

Permisos, secretos, alcance

Ámbitos mínimos: filesystem-read outbound:url-fetch
Almacenamiento de credenciales: Ninguno por defecto; los hooks LLM necesitan sus propias claves
Salida de datos: Las URLs que le pidas obtener; endpoints LLM si los hooks están habilitados

Resolución de problemas

Errores comunes y soluciones

ImportError con formato poco común

MarkItDown tiene extras opcionales: pip install markitdown[all] para incluir parsers como youtube/azure-docs

Errores de codificación en DOCs antiguos

Vuelve a guardar en Office como DOCX antes de convertir; el soporte de .doc es por mejor esfuerzo

Las tablas aparecen aplastadas

MarkItDown preserva la estructura de tabla pero Claude puede necesitar un prompt explícito para renderizarla — pide el modo de tabla HTML

Alternativas

MarkItDown MCP vs otros

AlternativaCuándo usarlaContrapartida
Docling / UnstructuredNecesitas fidelidad de layout de PDF para documentos científicos complejosDependencias más pesadas; más preciso con tablas
kreuzbergExtracción de texto puro con OCR en documentos escaneadosObjetivo de optimización diferente

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills