Cuándo usarlo: Necesitas discutir detalles específicos de un PDF y no quieres copiar y pegar páginas.
Flujo
-
Convertir
Usa markitdown. Convierte ~/Downloads/whitepaper.pdf a Markdown. Dime la longitud total y el número de secciones.✓ Copiado
→ Markdown devuelto con resumen de TOC
-
Discutir detalles específicos
De la sección 3, ¿qué afirmaciones hacen sobre el rendimiento? Cita las líneas exactas.✓ Copiado
→ Citas directas con referencias de sección
-
Comparar con otro documento
Ahora convierte competitor.pdf de la misma manera. Compara sus afirmaciones de rendimiento.✓ Copiado
→ Tabla comparativa de afirmaciones por documento
Resultado: Dos PDFs ingeridos, comparados y citables en el chat.
Errores comunes
- Los PDFs escaneados salen vacíos — MarkItDown hace OCR básico — para PDFs solo de imagen, ejecuta OCR upstream primero
Cuándo usarlo: El artículo se renderiza dinámicamente o está detrás de un paywall; quieres salida estructurada, no HTML crudo.
Flujo
-
Obtener y convertir
Usa markitdown para convertir https://example.com/long-article. Elimina nav y footer.✓ Copiado
→ Cuerpo del artículo en Markdown
-
Resumir o citar
Dame la afirmación central y la evidencia más sólida citada.✓ Copiado
→ Resumen estructurado
Resultado: URL convertida a Markdown apto para razonamiento.
Errores comunes
- Los SPAs con mucho JavaScript devuelven contenido vacío — Usa un MCP basado en navegador (browser-act, mcp-chrome) para SPAs, luego pasa el resultado a markitdown
Cuándo usarlo: Tienes una carpeta de Dropbox/SharePoint con documentos mixtos y quieres que todos sean legibles.
Flujo
-
Inventariar
Lista ~/docs/ — agrupa por extensión. ¿Cuántos PDFs, DOCXs, PPTXs hay?✓ Copiado
→ Conteos por extensión
-
Convertir todo
Convierte cada documento en ~/docs/ a Markdown en ~/docs-md/. Preserva la estructura de carpetas.✓ Copiado
→ Árbol espejo con archivos .md
-
Indexar para recuperación
Ahora dame un único index.md listando el título y un resumen de 2 líneas de cada documento.✓ Copiado
→ Archivo de índice de base de conocimiento
Resultado: Carpeta de formatos mixtos convertida en un corpus Markdown homogéneo.