Quand l'utiliser : Vous devez discuter de détails précis d'un PDF et ne voulez pas copier-coller des pages.
Déroulement
-
Convertir
Use markitdown. Convert ~/Downloads/whitepaper.pdf to Markdown. Tell me total length and section count.✓ Copié
→ Markdown retourné avec résumé de la table des matières
-
Discuter des détails
From section 3, what claims do they make about throughput? Quote the exact lines.✓ Copié
→ Citations directes avec références de section
-
Comparer à un autre document
Now convert competitor.pdf the same way. Compare their throughput claims.✓ Copié
→ Tableau des affirmations par document
Résultat : Deux PDFs ingérés, comparés et citables dans le chat.
Pièges
- Les PDFs scannés sortent vides — MarkItDown fait de l'OCR basique — pour les PDFs image uniquement, lancez l'OCR en amont d'abord
Quand l'utiliser : L'article est rendu dynamiquement ou derrière un paywall ; vous voulez une sortie structurée, pas du HTML brut.
Déroulement
-
Récupérer et convertir
Use markitdown to convert https://example.com/long-article. Strip nav and footer.✓ Copié
→ Corps de l'article en Markdown
-
Résumer ou citer
Give me the core claim and the strongest evidence cited.✓ Copié
→ Résumé structuré
Résultat : URL transformée en Markdown de qualité pour le raisonnement.
Pièges
- Les SPAs JavaScript-intensifs retournent vide — Utilisez un MCP basé navigateur (browser-act, mcp-chrome) pour les SPAs, puis redirigez vers markitdown
Quand l'utiliser : Vous avez un dossier Dropbox/SharePoint de documents mixtes et voulez qu'ils soient tous lisibles.
Déroulement
-
Inventaire
List ~/docs/ — group by extension. How many PDFs, DOCXs, PPTXs?✓ Copié
→ Comptages par extension
-
Tout convertir
Convert every doc in ~/docs/ to Markdown into ~/docs-md/. Preserve folder structure.✓ Copié
→ Arborescence miroir avec fichiers .md
-
Indexer pour la récupération
Now give me a single index.md listing each doc's title and 2-line summary.✓ Copié
→ Fichier index de base de connaissances
Résultat : Dossier multi-formats transformé en corpus Markdown homogène.