何時使用: 你需要討論 PDF 中的具體內容,但不想複製貼上頁面。
步驟
-
轉換
Use markitdown. Convert ~/Downloads/whitepaper.pdf to Markdown. Tell me total length and section count.✓ 已複製
→ 回傳帶有目錄摘要的 Markdown
-
討論具體內容
From section 3, what claims do they make about throughput? Quote the exact lines.✓ 已複製
→ 帶章節參照的直接引用
-
與另一份文件比較
Now convert competitor.pdf the same way. Compare their throughput claims.✓ 已複製
→ 每份文件的聲明對照表
結果: 兩份 PDF 已讀入、比較,並可在對話中引用。
注意事項
- 掃描的 PDF 輸出為空 — MarkItDown 執行基本 OCR——對於純圖片 PDF,先在上游執行 OCR
何時使用: 文章是動態渲染或有付費牆;你想要結構化輸出,而非原始 HTML。
步驟
-
擷取並轉換
Use markitdown to convert https://example.com/long-article. Strip nav and footer.✓ 已複製
→ Markdown 格式的文章內文
-
摘要或引用
Give me the core claim and the strongest evidence cited.✓ 已複製
→ 結構化摘要
結果: URL 轉換為推理級別的 Markdown。
注意事項
- 重度 JS 的 SPA 回傳空白 — 對 SPA 使用瀏覽器型 MCP(browser-act、mcp-chrome),再導入 markitdown
何時使用: 你有一個包含混合文件的 Dropbox/SharePoint 資料夾,想讓它們全部可讀。
步驟
-
清查
List ~/docs/ — group by extension. How many PDFs, DOCXs, PPTXs?✓ 已複製
→ 按副檔名的數量統計
-
全部轉換
Convert every doc in ~/docs/ to Markdown into ~/docs-md/. Preserve folder structure.✓ 已複製
→ 帶有 .md 檔案的鏡像目錄樹
-
建立索引以供檢索
Now give me a single index.md listing each doc's title and 2-line summary.✓ 已複製
→ 知識庫索引檔案
結果: 混合格式資料夾轉換為同質 Markdown 語料庫。