Загрузите 200-страничный PDF в Claude как читаемый Markdown
👤 Исследователи, юристы, все, у кого PDF-насыщенные рабочие процессы
⏱ ~15 min
beginner
Когда использовать: Вам нужно обсудить конкретику из PDF, и вы не хотите копировать-вставлять страницы.
Поток
-
Конвертация
Use markitdown. Convert ~/Downloads/whitepaper.pdf to Markdown. Tell me total length and section count.✓ Скопировано
→ Markdown возвращён с итоговым содержанием
-
Обсуждение конкретики
From section 3, what claims do they make about throughput? Quote the exact lines.✓ Скопировано
→ Прямые цитаты с ссылками на разделы
-
Сравнение с другим документом
Now convert competitor.pdf the same way. Compare their throughput claims.✓ Скопировано
→ Таблица утверждений по каждому документу
Итог: Два PDF загружены, сравнены и доступны для цитирования в чате.
Подводные камни
- Сканированные PDF возвращаются пустыми — MarkItDown делает базовый OCR — для PDF только из изображений сначала запустите OCR отдельно
Когда использовать: Статья динамически рендерится или за paywall; вы хотите структурированный вывод, а не сырой HTML.
Поток
-
Загрузка и конвертация
Use markitdown to convert https://example.com/long-article. Strip nav and footer.✓ Скопировано
→ Тело статьи в Markdown
-
Суммирование или цитирование
Give me the core claim and the strongest evidence cited.✓ Скопировано
→ Структурированное резюме
Итог: URL превращён в Markdown, пригодный для рассуждений.
Подводные камни
- Тяжёлые SPA на JS возвращают пустое — Используйте MCP на основе браузера (browser-act, mcp-chrome) для SPA, затем передайте результат в markitdown
Когда использовать: У вас папка Dropbox/SharePoint со смешанными документами, и вы хотите читаемость всех.
Поток
-
Инвентаризация
List ~/docs/ — group by extension. How many PDFs, DOCXs, PPTXs?✓ Скопировано
→ Количество по каждому расширению
-
Конвертация всего
Convert every doc in ~/docs/ to Markdown into ~/docs-md/. Preserve folder structure.✓ Скопировано
→ Зеркальное дерево с .md-файлами
-
Индексирование для поиска
Now give me a single index.md listing each doc's title and 2-line summary.✓ Скопировано
→ Индексный файл базы знаний
Итог: Папка смешанных форматов превращена в однородный Markdown-корпус.