/ الدليل / الملعب / MarkItDown MCP
● رسمي microsoft ⚡ فوري

MarkItDown MCP

بواسطة microsoft · microsoft/markitdown

MarkItDown من Microsoft كـ MCP — حوّل PDF وDOCX وPPTX وXLSX والصوت وHTML إلى Markdown نظيف لـ Claude.

MarkItDown هو محوّل مستندات عالمي إلى Markdown من Microsoft، مُحزَّم كخادم MCP. مرّر إليه أي مستند Office أو PDF أو صورة أو ملف صوتي أو ZIP أو EPub أو URL واحصل على Markdown منظّم يمكن لـ Claude التعامل معه. طبقة MCP (markitdown-mcp) حزمة منفصلة في نفس المستودع.

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

markitdown-mcp.replay ▶ جاهز
0/0

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "markitdown-mcp": {
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "markitdown-mcp",
      "command": "uvx",
      "args": [
        "markitdown-mcp"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json
{
  "context_servers": {
    "markitdown-mcp": {
      "command": {
        "path": "uvx",
        "args": [
          "markitdown-mcp"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add markitdown-mcp -- uvx markitdown-mcp

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: MarkItDown MCP

وضع ملف PDF من 200 صفحة أمام Claude كـ Markdown قابل للقراءة

👤 الباحثون والمحامون وكل من لديه سير عمل مكثّفة بـ PDF ⏱ ~15 min beginner

متى تستخدمه: تحتاج إلى مناقشة تفاصيل من PDF ولا تريد لصق الصفحات يدوياً.

الخطوات
  1. التحويل
    Use markitdown. Convert ~/Downloads/whitepaper.pdf to Markdown. Tell me total length and section count.✓ تم النسخ
    → Markdown مُعاد مع ملخص جدول المحتويات
  2. مناقشة التفاصيل
    From section 3, what claims do they make about throughput? Quote the exact lines.✓ تم النسخ
    → اقتباسات مباشرة مع مراجع الأقسام
  3. المقارنة مع مستند آخر
    Now convert competitor.pdf the same way. Compare their throughput claims.✓ تم النسخ
    → جدول ادعاءات لكل مستند

النتيجة: ملفا PDF مستوعبان ومقارنان وقابلان للاقتباس في المحادثة.

المزالق
  • ملفات PDF الممسوحة ضوئياً تخرج فارغة — MarkItDown يُجري OCR أساسياً — لملفات PDF الصورية فقط، شغّل OCR مسبقاً
اجمعها مع: filesystem

تحويل أي URL إلى Markdown نظيف دون استخراج من المتصفح

👤 كل من يريد استيعاب مقالات أو وثائق عبر URL ⏱ ~10 min beginner

متى تستخدمه: المقال مصيَّر ديناميكياً أو محجوب بجدار دفع؛ تريد مخرجات منظّمة لا HTML خام.

الخطوات
  1. جلب وتحويل
    Use markitdown to convert https://example.com/long-article. Strip nav and footer.✓ تم النسخ
    → متن المقال بصيغة Markdown
  2. التلخيص أو الاقتباس
    Give me the core claim and the strongest evidence cited.✓ تم النسخ
    → ملخص منظّم

النتيجة: URL محوَّل إلى Markdown بجودة استدلالية.

المزالق
  • تطبيقات SPA المعتمدة على JS تُعيد مخرجات فارغة — استخدم MCP قائم على المتصفح (browser-act, mcp-chrome) لـ SPAs، ثم مرّره إلى markitdown

تحويل دفعي لمجلد من مستندات Office المختلطة إلى قاعدة معرفة

👤 فرق عمليات المعرفة وفرق الدعم التي تبني مجموعات بيانات داخلية ⏱ ~30 min intermediate

متى تستخدمه: لديك مجلد Dropbox/SharePoint من المستندات المختلطة وتريدها كلها قابلة للقراءة.

الخطوات
  1. الجرد
    List ~/docs/ — group by extension. How many PDFs, DOCXs, PPTXs?✓ تم النسخ
    → أعداد حسب الامتداد
  2. تحويل الكل
    Convert every doc in ~/docs/ to Markdown into ~/docs-md/. Preserve folder structure.✓ تم النسخ
    → شجرة مطابقة بملفات .md
  3. الفهرسة للاسترجاع
    Now give me a single index.md listing each doc's title and 2-line summary.✓ تم النسخ
    → ملف فهرس قاعدة المعرفة

النتيجة: مجلد متعدد التنسيقات محوَّل إلى مجموعة Markdown متجانسة.

اجمعها مع: filesystem

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

markitdown-mcp + filesystem

قراءة الملفات المصدر ثم التحويل الدفعي

List ~/inbox/, convert each via markitdown, save to ~/processed/.✓ تم النسخ
markitdown-mcp + office-word-mcp

تحويل مستند Word إلى Markdown للتعديل ثم العودة

MarkItDown the .docx → edit the .md → use word-mcp to write a new .docx with the edits.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداةالمدخلاتمتى تستدعيهاالتكلفة
convert_to_markdown uri (file:// or http://) أي مستند تريده بصيغة نص 0 (LLM hooks optional, paid)

التكلفة والحدود

تكلفة التشغيل

حصة API
غير متاح — محلي
الرموز لكل استدعاء
متغير — ملفات PDF الكبيرة قد تُنتج عشرات الآلاف من أسطر MD
التكلفة المالية
مجاني (MIT). ربط نماذج LLM/Whisper الاختياري يُفوتَر منفصلاً.
نصيحة
تجاهل الملاحق الكبيرة — حوّل نطاقات الصفحات إذا كان SDK يدعم ذلك لنوع ملفك

الأمان

الصلاحيات والأسرار ونطاق الأثر

الحد الأدنى من الصلاحيات: filesystem-read outbound:url-fetch
تخزين بيانات الاعتماد: لا شيء افتراضياً؛ ربط نماذج LLM يحتاج مفاتيحه الخاصة
نقل البيانات الخارجي: URLهات التي تطلب جلبها؛ نقاط نهاية LLM إذا فُعّل الربط

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

ImportError على تنسيق نادر

MarkItDown له إضافات اختيارية: pip install markitdown[all] لتضمين محللات مثل youtube/azure-docs

أخطاء ترميز على ملفات DOC القديمة

أعد حفظها في Office كـ DOCX قبل التحويل؛ دعم .doc جهد أفضل

الجداول تبدو مضغوطة

MarkItDown يحافظ على هيكل الجدول لكن قد يحتاج Claude إلى موجه صريح للعرض — اطلب وضع جدول HTML

البدائل

MarkItDown MCP مقابل البدائل

البديلمتى تستخدمهاالمقايضة
Docling / Unstructuredتحتاج إلى دقة تخطيط PDF للوثائق العلمية المعقدةاعتمادات أثقل؛ أدق على الجداول
kreuzbergاستخراج نص خالص مع OCR على المستندات الممسوحةهدف تحسين مختلف

المزيد

الموارد

📖 اقرأ ملف README الرسمي على GitHub

🐙 تصفح القضايا المفتوحة

🔍 تصفح أكثر من 400 خادم MCP و Skills