Unstructured UNS MCP — Установка & Живое демо

Зачем использовать

Ключевые функции

60+ source connectors (S3, Drive, OneDrive, SharePoint, GCS)
Document partitioning into elements (Title, Table, NarrativeText, ListItem)
Built-in chunkers (by_title, basic)
Embeddings via OpenAI, Voyage, or local models
Targets: vector DBs (Pinecone, Weaviate, Qdrant) or warehouses

Живое демо

Как выглядит на практике

unstructured-uns-mcp.replay ▶ готово

0/0

Установка

Выберите клиент

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "unstructured-uns-mcp": {
      "command": "uvx",
      "args": [
        "uns-mcp"
      ]
    }
  }
}

Откройте Claude Desktop → Settings → Developer → Edit Config. Перезапустите после сохранения.

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "unstructured-uns-mcp": {
      "command": "uvx",
      "args": [
        "uns-mcp"
      ]
    }
  }
}

Cursor использует ту же схему mcpServers, что и Claude Desktop. Конфиг проекта приоритетнее глобального.

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "unstructured-uns-mcp": {
      "command": "uvx",
      "args": [
        "uns-mcp"
      ]
    }
  }
}

Щёлкните значок MCP Servers на боковой панели Cline, затем "Edit Configuration".

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "unstructured-uns-mcp": {
      "command": "uvx",
      "args": [
        "uns-mcp"
      ]
    }
  }
}

Тот же формат, что и Claude Desktop. Перезапустите Windsurf для применения.

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "unstructured-uns-mcp",
      "command": "uvx",
      "args": [
        "uns-mcp"
      ]
    }
  ]
}

Continue использует массив объектов серверов, а не map.

~/.config/zed/settings.json

{
  "context_servers": {
    "unstructured-uns-mcp": {
      "command": {
        "path": "uvx",
        "args": [
          "uns-mcp"
        ]
      }
    }
  }
}

Добавьте в context_servers. Zed перезагружается автоматически.

claude mcp add unstructured-uns-mcp -- uvx uns-mcp

Однострочная команда. Проверить: claude mcp list. Удалить: claude mcp remove.

Сценарии использования

Реальные сценарии: Unstructured UNS MCP

Stand up a RAG pipeline from a SharePoint folder to Pinecone

👤 Data engineers / RAG builders ⏱ ~15 min intermediate

Когда использовать: You have a corporate doc dump and want a Claude-queryable index.

Предварительные требования

Server/skill installed and authenticated — See repo README

Поток

Define the pipeline

Create an Unstructured pipeline: source SharePoint folder X, partition by_title with 1024 token max, embed with text-embedding-3-small, target Pinecone index 'corp-docs'.✓ Скопировано

→ Pipeline id
Run and monitor

Run it and tell me when it's done. Report any failed documents.✓ Скопировано

→ Status updates + final summary

Итог: Production-grade ingest with proper chunking — not naive PDF text dumps.

Подводные камни

Default chunkers can split tables across chunks. For dense tabular docs, use 'by_title' with combine_text_under_n_chars. — Default chunkers can split tables across chunks. For dense tabular docs, use 'by_title' with combine_text_under_n_chars.

Сочетать с: filesystem · qdrant-mcp-server

Комбинации

Сочетайте с другими MCP — эффект x10

unstructured-uns-mcp + filesystem

Pair with filesystem for complementary capabilities

Use this server together with filesystem to complete a multi-step task.✓ Скопировано

unstructured-uns-mcp + qdrant-mcp-server

Pair with qdrant-mcp-server for complementary capabilities

Use this server together with qdrant-mcp-server to complete a multi-step task.✓ Скопировано

Инструменты

Что предоставляет этот MCP

Инструмент	Входные данные	Когда вызывать	Стоимость
create_pipeline	source, dest, partition_args, chunk_args	Define a new ingest job	1 API call
run_pipeline	pipeline_id	Execute the pipeline	Per Unstructured plan
list_workflows	(none)	See all configured workflows	1 API call

Стоимость и лимиты

Во что обходится

Квота API: See provider docs for rate limits
Токенов на вызов: Varies by tool
Деньги: See repo README for pricing details
Совет: Cache tool results and avoid repeated identical calls.

Безопасность

Права, секреты, радиус поражения

Хранение учётных данных: Use environment variables; never commit secrets

Исходящий трафик: Tool calls go to the provider's API as documented

Устранение неполадок

Частые ошибки и исправления

401 Unauthorized

Get an API key at unstructured.io → Settings → API keys; set UNSTRUCTURED_API_KEY and UNSTRUCTURED_API_URL.

Проверить: list_workflows returns at least one

source connector auth failure

Connector creds (e.g. SharePoint app token) are configured per-source. Recreate the source via Unstructured UI to refresh.

Проверить: Run a 1-file test pipeline first

Альтернативы

Unstructured UNS MCP в сравнении

Альтернатива	Когда использовать	Компромисс
LlamaIndex / llamacloud	You want a managed RAG-as-a-service product	Higher-level but less control over chunking

Ещё

Ресурсы

📖 Читать официальный README на GitHub

🐙 Открытые задачи

🔍 Все 400+ MCP-серверов и Skills