/ Каталог / Песочница / WebClaw
● Сообщество 0xMassi ⚡ Сразу

WebClaw

автор 0xMassi · 0xMassi/webclaw

Быстрый локальный скрапинг и структурированное извлечение на Rust — получайте очищенный markdown + структурированные поля без отправки URL третьим сторонам.

WebClaw — local-first инструмент для извлечения веб-контента: скрапинг, обход, разбор readability, извлечение структурированных полей — всё в одном бинарнике на Rust. Используйте его, когда страницы не должны проходить через SaaS-скрапер.

Зачем использовать

Ключевые функции

Живое демо

Как выглядит на практике

готово

Установка

Выберите клиент

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Откройте Claude Desktop → Settings → Developer → Edit Config. Перезапустите после сохранения.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Cursor использует ту же схему mcpServers, что и Claude Desktop. Конфиг проекта приоритетнее глобального.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Щёлкните значок MCP Servers на боковой панели Cline, затем "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Тот же формат, что и Claude Desktop. Перезапустите Windsurf для применения.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "webclaw-mcp",
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  ]
}

Continue использует массив объектов серверов, а не map.

~/.config/zed/settings.json
{
  "context_servers": {
    "webclaw-mcp": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "webclaw-mcp"
        ]
      }
    }
  }
}

Добавьте в context_servers. Zed перезагружается автоматически.

claude mcp add webclaw-mcp -- npx -y webclaw-mcp

Однострочная команда. Проверить: claude mcp list. Удалить: claude mcp remove.

Сценарии использования

Реальные сценарии: WebClaw

Скрапить документационный сайт без утечки URL в SaaS

👤 Разработчики ⏱ ~15 min intermediate

Когда использовать: NDA или compliance ограничивает использование SaaS-скраперов.

Поток
  1. Запуск
    webclaw fetch https://internal-docs.corp/x✓ Скопировано
    → Markdown возвращён
  2. Итерация
    Claude уточняет извлечение✓ Скопировано
    → Чистый текст

Итог: Содержимое страницы доступно Claude без стороннего скрапера.

Комбинации

Сочетайте с другими MCP — эффект x10

webclaw-mcp + filesystem

Сохранять извлечённый markdown для последующего RAG

Combine webclaw-mcp with filesystem: Save extracted markdown for downstream RAG✓ Скопировано

Инструменты

Что предоставляет этот MCP

ИнструментВходные данныеКогда вызыватьСтоимость
fetch (см. документацию) Получить URL в виде очищенного markdown 1 вызов
extract (см. документацию) Применить схему для извлечения структурированных полей 1 вызов
crawl (см. документацию) Обойти сайт с ограничением глубины 1 вызов

Стоимость и лимиты

Во что обходится

Квота API
Локальный CPU
Токенов на вызов
Размер страницы
Деньги
Бесплатный OSS
Совет
Используйте --readability; сырой HTML сжигает token'ы

Безопасность

Права, секреты, радиус поражения

Хранение учётных данных: Нет
Исходящий трафик: Куда вы делаете fetch
Никогда не давайте: scrape paywalled / login-required content as agent

Устранение неполадок

Частые ошибки и исправления

Заблокирован сайтом

Попробуйте --respect-robots false только на своих собственных сайтах

Альтернативы

WebClaw в сравнении

АльтернативаКогда использоватьКомпромисс
firecrawl-mcpВам нужен управляемый SaaSСтраницы проходят через Firecrawl

Ещё

Ресурсы

📖 Читать официальный README на GitHub

🐙 Открытые задачи

🔍 Все 400+ MCP-серверов и Skills