/ Verzeichnis / Playground / WebClaw
● Community 0xMassi ⚡ Sofort

WebClaw

von 0xMassi · 0xMassi/webclaw

Rust-schnelles lokales Scraping und strukturierte Extraktion — eine Seite laden, bereinigtes Markdown und strukturierte Felder zurückbekommen, ohne die URL an Dritte zu senden.

WebClaw ist ein local-first Web-Content-Extraktor: scrapen, crawlen, Readability-Parsing, strukturierte Felder extrahieren — alles in einem einzigen Rust-Binary. Verwenden, wenn Seiten nicht durch einen SaaS-Scraper gehen sollen.

Warum nutzen

Hauptfunktionen

Live-Demo

In der Praxis

bereit

Installieren

Wählen Sie Ihren Client

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Öffne Claude Desktop → Settings → Developer → Edit Config. Nach dem Speichern neu starten.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Cursor nutzt das gleiche mcpServers-Schema wie Claude Desktop. Projektkonfiguration schlägt die globale.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Klicken Sie auf das MCP-Servers-Symbol in der Cline-Seitenleiste, dann "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Gleiche Struktur wie Claude Desktop. Windsurf neu starten zum Übernehmen.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "webclaw-mcp",
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  ]
}

Continue nutzt ein Array von Serverobjekten statt einer Map.

~/.config/zed/settings.json
{
  "context_servers": {
    "webclaw-mcp": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "webclaw-mcp"
        ]
      }
    }
  }
}

In context_servers hinzufügen. Zed lädt beim Speichern neu.

claude mcp add webclaw-mcp -- npx -y webclaw-mcp

Einzeiler. Prüfen mit claude mcp list. Entfernen mit claude mcp remove.

Anwendungsfälle

Praxisnahe Nutzung: WebClaw

Eine Doku-Seite scrapen ohne URLs an einen SaaS zu leaken

👤 Entwickler ⏱ ~15 min intermediate

Wann einsetzen: NDA oder Compliance schränkt SaaS-Scraper ein.

Ablauf
  1. Ausführen
    webclaw fetch https://internal-docs.corp/x✓ Kopiert
    → Markdown zurückgegeben
  2. Iterieren
    Claude verfeinert die Extraktion✓ Kopiert
    → Sauberer Text

Ergebnis: Seiteninhalt für Claude verfügbar ohne Drittanbieter-Scraper.

Kombinationen

Mit anderen MCPs für 10-fache Wirkung

webclaw-mcp + filesystem

Extrahiertes Markdown für nachgelagerte RAG-Pipelines speichern

Combine webclaw-mcp with filesystem: Save extracted markdown for downstream RAG✓ Kopiert

Werkzeuge

Was dieses MCP bereitstellt

WerkzeugEingabenWann aufrufenKosten
fetch (see docs) Eine URL als bereinigtes Markdown holen 1 call
extract (see docs) Ein Schema anwenden, um strukturierte Felder zu extrahieren 1 call
crawl (see docs) Eine Seite mit Tiefenbegrenzung durchlaufen 1 call

Kosten & Limits

Was der Betrieb kostet

API-Kontingent
Lokale CPU
Tokens pro Aufruf
Seitengröße
Kosten in €
Kostenlos (OSS)
Tipp
--readability verwenden; roher HTML verbraucht Tokens

Sicherheit

Rechte, Secrets, Reichweite

Credential-Speicherung: Keine
Datenabfluss: Wohin auch immer du fetchst
Niemals gewähren: scrape paywalled / login-required content as agent

Fehlerbehebung

Häufige Fehler und Lösungen

Durch Seite blockiert

--respect-robots false nur auf eigenen Seiten versuchen

Alternativen

WebClaw vs. andere

AlternativeWann stattdessenKompromiss
firecrawl-mcpDu möchtest verwalteten SaaSSeiten gehen durch Firecrawl

Mehr

Ressourcen

📖 Offizielle README auf GitHub lesen

🐙 Offene Issues ansehen

🔍 Alle 400+ MCP-Server und Skills durchsuchen