/ Directorio / Playground / WebClaw
● Comunidad 0xMassi ⚡ Instantáneo

WebClaw

por 0xMassi · 0xMassi/webclaw

Scraping local ultrarrápido en Rust y extracción estructurada — obtén una página como markdown limpio + campos estructurados sin enviar la URL a terceros.

WebClaw es un extractor de contenido web local-first: scrape, crawl, parse de legibilidad, extracción de campos estructurados, todo en un solo binario Rust. Úsalo cuando no quieras que las páginas pasen por un scraper SaaS.

Por qué usarlo

Características clave

Demo en vivo

Cómo se ve en la práctica

listo

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "webclaw-mcp": {
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "webclaw-mcp",
      "command": "npx",
      "args": [
        "-y",
        "webclaw-mcp"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json
{
  "context_servers": {
    "webclaw-mcp": {
      "command": {
        "path": "npx",
        "args": [
          "-y",
          "webclaw-mcp"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add webclaw-mcp -- npx -y webclaw-mcp

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: WebClaw

Hacer scraping de un sitio de documentación sin filtrar URLs a un SaaS

👤 Desarrolladores ⏱ ~15 min intermediate

Cuándo usarlo: NDA o cumplimiento limita el uso de scrapers SaaS.

Flujo
  1. Ejecutar
    webclaw fetch https://internal-docs.corp/x✓ Copiado
    → Markdown retornado
  2. Iterar
    Claude refines extraction✓ Copiado
    → Texto limpio

Resultado: Contenido de página disponible para Claude sin scraper de terceros.

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

webclaw-mcp + filesystem

Guardar markdown extraído para RAG posterior

Combine webclaw-mcp with filesystem: Save extracted markdown for downstream RAG✓ Copiado

Herramientas

Lo que expone este MCP

HerramientaEntradasCuándo llamarCoste
fetch (see docs) Obtener una URL como markdown limpio 1 call
extract (see docs) Aplicar un schema para extraer campos estructurados 1 call
crawl (see docs) Recorrer un sitio con límites de profundidad 1 call

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API
CPU local
Tokens por llamada
Del tamaño de una página
Monetario
OSS gratuito
Consejo
Usa --readability; el HTML crudo quema tokens

Seguridad

Permisos, secretos, alcance

Almacenamiento de credenciales: Ninguno
Salida de datos: Donde hagas fetch
No conceder nunca: scrape paywalled / login-required content as agent

Resolución de problemas

Errores comunes y soluciones

Bloqueado por el sitio

Prueba --respect-robots false solo en tus propios sitios

Alternativas

WebClaw vs otros

AlternativaCuándo usarlaContrapartida
firecrawl-mcpQuieres SaaS gestionadoLas páginas pasan por Firecrawl

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills