/ Directorio / Playground / browser-act skills
● Comunidad browser-act ⚡ Instantáneo

browser-act skills

por browser-act · browser-act/skills

Navega, haz scraping y extrae datos estructurados de sitios complejos — más rápido y barato que manejar un navegador headless completo.

browser-act es una skill de Claude para automatización web que prioriza la extracción estructurada sobre los bucles de captura-y-analiza. Visita páginas, navega flujos y extrae datos tipados con selectores explícitos o prompts guiados por esquema. Funciona en sitios con mucho JavaScript donde las obtenciones al estilo DDG no devuelven nada, pero más barato que un MCP completo de Playwright para muchas tareas.

Por qué usarlo

Características clave

Demo en vivo

Cómo se ve en la práctica

listo

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "browser-act-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ],
      "_inferred": true
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "browser-act-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ],
      "_inferred": true
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "browser-act-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ],
      "_inferred": true
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "browser-act-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ],
      "_inferred": true
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "browser-act-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json
{
  "context_servers": {
    "browser-act-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/browser-act/skills",
          "~/.claude/skills/browser-act"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add browser-act-skill -- git clone https://github.com/browser-act/skills ~/.claude/skills/browser-act

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: browser-act skills

Extraer una lista tipada de una SPA con mucho JavaScript

👤 Devs que necesitan datos puntuales de sitios sin APIs ⏱ ~25 min intermediate

Cuándo usarlo: El sitio renderiza los datos que necesitas solo después de que JavaScript se ejecuta; la obtención simple no devuelve nada.

Requisitos previos
  • Skill instalada — git clone https://github.com/browser-act/skills ~/.claude/skills/browser-act
Flujo
  1. Definir el esquema
    Use browser-act. Schema: items[]{title:str, price:number, available:bool}.✓ Copiado
    → Esquema aceptado
  2. Visitar y extraer
    Open <url>; wait for the product grid; extract matching the schema.✓ Copiado
    → Lista JSON tipada
  3. Verificar valores atípicos
    Spot-check 3 random rows by re-fetching their detail page; check parsing is correct.✓ Copiado
    → Las verificaciones pasan; o encuentras un bug de parseo que corregir

Resultado: Datos tipados fiables; sin clic manual.

Errores comunes
  • El sitio detecta bots y bloquea después de 50 solicitudes — Baja la concurrencia; rota el UA; respeta robots.txt o descarta la tarea
Combinar con: filesystem

Navegar un formulario de múltiples pasos para llegar a los datos detrás de él

👤 Devs haciendo scraping de datos detrás de login o asistentes ⏱ ~40 min intermediate

Cuándo usarlo: Conjunto de datos público oculto detrás de un flujo 'selecciona país → selecciona año → clic ver'.

Flujo
  1. Planificar el flujo
    Use browser-act. Steps: pick country=US, year=2025, click 'View'. Then extract the table.✓ Copiado
    → Plan de flujo aceptado
  2. Ejecutar
    Run the flow for 50 country/year combinations.✓ Copiado
    → Filas tipadas para las 50 combinaciones
  3. Persistir
    Write each combo to /data/<country>-<year>.json.✓ Copiado
    → Archivos en /data/

Resultado: Datos masivos detrás de UIs de clics sin trabajo manual.

Errores comunes
  • El flujo se rompe cuando el sitio añade un paso o renombra un botón — La skill lo detecta y hace pausa; vuelves a grabar el flujo una vez, no 50 veces
Combinar con: filesystem

Monitorear una página en busca de cambios y alertar

👤 Cualquiera que vigila una página de estado / rastreador de disponibilidad ⏱ ~15 min beginner

Cuándo usarlo: Quieres saber cuándo se abre un turno, baja un precio o se actualiza un documento.

Flujo
  1. Definir el watch
    Use browser-act. Watch <url> selector '.availability-banner' every 10 minutes. Alert if text changes.✓ Copiado
    → Watch activo
  2. Definir la ruta de alerta
    Alert via: write to ~/inbox/alerts.txt + notify webhook https://<my-webhook>.✓ Copiado
    → Al cambiar, ambos se disparan

Resultado: Monitoreo automático de una señal específica.

Errores comunes
  • Vigilar demasiado agresivamente = bloqueado — Mantén intervalos de ≥5 min en la mayoría de sitios; respeta los errores 429

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

browser-act-skill + filesystem

Persistir datos raspados en rutas estructuradas

Save extraction outputs to /data/<source>/<date>.json with provenance metadata.✓ Copiado
browser-act-skill + duckduckgo-mcp

Encontrar páginas primero mediante búsqueda, luego extraer lo estructurado

Search via duckduckgo-mcp for the data source; pass the URL into browser-act for typed extraction.✓ Copiado

Herramientas

Lo que expone este MCP

HerramientaEntradasCuándo llamarCoste
extract_typed url, schema, wait_for? Extraer datos estructurados de una página Browser run + LLM tokens
run_flow steps[], schema? Navegación de múltiples pasos Multi-step browser cost
watch url, selector, interval, action Detección de cambios de larga duración Per-poll cost
screenshot url, full_page? Depuración visual Browser run

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API
Depende del proveedor; algunos flujos son gratuitos con el navegador incluido
Tokens por llamada
La extracción guiada por esquema es más barata que la captura de pantalla sin dirección
Monetario
Skill gratuita; tokens LLM para la extracción
Consejo
Siempre pasa un esquema — la extracción sin dirección desperdicia tokens en ruido

Seguridad

Permisos, secretos, alcance

Ámbitos mínimos: Outbound HTTPS
Almacenamiento de credenciales: Si inicias sesión en un sitio, usa secretos mediante variables de entorno; rótalos después de scrapes puntuales
Salida de datos: Sitios destino + proveedor LLM
No conceder nunca: Tokens de inicio de sesión persistentes almacenados en el workspace de la skill

Resolución de problemas

Errores comunes y soluciones

La extracción devuelve vacío

Espera más tiempo el selector; el sitio puede cargar datos después de un retraso o via XHR tras un clic

Verificar: Use screenshot tool to verify page state
El sitio detecta bots

Baja la concurrencia; rota el UA; considera si el sitio permite el scraping

Discrepancia de esquema

Relaja los tipos (string vs number); el sitio puede usar formato que rompe los tipos estrictos

El watch se dispara repetidamente por cambios cosméticos

Ajusta el selector más fino; o cambia a diff basado en texto en lugar de diff HTML

Alternativas

browser-act skills vs otros

AlternativaCuándo usarlaContrapartida
Playwright MCP / chrome-devtools-mcpNecesitas control completo del navegador con todas las funciones de DevToolsMás pesado; más caro por llamada
Firecrawl MCPRastreo de todo el sitio, no extracción tipada por páginaForma diferente; de pago para volúmenes serios
duckduckgo-mcp fetch_contentLa página es HTML simple; no se necesita JSNo funcionará en SPAs

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills