browser-act skills — Casos de uso, Instalar & Demo en vivo

Name: browser-act skills (Claude Skill)
Author: browser-act

Por qué usarlo

Características clave

Extracción guiada por esquema — pasa un JSON Schema, obtén datos coincidentes
Más rápido y barato que los bucles de captura de pantalla + LLM
Flujos de múltiples pasos (rellenar formulario → clic → raspar resultado)
Valores por defecto sensatos: con límite de tasa, reintentos, UA cortés
Mayor fiabilidad en SPAs del mundo real

Demo en vivo

Cómo se ve en la práctica

listo

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "browser-act-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ],
      "_inferred": true
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "browser-act-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ],
      "_inferred": true
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "browser-act-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ],
      "_inferred": true
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "browser-act-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ],
      "_inferred": true
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "browser-act-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/browser-act/skills",
        "~/.claude/skills/browser-act"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json

{
  "context_servers": {
    "browser-act-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/browser-act/skills",
          "~/.claude/skills/browser-act"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add browser-act-skill -- git clone https://github.com/browser-act/skills ~/.claude/skills/browser-act

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: browser-act skills

Extraer una lista tipada de una SPA con mucho JavaScript

👤 Devs que necesitan datos puntuales de sitios sin APIs ⏱ ~25 min intermediate

Cuándo usarlo: El sitio renderiza los datos que necesitas solo después de que JavaScript se ejecuta; la obtención simple no devuelve nada.

Requisitos previos

Skill instalada — git clone https://github.com/browser-act/skills ~/.claude/skills/browser-act

Flujo

Definir el esquema

Use browser-act. Schema: items[]{title:str, price:number, available:bool}.✓ Copiado

→ Esquema aceptado
Visitar y extraer

Open <url>; wait for the product grid; extract matching the schema.✓ Copiado

→ Lista JSON tipada
Verificar valores atípicos

Spot-check 3 random rows by re-fetching their detail page; check parsing is correct.✓ Copiado

→ Las verificaciones pasan; o encuentras un bug de parseo que corregir

Resultado: Datos tipados fiables; sin clic manual.

Errores comunes

El sitio detecta bots y bloquea después de 50 solicitudes — Baja la concurrencia; rota el UA; respeta robots.txt o descarta la tarea

Combinar con: filesystem

Navegar un formulario de múltiples pasos para llegar a los datos detrás de él

👤 Devs haciendo scraping de datos detrás de login o asistentes ⏱ ~40 min intermediate

Cuándo usarlo: Conjunto de datos público oculto detrás de un flujo 'selecciona país → selecciona año → clic ver'.

Flujo

Planificar el flujo

Use browser-act. Steps: pick country=US, year=2025, click 'View'. Then extract the table.✓ Copiado

→ Plan de flujo aceptado
Ejecutar

Run the flow for 50 country/year combinations.✓ Copiado

→ Filas tipadas para las 50 combinaciones
Persistir

Write each combo to /data/<country>-<year>.json.✓ Copiado

→ Archivos en /data/

Resultado: Datos masivos detrás de UIs de clics sin trabajo manual.

Errores comunes

El flujo se rompe cuando el sitio añade un paso o renombra un botón — La skill lo detecta y hace pausa; vuelves a grabar el flujo una vez, no 50 veces

Combinar con: filesystem

Monitorear una página en busca de cambios y alertar

👤 Cualquiera que vigila una página de estado / rastreador de disponibilidad ⏱ ~15 min beginner

Cuándo usarlo: Quieres saber cuándo se abre un turno, baja un precio o se actualiza un documento.

Flujo

Definir el watch

Use browser-act. Watch <url> selector '.availability-banner' every 10 minutes. Alert if text changes.✓ Copiado

→ Watch activo
Definir la ruta de alerta

Alert via: write to ~/inbox/alerts.txt + notify webhook https://<my-webhook>.✓ Copiado

→ Al cambiar, ambos se disparan

Resultado: Monitoreo automático de una señal específica.

Errores comunes

Vigilar demasiado agresivamente = bloqueado — Mantén intervalos de ≥5 min en la mayoría de sitios; respeta los errores 429

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

browser-act-skill + filesystem

Persistir datos raspados en rutas estructuradas

Save extraction outputs to /data/<source>/<date>.json with provenance metadata.✓ Copiado

browser-act-skill + duckduckgo-mcp

Encontrar páginas primero mediante búsqueda, luego extraer lo estructurado

Search via duckduckgo-mcp for the data source; pass the URL into browser-act for typed extraction.✓ Copiado

Herramientas

Lo que expone este MCP

Herramienta	Entradas	Cuándo llamar	Coste
extract_typed	url, schema, wait_for?	Extraer datos estructurados de una página	Browser run + LLM tokens
run_flow	steps[], schema?	Navegación de múltiples pasos	Multi-step browser cost
watch	url, selector, interval, action	Detección de cambios de larga duración	Per-poll cost
screenshot	url, full_page?	Depuración visual	Browser run

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API: Depende del proveedor; algunos flujos son gratuitos con el navegador incluido
Tokens por llamada: La extracción guiada por esquema es más barata que la captura de pantalla sin dirección
Monetario: Skill gratuita; tokens LLM para la extracción
Consejo: Siempre pasa un esquema — la extracción sin dirección desperdicia tokens en ruido

Seguridad

Permisos, secretos, alcance

Ámbitos mínimos: Outbound HTTPS

Almacenamiento de credenciales: Si inicias sesión en un sitio, usa secretos mediante variables de entorno; rótalos después de scrapes puntuales

Salida de datos: Sitios destino + proveedor LLM

No conceder nunca: Tokens de inicio de sesión persistentes almacenados en el workspace de la skill

Respeta robots.txt y los Términos de Servicio de los sitios destino; la skill es una herramienta, no una licencia para ignorar políticas

Resolución de problemas

Errores comunes y soluciones

La extracción devuelve vacío

Espera más tiempo el selector; el sitio puede cargar datos después de un retraso o via XHR tras un clic

Verificar: Use screenshot tool to verify page state

El sitio detecta bots

Baja la concurrencia; rota el UA; considera si el sitio permite el scraping

Discrepancia de esquema

Relaja los tipos (string vs number); el sitio puede usar formato que rompe los tipos estrictos

El watch se dispara repetidamente por cambios cosméticos

Ajusta el selector más fino; o cambia a diff basado en texto en lugar de diff HTML

Alternativas

browser-act skills vs otros

Alternativa	Cuándo usarla	Contrapartida
Playwright MCP / chrome-devtools-mcp	Necesitas control completo del navegador con todas las funciones de DevTools	Más pesado; más caro por llamada
Firecrawl MCP	Rastreo de todo el sitio, no extracción tipada por página	Forma diferente; de pago para volúmenes serios
duckduckgo-mcp fetch_content	La página es HTML simple; no se necesita JS	No funcionará en SPAs

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills