/ Directorio / Playground / Semble
● Comunidad MinishLab ⚡ Instantáneo

Semble

por MinishLab · MinishLab/semble

Búsqueda de código que cuesta ~2% de grep+read en tokens — semántica + léxica, completamente local, sub-segundo en repos de millones de líneas.

Semble es un MCP de búsqueda de código de Minish Lab. Indexa un repo con embeddings híbridos sparse+dense y sirve a Claude resultados de búsqueda semántica más precisos que grep — sin necesidad de volcar archivos enteros. El uso de tokens es dramáticamente menor que el patrón estándar de 'grep y luego leer', especialmente en monorepos grandes.

Por qué usarlo

Características clave

Demo en vivo

Cómo se ve en la práctica

semble-mcp.replay ▶ listo
0/0

Instalar

Elige tu cliente

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "semble-mcp": {
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  }
}

Abre Claude Desktop → Settings → Developer → Edit Config. Reinicia después de guardar.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "semble-mcp": {
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  }
}

Cursor usa el mismo esquema mcpServers que Claude Desktop. La configuración del proyecto prevalece sobre la global.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "semble-mcp": {
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  }
}

Haz clic en el icono MCP Servers de la barra lateral de Cline y luego en "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "semble-mcp": {
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  }
}

Mismo formato que Claude Desktop. Reinicia Windsurf para aplicar.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "semble-mcp",
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  ]
}

Continue usa un array de objetos de servidor en lugar de un mapa.

~/.config/zed/settings.json
{
  "context_servers": {
    "semble-mcp": {
      "command": {
        "path": "uvx",
        "args": [
          "--from",
          "semble[mcp]",
          "semble"
        ]
      }
    }
  }
}

Añádelo a context_servers. Zed recarga en caliente al guardar.

claude mcp add semble-mcp -- uvx --from semble[mcp] semble

Un solo comando. Verifica con claude mcp list. Quita con claude mcp remove.

Casos de uso

Usos del mundo real: Semble

Encontrar dónde está implementado un concepto en un repo grande

👤 Ingenieros explorando grandes codebases ⏱ ~5 min beginner

Cuándo usarlo: Necesitas que '¿dónde sucede la validación de sesión?' se responda de un solo intento.

Requisitos previos
  • Repo indexadosemble index . — la primera ejecución tarda unos minutos en repos grandes
Flujo
  1. Buscar
    Usa semble. Encuentra dónde vive la lógica de validación de token de sesión. Devuelve rangos file:line.✓ Copiado
    → 3-5 resultados con rangos file:line concretos
  2. Leer con precisión
    Lee solo esos rangos de líneas (no los archivos completos). Resume el flujo de validación.✓ Copiado
    → Resumen del flujo conciso; huella de tokens pequeña

Resultado: Pregunta respondida con una fracción de los tokens que quemaría grep+read.

Errores comunes
  • Índice obsoleto tras rebases grandessemble reindex o configura un hook de file-watcher
Combinar con: filesystem

Auditar cómo se usa un patrón de código en todo un repo

👤 Equipos de refactorización ⏱ ~15 min intermediate

Cuándo usarlo: Vas a deprecar un helper y quieres todos sus usos y variantes.

Flujo
  1. Pasada léxica
    Encuentra todas las llamadas a legacy_token_check.✓ Copiado
    → Lista de coincidencias exactas
  2. Pasada semántica
    Encuentra funciones que hagan el mismo trabajo con un nombre diferente.✓ Copiado
    → Implementaciones similares marcadas

Resultado: El alcance de la refactorización es completamente conocido antes de empezar.

Errores comunes
  • Falsos positivos en la pasada semántica — Verifica cada candidato; semble da una puntuación de similitud para el triaje

Combinaciones

Combínalo con otros MCPs para multiplicar por 10

semble-mcp + filesystem

Patrón buscar → leer con precisión (solo los rangos que devuelve semble)

Usa semble para encontrar candidatos, luego filesystem para leer solo los rangos coincidentes.✓ Copiado
semble-mcp + github

Construir un PR de refactorización con todos los sitios de llamada actualizados

Encuentra todos los sitios de llamada con semble, genera un PR que los actualice.✓ Copiado

Herramientas

Lo que expone este MCP

HerramientaEntradasCuándo llamarCoste
search query, k?, mode? Por defecto — encontrar por concepto free
lexical_search pattern, k? Tokens exactos / regex free
index path Primera ejecución / tras una reestructuración grande free
reindex path Ponerse al día tras ediciones free

Coste y límites

Lo que cuesta ejecutarlo

Cuota de API
Ninguna — local
Tokens por llamada
Mínimo — normalmente 100–500
Monetario
Gratis
Consejo
Indexa el repo una vez; las consultas son baratas. El ahorro de tokens se acumula.

Seguridad

Permisos, secretos, alcance

Ámbitos mínimos: Local file read for indexing
Almacenamiento de credenciales: Ninguno
Salida de datos: Ninguno — los embeddings se quedan en local

Resolución de problemas

Errores comunes y soluciones

Indexación con OOM en repos enormes

Reduce el batch size en la configuración o indexa por paquete

La búsqueda no devuelve resultados relevantes

Vuelve a indexar — tu copia local puede haber divergido; o refina la consulta

La instalación uvx se cuelga

Pre-carga con uv pip install semble[mcp]

Alternativas

Semble vs otros

AlternativaCuándo usarlaContrapartida
ripgrep + MCP grepSolo necesitas búsqueda por coincidencia exactaSin recall semántico; mayor coste de tokens en los resultados
ast-grep / serenaQuieres búsqueda estructural con conciencia de sintaxisModelo diferente; no basado en embeddings

Más

Recursos

📖 Lee el README oficial en GitHub

🐙 Ver issues abiertas

🔍 Ver todos los 400+ servidores MCP y Skills