/ Verzeichnis / Playground / Semble
● Community MinishLab ⚡ Sofort

Semble

von MinishLab · MinishLab/semble

Code-Suche, die ~2% von grep+read an tokens kostet — semantisch + lexikalisch, vollständig lokal, unter einer Sekunde bei Repos mit einer Million Zeilen.

Semble ist ein Code-Suche-MCP von Minish Lab. Es indiziert ein Repo mit hybriden sparse+dense Embeddings und liefert Claude semantisch genauere Suchergebnisse als grep — kein Bedarf, ganze Dateien zu laden. Der Token-Verbrauch ist erheblich geringer als beim üblichen 'grep dann lesen'-Muster, besonders bei großen Monorepos.

Warum nutzen

Hauptfunktionen

Live-Demo

In der Praxis

semble-mcp.replay ▶ bereit
0/0

Installieren

Wählen Sie Ihren Client

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "semble-mcp": {
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  }
}

Öffne Claude Desktop → Settings → Developer → Edit Config. Nach dem Speichern neu starten.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "semble-mcp": {
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  }
}

Cursor nutzt das gleiche mcpServers-Schema wie Claude Desktop. Projektkonfiguration schlägt die globale.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "semble-mcp": {
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  }
}

Klicken Sie auf das MCP-Servers-Symbol in der Cline-Seitenleiste, dann "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "semble-mcp": {
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  }
}

Gleiche Struktur wie Claude Desktop. Windsurf neu starten zum Übernehmen.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "semble-mcp",
      "command": "uvx",
      "args": [
        "--from",
        "semble[mcp]",
        "semble"
      ]
    }
  ]
}

Continue nutzt ein Array von Serverobjekten statt einer Map.

~/.config/zed/settings.json
{
  "context_servers": {
    "semble-mcp": {
      "command": {
        "path": "uvx",
        "args": [
          "--from",
          "semble[mcp]",
          "semble"
        ]
      }
    }
  }
}

In context_servers hinzufügen. Zed lädt beim Speichern neu.

claude mcp add semble-mcp -- uvx --from semble[mcp] semble

Einzeiler. Prüfen mit claude mcp list. Entfernen mit claude mcp remove.

Anwendungsfälle

Praxisnahe Nutzung: Semble

Finden, wo ein Konzept in einem großen Repo implementiert ist

👤 Ingenieure, die große Codebasen erkunden ⏱ ~5 min beginner

Wann einsetzen: Du brauchst eine Antwort auf 'Wo findet die Session-Validierung statt?' in einem Schuss.

Voraussetzungen
  • Repo indiziertsemble index . — erster Lauf dauert ein paar Minuten bei großen Repos
Ablauf
  1. Suchen
    Use semble. Find where session token validation logic lives. Return file:line ranges.✓ Kopiert
    → 3–5 Treffer mit konkreten Datei:Zeile-Bereichen
  2. Gezielt lesen
    Read just those line ranges (not whole files). Summarize the validation flow.✓ Kopiert
    → Kompakte Flow-Zusammenfassung; kleiner Token-Fußabdruck

Ergebnis: Frage beantwortet mit einem Bruchteil der Tokens, die grep+read verbrennen würde.

Fallstricke
  • Veralteter Index nach großen Rebasessemble reindex oder einen File-Watcher-Hook einrichten
Kombinieren mit: filesystem

Verwendung eines Coding-Patterns im Repo auditieren

👤 Refactoring-Teams ⏱ ~15 min intermediate

Wann einsetzen: Du willst einen Helper deprecaten und brauchst alle Verwendungen + Varianten.

Ablauf
  1. Lexikalischer Durchlauf
    Find all calls to legacy_token_check.✓ Kopiert
    → Exakte Trefferliste
  2. Semantischer Durchlauf
    Find functions that do the same job under a different name.✓ Kopiert
    → Ähnliche Implementierungen markiert

Ergebnis: Refactoring-Umfang vollständig bekannt vor dem Start.

Fallstricke
  • False Positives beim semantischen Durchlauf — Jeden Kandidaten verifizieren; semble gibt einen Ähnlichkeits-Score zur Triage

Kombinationen

Mit anderen MCPs für 10-fache Wirkung

semble-mcp + filesystem

Such → gezieltes Lese-Muster (nur die von semble zurückgegebenen Bereiche)

Use semble to find candidates, then filesystem to read just the matched ranges.✓ Kopiert
semble-mcp + github

Refactoring-PR mit allen aktualisierten Call-Stellen erstellen

Find all call sites with semble, generate a PR that updates each.✓ Kopiert

Werkzeuge

Was dieses MCP bereitstellt

WerkzeugEingabenWann aufrufenKosten
search query, k?, mode? Standard — nach Konzept suchen free
lexical_search pattern, k? Exakte tokens / Regex free
index path Erster Lauf / nach großer Umstrukturierung free
reindex path Nach Änderungen aufholen free

Kosten & Limits

Was der Betrieb kostet

API-Kontingent
Keine — lokal
Tokens pro Aufruf
Minimal — in der Regel 100–500
Kosten in €
Kostenlos
Tipp
Repo einmal indizieren; Abfragen sind günstig. Token-Einsparungen kumulieren sich.

Sicherheit

Rechte, Secrets, Reichweite

Minimale Scopes: Local file read for indexing
Credential-Speicherung: Keine
Datenabfluss: Keine — Embeddings bleiben lokal

Fehlerbehebung

Häufige Fehler und Lösungen

Indexing OOM on huge repos

Batch-Größe in der Konfiguration reduzieren oder pro Paket indizieren

Search returns nothing relevant

Neu indizieren — lokale Kopie könnte abgewichen sein; oder Abfrage verfeinern

uvx install hangs

Mit uv pip install semble[mcp] vorwärmen

Alternativen

Semble vs. andere

AlternativeWann stattdessenKompromiss
ripgrep + grep MCPNur Exact-Match-Suche nötigKein semantischer Recall; höhere Token-Kosten bei Ergebnissen
ast-grep / serenaSyntax-bewusste strukturelle Suche/Ersetzung gewünschtAnderes Modell; nicht Embedding-basiert

Mehr

Ressourcen

📖 Offizielle README auf GitHub lesen

🐙 Offene Issues ansehen

🔍 Alle 400+ MCP-Server und Skills durchsuchen