Objetivo como entrada, resultados como saída — o Claude propõe uma mudança, executa, mede, mantém os ganhos, descarta as perdas e itera. O loop autoresearch do Andrej Karpathy, empacotado como skill.
O Autoresearch transforma o Claude em um pesquisador de loop fechado: você especifica um objetivo e um verificador (uma métrica, um teste ou um prompt de juiz), e a skill itera Modificar → Verificar → Manter/Descartar com controles de orçamento. Inspirado nos posts de autoresearch do Karpathy. Útil quando o objetivo é mensurável, mas o espaço de busca é grande demais para planejar com antecedência — ajuste de prompt, busca de hiperparâmetros, refatoração para performance, A/B de copy.
Espremer 20% de performance de uma função hot via auto-iteração
👤 Devs de backend com dados de profiling⏱ ~120 minadvanced
Quando usar: Você sabe qual função é lenta; quer que o Claude encontre uma alternativa mais rápida.
Fluxo
Definir
Objetivo: minimizar o wall-time de /bench/perf.sh que exercita foo(). Restrição: os testes devem continuar passando.✓ Copiado
→ Loop inicia; baseline capturado
Iterar
Execute 20 iterações. Mostre as 3 melhores melhorias no final.✓ Copiado
→ 3 candidatos de refatoração com speedup medido
Resultado: Speedup concreto, validado.
Armadilhas
Iterações introduzem problema sutil de correção que os testes perdem — Adicione testes baseados em propriedades como verificador junto aos testes unitários
Auto-iterar copy de landing page contra um juiz de CTR
👤 Marketers rodando testes de conteúdo⏱ ~60 minintermediate
Quando usar: Você tem uma meta de CTR (ou um prompt de juiz que a simula) e tempo para iterar.
Fluxo
Configurar o juiz
Objetivo: maximizar o judge_score em /copy/headline.md. Prompt do juiz: 'avalie a probabilidade de um fundador de SaaS série B clicar neste headline'.✓ Copiado
→ Baseline do juiz pontuado; loop inicia
Iterar
Execute 15 iterações; mantenha os 3 candidatos distintos com melhor resultado.✓ Copiado
→ Top 3 headlines distintos
Resultado: 3 headlines candidatos para revisão humana.
Armadilhas
Juiz tem forte preferência de estilo não relacionada à clicabilidade — Ancore o juiz em um arquivo de rubrica com critérios explícitos