/ الدليل / الملعب / Autoresearch (Karpathy-style)
● مجتمع uditgoenka ⚡ فوري

Autoresearch (Karpathy-style)

بواسطة uditgoenka · uditgoenka/autoresearch

هدف للداخل، نتائج للخارج — Claude يقترح تغييراً ويشغّله ويقيسه ويحتفظ بالمكاسب ويُهمل الخسائر ويتكرر. حلقة autoresearch لـ Andrej Karpathy مُعبَّأة كمهارة.

يُحوّل Autoresearch Claude إلى باحث ذو حلقة مغلقة: تحدد هدفاً ومُحقِّقاً (مقياساً أو اختباراً أو prompt حكم)، والمهارة تتكرر بـ: تعديل → تحقق → احتفظ/اهمل مع ضوابط ميزانية. مستوحى من منشورات Karpathy عن autoresearch. مفيد عندما يكون الهدف قابلاً للقياس لكن فضاء البحث أكبر من أن يُخطَّط مسبقاً — ضبط prompt واختبار hyperparameters وإعادة هيكلة للأداء وA/B للنصوص.

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

جاهز

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json  · Windows: %APPDATA%\Claude\claude_desktop_config.json
{
  "mcpServers": {
    "autoresearch-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ],
      "_inferred": true
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json
{
  "mcpServers": {
    "autoresearch-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ],
      "_inferred": true
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit
{
  "mcpServers": {
    "autoresearch-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ],
      "_inferred": true
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json
{
  "mcpServers": {
    "autoresearch-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ],
      "_inferred": true
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json
{
  "mcpServers": [
    {
      "name": "autoresearch-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json
{
  "context_servers": {
    "autoresearch-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/uditgoenka/autoresearch",
          "~/.claude/skills/autoresearch"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add autoresearch-skill -- git clone https://github.com/uditgoenka/autoresearch ~/.claude/skills/autoresearch

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: Autoresearch (Karpathy-style)

ضبط system prompt بشكل تكراري على benchmark

👤 مهندسو AI الذين يضبطون prompts ⏱ ~90 min advanced

متى تستخدمه: لديك prompt وbenchmark والصبر على حلقة.

المتطلبات الأساسية
  • المهارة مثبّتة — git clone https://github.com/uditgoenka/autoresearch ~/.claude/skills/autoresearch
  • Benchmark مع دالة تقييم — /bench/run.sh تطبع نقاءً على stdout
الخطوات
  1. صياغة الهدف
    Use autoresearch. Goal: maximize score from /bench/run.sh on prompt at /prompts/system.md. Budget 30 iterations.✓ تم النسخ
    → الحلقة تبدأ؛ أول اقتراح قُدِّم
  2. مراقبة المسار
    Show me iterations 5–10 with deltas.✓ تم النسخ
    → مسار مع نقاء لكل تكرار؛ المحتفظ به/المُهمَل مُعلَّم
  3. الإيقاف المبكر
    If 3 consecutive iterations fail to improve > 1%, stop and report best.✓ تم النسخ
    → حارس التقارب يُطلَق؛ أفضل prompt مُبلَّغ عنه

النتيجة: prompt أفضل مع مسار يشرح السبب.

المزالق
  • المُحقِّق قابل للتلاعب — النقاء يرتفع بدون جودة — أضف مُحقِّق صحة (حكم LLM أو مجموعة محتجزة)
اجمعها مع: filesystem

استخراج 20% أداء من دالة ساخنة عبر التكرار التلقائي

👤 مطورو الباك-إند مع بيانات profiler ⏱ ~120 min advanced

متى تستخدمه: تعرف أي دالة بطيئة؛ تريد Claude يجد مكافئاً أسرع.

الخطوات
  1. التعريف
    Goal: minimize wall-time of /bench/perf.sh which exercises foo(). Constraint: tests must keep passing.✓ تم النسخ
    → الحلقة تبدأ؛ خط أساس مُلتقط
  2. التكرار
    Run 20 iterations. Show the top 3 improvements at the end.✓ تم النسخ
    → 3 مرشحات لإعادة هيكلة مع تسريع مقيس

النتيجة: تسريع ملموس مُتحقَّق منه.

المزالق
  • التكرارات تُدخل مشكلة صحة خفية تفوّتها الاختبارات — أضف اختبارات قائمة على الخصائص كمُحقِّق إلى جانب اختبارات الوحدة
اجمعها مع: github

تكرار تلقائي لنصوص صفحة الهبوط على حكم CTR

👤 المسوّقون الذين يُجرون اختبارات محتوى ⏱ ~60 min intermediate

متى تستخدمه: لديك هدف CTR (أو prompt حكم يُحاكيه) ووقت للتكرار.

الخطوات
  1. إعداد الحكم
    Goal: maximize judge_score on /copy/headline.md. Judge prompt: 'rate likelihood a Series-B SaaS founder clicks this headline'.✓ تم النسخ
    → الخط الأساسي مُقيَّم؛ الحلقة تبدأ
  2. التكرار
    Run 15 iterations; keep top 3 distinct candidates.✓ تم النسخ
    → أفضل 3 عناوين متميزة

النتيجة: 3 مرشحات للعناوين للمراجعة البشرية.

المزالق
  • الحكم لديه تفضيل أسلوبي قوي غير مرتبط بالنقر — ثبّت الحكم على ملف معايير مع محددات صريحة

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

autoresearch-skill + filesystem

حفظ مسارات التكرار للفحص

Save trace to /research/traces/<ts>.md after each loop.✓ تم النسخ
autoresearch-skill + github

فتح PR بالمرشح الفائز

When loop finishes, open PR titled 'autoresearch: <metric> +X%'.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداةالمدخلاتمتى تستدعيهاالتكلفة
loop goal, verifier, max_iter, budget_tokens? تحسين الحلقة المغلقة Variable — bound by budget
trace loop_id? فحص تشغيل 0
rollback to_iteration الحلقة خرجت عن السيطرة 0

التكلفة والحدود

تكلفة التشغيل

حصة API
مرتبط بـ LLM الخاص بك
الرموز لكل استدعاء
ثقيل — الحلقة الكاملة يمكن أن تكون 100 ألف+ token
التكلفة المالية
مجاني؛ تكلفة LLM عليك
نصيحة
اضبط دائماً max_iter وbudget_tokens — الحلقات المفتوحة ستحرق المال

الأمان

الصلاحيات والأسرار ونطاق الأثر

تخزين بيانات الاعتماد: لا شيء
نقل البيانات الخارجي: مرتبط بمزوّد LLM الخاص بك

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

الحلقة عالقة — نفس الاقتراح في كل تكرار

زد حرارة الاستكشاف في المُقترِح؛ أو زرع مرشحات متنوعة

المُحقِّق يفشل بشكل غير متسق

تقلقل المُحقِّق يُبطل الحلقة — ثبّت البذور وكرّر التحقق N=3 لكل تكرار

الميزانية نفدت قبل التقارب

افحص المسار — إن كانت المكاسب رتيبة مستمرة، ارفع الميزانية؛ وإلا المُحقِّق أو المُقترِح هو الاختناق

البدائل

Autoresearch (Karpathy-style) مقابل البدائل

البديلمتى تستخدمهاالمقايضة
wanshuiyin/Auto-claude-code-research-in-sleep (ARIS)تريد حلقات بحث ML غير متزامنة بين عشية وضحاها تحديداًARIS مُركَّز على ML؛ autoresearch عام
A/B يدوي مع تكرار نصيالهدف صغير ولمرة واحدةالمهارة تزيل عبء التنسيق

المزيد

الموارد

📖 اقرأ ملف README الرسمي على GitHub

🐙 تصفح القضايا المفتوحة

🔍 تصفح أكثر من 400 خادم MCP و Skills