Autoresearch (Karpathy-style) (Claude Skill) — التثبيت & عرض مباشر

لماذا تستخدمه

الميزات الأساسية

تجريد الهدف + المُحقِّق — يعمل لأي هدف قابل للقياس
ضوابط الميزانية (أقصى تكرارات، أقصى tokens، وقت)
سجل احتفاظ/إهمال + تراجع تلقائي عند الانحدار
مُحقِّقات قابلة للتوصيل: مقياس، مجموعة اختبار، حكم LLM
مسار markdown لكل تكرار للفحص
مجاني، مفتوح

عرض مباشر

كيف يبدو في الممارسة

جاهز

التثبيت

اختر العميل

~/Library/Application Support/Claude/claude_desktop_config.json · Windows: %APPDATA%\Claude\claude_desktop_config.json

{
  "mcpServers": {
    "autoresearch-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ],
      "_inferred": true
    }
  }
}

افتح Claude Desktop → Settings → Developer → Edit Config. أعد التشغيل بعد الحفظ.

~/.cursor/mcp.json · .cursor/mcp.json

{
  "mcpServers": {
    "autoresearch-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ],
      "_inferred": true
    }
  }
}

يستخدم Cursor نفس مخطط mcpServers مثل Claude Desktop. إعدادات المشروع أولى من الإعدادات العامة.

VS Code → Cline → MCP Servers → Edit

{
  "mcpServers": {
    "autoresearch-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ],
      "_inferred": true
    }
  }
}

انقر على أيقونة MCP Servers في شريط Cline الجانبي، ثم "Edit Configuration".

~/.codeium/windsurf/mcp_config.json

{
  "mcpServers": {
    "autoresearch-skill": {
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ],
      "_inferred": true
    }
  }
}

نفس الصيغة مثل Claude Desktop. أعد تشغيل Windsurf لتطبيق التغييرات.

~/.continue/config.json

{
  "mcpServers": [
    {
      "name": "autoresearch-skill",
      "command": "git",
      "args": [
        "clone",
        "https://github.com/uditgoenka/autoresearch",
        "~/.claude/skills/autoresearch"
      ]
    }
  ]
}

يستخدم Continue مصفوفة من كائنات الخادم بدلاً من خريطة.

~/.config/zed/settings.json

{
  "context_servers": {
    "autoresearch-skill": {
      "command": {
        "path": "git",
        "args": [
          "clone",
          "https://github.com/uditgoenka/autoresearch",
          "~/.claude/skills/autoresearch"
        ]
      }
    }
  }
}

أضف إلى context_servers. يعيد Zed التحميل تلقائيًا عند الحفظ.

claude mcp add autoresearch-skill -- git clone https://github.com/uditgoenka/autoresearch ~/.claude/skills/autoresearch

أمر من سطر واحد. تحقق باستخدام claude mcp list. احذف باستخدام claude mcp remove.

حالات الاستخدام

استخدامات عملية: Autoresearch (Karpathy-style)

ضبط system prompt بشكل تكراري على benchmark

👤 مهندسو AI الذين يضبطون prompts ⏱ ~90 min advanced

متى تستخدمه: لديك prompt وbenchmark والصبر على حلقة.

المتطلبات الأساسية

المهارة مثبّتة — git clone https://github.com/uditgoenka/autoresearch ~/.claude/skills/autoresearch
Benchmark مع دالة تقييم — /bench/run.sh تطبع نقاءً على stdout

الخطوات

صياغة الهدف

Use autoresearch. Goal: maximize score from /bench/run.sh on prompt at /prompts/system.md. Budget 30 iterations.✓ تم النسخ

→ الحلقة تبدأ؛ أول اقتراح قُدِّم
مراقبة المسار

Show me iterations 5–10 with deltas.✓ تم النسخ

→ مسار مع نقاء لكل تكرار؛ المحتفظ به/المُهمَل مُعلَّم
الإيقاف المبكر

If 3 consecutive iterations fail to improve > 1%, stop and report best.✓ تم النسخ

→ حارس التقارب يُطلَق؛ أفضل prompt مُبلَّغ عنه

النتيجة: prompt أفضل مع مسار يشرح السبب.

المزالق

المُحقِّق قابل للتلاعب — النقاء يرتفع بدون جودة — أضف مُحقِّق صحة (حكم LLM أو مجموعة محتجزة)

اجمعها مع: filesystem

استخراج 20% أداء من دالة ساخنة عبر التكرار التلقائي

👤 مطورو الباك-إند مع بيانات profiler ⏱ ~120 min advanced

متى تستخدمه: تعرف أي دالة بطيئة؛ تريد Claude يجد مكافئاً أسرع.

الخطوات

التعريف

Goal: minimize wall-time of /bench/perf.sh which exercises foo(). Constraint: tests must keep passing.✓ تم النسخ

→ الحلقة تبدأ؛ خط أساس مُلتقط
التكرار

Run 20 iterations. Show the top 3 improvements at the end.✓ تم النسخ

→ 3 مرشحات لإعادة هيكلة مع تسريع مقيس

النتيجة: تسريع ملموس مُتحقَّق منه.

المزالق

التكرارات تُدخل مشكلة صحة خفية تفوّتها الاختبارات — أضف اختبارات قائمة على الخصائص كمُحقِّق إلى جانب اختبارات الوحدة

اجمعها مع: github

تكرار تلقائي لنصوص صفحة الهبوط على حكم CTR

👤 المسوّقون الذين يُجرون اختبارات محتوى ⏱ ~60 min intermediate

متى تستخدمه: لديك هدف CTR (أو prompt حكم يُحاكيه) ووقت للتكرار.

الخطوات

إعداد الحكم

Goal: maximize judge_score on /copy/headline.md. Judge prompt: 'rate likelihood a Series-B SaaS founder clicks this headline'.✓ تم النسخ

→ الخط الأساسي مُقيَّم؛ الحلقة تبدأ
التكرار

Run 15 iterations; keep top 3 distinct candidates.✓ تم النسخ

→ أفضل 3 عناوين متميزة

النتيجة: 3 مرشحات للعناوين للمراجعة البشرية.

المزالق

الحكم لديه تفضيل أسلوبي قوي غير مرتبط بالنقر — ثبّت الحكم على ملف معايير مع محددات صريحة

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

autoresearch-skill + filesystem

حفظ مسارات التكرار للفحص

Save trace to /research/traces/<ts>.md after each loop.✓ تم النسخ

autoresearch-skill + github

فتح PR بالمرشح الفائز

When loop finishes, open PR titled 'autoresearch: <metric> +X%'.✓ تم النسخ

الأدوات

ما يوفره هذا الـ MCP

الأداة	المدخلات	متى تستدعيها	التكلفة
loop	goal, verifier, max_iter, budget_tokens?	تحسين الحلقة المغلقة	Variable — bound by budget
trace	loop_id?	فحص تشغيل	0
rollback	to_iteration	الحلقة خرجت عن السيطرة	0

التكلفة والحدود

تكلفة التشغيل

حصة API: مرتبط بـ LLM الخاص بك
الرموز لكل استدعاء: ثقيل — الحلقة الكاملة يمكن أن تكون 100 ألف+ token
التكلفة المالية: مجاني؛ تكلفة LLM عليك
نصيحة: اضبط دائماً max_iter وbudget_tokens — الحلقات المفتوحة ستحرق المال

الأمان

الصلاحيات والأسرار ونطاق الأثر

تخزين بيانات الاعتماد: لا شيء

نقل البيانات الخارجي: مرتبط بمزوّد LLM الخاص بك

الحلقات يمكن أن تكون مكلفة — لا تشغّل أبداً بدون ميزانية

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

الحلقة عالقة — نفس الاقتراح في كل تكرار

زد حرارة الاستكشاف في المُقترِح؛ أو زرع مرشحات متنوعة

المُحقِّق يفشل بشكل غير متسق

تقلقل المُحقِّق يُبطل الحلقة — ثبّت البذور وكرّر التحقق N=3 لكل تكرار

الميزانية نفدت قبل التقارب

افحص المسار — إن كانت المكاسب رتيبة مستمرة، ارفع الميزانية؛ وإلا المُحقِّق أو المُقترِح هو الاختناق

البدائل

Autoresearch (Karpathy-style) مقابل البدائل

البديل	متى تستخدمها	المقايضة
wanshuiyin/Auto-claude-code-research-in-sleep (ARIS)	تريد حلقات بحث ML غير متزامنة بين عشية وضحاها تحديداً	ARIS مُركَّز على ML؛ autoresearch عام
A/B يدوي مع تكرار نصي	الهدف صغير ولمرة واحدة	المهارة تزيل عبء التنسيق

Autoresearch (Karpathy-style)

لماذا تستخدمه

الميزات الأساسية

عرض مباشر

كيف يبدو في الممارسة

التثبيت

اختر العميل

حالات الاستخدام

استخدامات عملية: Autoresearch (Karpathy-style)

ضبط system prompt بشكل تكراري على benchmark

المتطلبات الأساسية

الخطوات

المزالق

استخراج 20% أداء من دالة ساخنة عبر التكرار التلقائي

الخطوات

المزالق

تكرار تلقائي لنصوص صفحة الهبوط على حكم CTR

الخطوات

المزالق

التركيبات

اجمعها مع خوادم MCP أخرى لتحقيق نتائج x10

الأدوات

ما يوفره هذا الـ MCP

التكلفة والحدود

تكلفة التشغيل

الأمان

الصلاحيات والأسرار ونطاق الأثر

استكشاف الأخطاء

الأخطاء الشائعة وحلولها

البدائل

Autoresearch (Karpathy-style) مقابل البدائل

المزيد

الموارد