معرفة المجال محملة عند الطلب
「Don't put everything in the system prompt. Load on demand.」
مأزق "موجه النظام الكامل"
لديك 20 مهارة، كل منها مكتوبة بالتفصيل: pdf-processing (كيفية قراءة PDF)، مراجعة الكود (قائمة مراجعة المراجعة)، git-workflow (إجراءات git شائعة الاستخدام)... طريقة بديهية: ضعها كلها في موجه النظام حتى يمكن الرجوع إلى النموذج في أي وقت. ص>
النتيجة:
- احرق 15-30 ألف رمز إدخال مميز لكل مكالمة (حتى لو كانت المشكلة لا تتطلب أي مهارات على الإطلاق). لي>
- تم تخفيف انتباه النموذج - سينخفض الالتزام بالقواعد المذكورة في موجه النظام الطويل. لي>
- قم بتغيير مهارة وسيتم إبطال ذاكرة التخزين المؤقت لجميع المحادثات التاريخية. لي>
طريقة عمل s05 هي تقسيمها إلى طبقتين. ص>
العمارة ذات المستويين
الطبقة الأولى · الرخيص: يتم وضع اسم المهارة ووصف مكون من جملة واحدة فقط في موجه النظام (حوالي 100 رمز مميز لكل منهما). 20 مهارة = 2 ألف رمز، مقبولة. ص>
# قائمة المهارات في موجه النظام
المهارات المتاحة:
- pdf: معالجة ملفات PDF. استخراج النص والجداول والبيانات الوصفية.
- مراجعة الكود: قائمة المراجعة المنهجية للكود.
- سير عمل git: أنماط تفرع git الشائعة وإعادة القاعدة.
الطبقة الثانية · عند الطلب: عندما يحتاج النموذج إلى استخدام مهارة معينة، اتصل بـ load_skill(name="pdf")، ويتم إدراج نص المهارة الكامل (ربما 5-10 آلاف رمز مميز) في السياق من خلال tool_result. لا يتم تحميل أي من الرموز المميزة للمهارات غير المستخدمة. ص>
# tool_result تُرجع المهارة الكاملة
<اسم المهارة="pdf">
الخطوة 1: استخدم pdfplumber لاستخراج...
الخطوة 2: التعامل مع احتياطي التعرف الضوئي على الحروف عند الحاجة...
الخطوة 3: هيكلة الإخراج كجدول تخفيض السعر...
</المهارة>
قارن تكاليف الرمز المميز
اختبره في سيناريو حقيقي. لنفترض أن لديك 20 مهارة وكل جسد لديه في المتوسط 3000 قطعة. يطرح المستخدم سؤالاً (مثل "إصلاح الخلل في واجهة تسجيل الدخول") - ربما لا يتطلب هذا السؤال أي مهارات. ص>
تنسيق SKILL.md
تستخدم ملفات المهارات YAML frontmatter + body:
--- الاسم: pdf الوصف: معالجة ملفات PDF. استخراج النص والجداول والبيانات الوصفية. العلامات: وثيقة، تحليل --- الخطوة 1: استخدم pdfplumber للاستخراج. التعامل مع التخطيطات متعددة الأعمدة... الخطوة 2: بالنسبة لملفات PDF الممسوحة ضوئيًا، ارجع إلى التعرف الضوئي على الحروف (OCR) عبر tesseract...
المادة الأمامية مخصصة للطبقة الأولى (الاسم/الوصف/العلامات)، والنص مخصص للطبقة الثانية. طريقة الكتابة هذه مستوحاة من المدونات الثابتة (Jekyll، Hugo)، ويمكن للأشخاص الذين هم على دراية بها فهمها في لمحة. ص>