أنتثروبيك تنهي التدقيق اليدوي للأكواد البرمجية بميزة التقييم التلقائي المستقل
نظام تقييم مستقل يضمن مطابقة الكود للمعايير المحددة

أطلقت شركة “أنتثروبيك” (Anthropic) تحديثًا تقنيًا لمنصة “كلود كود” (Claude Code) تحت اسم “أوتكامز” (Outcomes)، يتيح للنظام التحقق ذاتيًا من جودة الكود البرمجي المنتج ومدى مطابقته للمعايير المحددة مسبقًا قبل تسليمه للمستخدم.
تعتمد الآلية الجديدة على فصل مهام الذكاء الاصطناعي بين وكيلين مستقلين؛ حيث يتولى “الوكيل الكاتب” بناء الكود، بينما يعمل وكيل آخر يسمى “المقيم” (Grader) في نافذة سياق منفصلة تمامًا لضمان الحيادية ومنع التأثر بمسودة العمل الأولية. ويقوم المقيم بمراجعة المخرج النهائي بناءً على “روبيريك” أو دليل معايير يضعه المبرمج، ثم يرسل تقريرًا يحدد الفجوات التقنية بين ما تم إنجازه والمتطلبات المطلوبة، مما يدفع النظام لإعادة التصحيح تلقائيًا في دورات عمل متكررة.
يتطلب تفعيل ميزة التقييم استخدام الترويسة البرمجية (managed-agents-2026-04-01) في طلبات واجهة البرمجة (API). وتجري العملية عبر إرسال حدث (user.define_outcome) يتضمن وصفاً للمهمة ودليل المعايير بصيغة “مارك داون” (Markdown)، مع إمكانية تحديد سقف لعدد محاولات المراجعة (max_iterations) قبل توقف النظام.
بينما يعمل الوكيل الرئيسي على التنفيذ، توفر المنصة تعقباً لحظياً عبر أحداث برمجية تظهر متى يبدأ المقيم عمله وما النتائج التي خلص إليها في كل دورة، حيث يبدأ عداد المراجعات من الصفر لكل محاولة تصحيح جديدة. وفي حين تقتصر المنصة على تشغيل مهمة تقييم واحدة في الوقت ذاته، يمكن للمبرمجين جدولة سلسلة من المهام المتتابعة، مثل إنهاء كتابة وظيفة برمجية معينة ثم إتباعها بمهمة مستقلة لاختبار التغطية البرمجية (Tests)، دون الحاجة لتدخل بشري وسيط بين المرحلتين.
توضح الوثائق التقنية للميزة أن دقة التقييم تعتمد كلياً على صياغة دليل المعايير؛ إذ إن الأوامر العامة قد تجعل الوكيل المقيم يكتفي بوجود هيكل الكود دون التأكد من كفاءته التشغيلية، في حين تفرض المعايير الدقيقة على النظام فحصاً أعمق للثغرات ومعالجة الأخطاء قبل إعلان اكتمال المهمة.









