“وكيل ذكي” يدير حاسوبك.. جوجل تمنح Gemini 3.5 Flash صلاحية التحكم المباشر بالواجهات
جوجل تنهي عصر النماذج المستقلة وتدمج قدرات "القيادة الذاتية" للحواسب في جيمناي فلاش.

دمجت شركة جوجل خاصية “Computer Use” بشكل أصيل في نموذجها الأحدث Gemini 3.5 Flash، لتنهي بذلك الاعتماد على النماذج المستقلة في تنفيذ المهام البرمجية المعقدة عبر واجهات المستخدم. تمنح هذه الخطوة النموذج قدرة تفوق مجرد معالجة النصوص، حيث بات بإمكان الوكلاء البرمجيين المبنيين عليه رؤية ما يعرض على الشاشة وتحليله ثم اتخاذ قرارات تنفيذية داخل بيئة نظام التشغيل.
تتيح التقنية الجديدة بناء أدوات قادرة على تصفح الويب أو استخدام تطبيقات الهاتف والحاسوب بشكل مستقل تماماً. تراهن جوجل على هذه الميزة في مجالات أتمتة اختبارات البرمجيات، حيث يمكن للذكاء الاصطناعي التفاعل مع المنصات الرقمية لإنتاج وثائق تقنية أو تحليل خصائص التطبيقات قيد التطوير بناءً على التجربة البصرية المباشرة.
تترافق هذه الصلاحيات الواسعة مع مخاطر أمنية مرتفعة، لا سيما فيما يتعلق بهجمات “حقن الأوامر” التي قد تستغل قدرة النموذج على الوصول إلى بيانات الواجهات. استجابةً لذلك، فعلت الشركة بروتوكولات حماية اختيارية تفرض على الذكاء الاصطناعي طلب إذن بشري صريح قبل تنفيذ أي إجراءات حساسة أو غير قابلة للتراجع، مع نظام تعقب آلي يوقف المهام فور رصد أي تلاعب خارجي بالبيانات.
يأتي هذا التحول ليعيد صياغة دور Gemini 3.5 Flash الذي ظهر لأول مرة في مؤتمر المطورين الأخير كأداة متخصصة في البرمجة. وبدلاً من اللجوء لنسخ تجريبية مثل Gemini 2.5، أصبح المطورون الآن قادرين على توظيف النموذج الأساسي لإنجاز عمليات كانت تتطلب تدخلاً بشرياً مستمراً في مراقبة واجهات المستخدم.
يعمل النموذج حالياً كركيزة أساسية لتطبيق جيمناي في مهامه العامة، متجاوزاً نماذج أخرى مثل Flash-Lite وPro في مرونة التعامل مع البيئات الرقمية المتغيرة. يركز النظام الجديد على تقليص الفجوة بين التفكير المنطقي للآلة وبين قدرتها على محاكاة حركة المستخدم البشري داخل الأنظمة المختلفة.











