غوغل تمنح “جيمناي” صلاحيات الوصول العميق لنظام macOS لإدارة مهام المستخدم ذاتياً
غوغل تتبنى استراتيجية "العملاء البرمجيين" في مواجهة أنثروبيك

تتحرك شركة غوغل لتحويل تطبيق “جيمناي” (Gemini) على أجهزة “ماك” من مجرد واجهة دردشة تقليدية إلى “عميل برمجي” (AI Agent) يمتلك قدرة التحكم المباشر في نظام التشغيل، في خطوة تعكس تسارع السباق نحو ما يعرف بـ “الذكاء الاصطناعي الفاعل” (Agentic AI). وتأتي هذه التطورات بالتزامن مع محاولات المنافسين، لا سيما شركة أنثروبيك عبر ميزة Claude Cowork، لتمكين النماذج اللغوية من تجاوز حدود النصوص والتعامل المباشر مع واجهات البرمجيات كبديل للمستخدم البشري.
وكشفت بيانات تقنية استُخلصت من الكود المصدري للتطبيق، ونشرها موقع 9to5Google، عن استعداد غوغل لطلب أذونات وصول حساسة تتعلق بـ “إمكانية الوصول” (Accessibility) ومراقبة محتوى الشاشة، وهي تصاريح تمنح الذكاء الاصطناعي القدرة على رؤية ما يفعله المستخدم وتنفيذ نقرات أو عمليات نقل ملفات نيابة عنه. ويمثل هذا التوجه انتقالاً جذرياً من نماذج اللغة الكبيرة (LLMs) التي تكتفي بالتحليل، إلى نماذج الحركة الكبيرة (LAMs) التي تستهدف أتمتة بيئة العمل المكتبية بالكامل دون تدخل يدوي.
تتضمن قائمة المهام المسربة قدرة جيمناي على مسح المجلدات واستخراج البيانات لتحويلها إلى جداول بيانات، وإعادة تسمية الملفات وتصنيفها بناءً على سياق المحتوى، بالإضافة إلى أتمتة إرسال رسائل البريد الإلكتروني وتلخيص اجتماعات Google Meet استناداً إلى نصوص التفريغ الصوتي. ومع أن غوغل تمتلك نظام “كروم أو إس”، إلا أن اختيار macOS كمنصة انطلاق أولية لهذه الميزات يثير تساؤلات حول رغبة الشركة في اختراق قاعدة مستخدمي آبل المحترفين قبل التوسع في بيئات برمجية أخرى.
من المتوقع أن تُعلن غوغل رسمياً عن هذه القدرات خلال مؤتمر المطورين Google I/O 2026، حيث تشير السلاسل النصية المكتشفة إلى أن الأداة ستعمل من خلال أوامر صوتية أو نصية بسيطة (Prompts) تطلق سلسلة من الإجراءات المتتابعة والخلفية.
يعتمد هذا التحول على قدرة النموذج على محاكاة الإدراك البصري البشري لواجهات المستخدم، بينما يظل التحدي الأكبر قائماً في الموازنة بين كفاءة الأتمتة والمخاوف المتعلقة بالخصوصية الناتجة عن منح ذكاء اصطناعي خارجي صلاحية الاطلاع الدائم على شاشة الحاسوب الشخصي.









