تكنولوجيا

مايكروسوفت تقتحم عالم الروبوتات بنموذج “رو-ألفا” الجديد

عملاق البرمجيات يراهن على "الذكاء الفيزيائي" في ثورة الروبوتات

مايكروسوفت تدشن مرحلة جديدة في مسار الذكاء الاصطناعي، بكشفها عن نموذجها الروبوتي الأول “رو-ألفا”. يمثل هذا النموذج خطوة متقدمة ضمن سلسلة “فاي” (Phi) الخاصة بالشركة، والتي تجمع بين الرؤية وفهم اللغة.

عملاق البرمجيات يرى ضرورة قصوى لتطوير قدرات الروبوتات على الإدراك والتفاعل. الأنظمة الحالية، المصممة لخطوط الإنتاج، تواجه صعوبات جمة في البيئات غير المنظمة. “رو-ألفا” يستهدف تجاوز هذه القيود، عبر استجابة آنية للظروف المتغيرة، بعيداً عن البرمجة المسبقة.

النموذج الجديد يدمج فهم اللغة الطبيعية مع الإدراك الحسي، ثم ترجمة ذلك إلى إشارات تحكم روبوتية مباشرة. هذا يمنح الآلة مرونة واسعة في تنفيذ الأوامر، ويقلل الاعتماد على سيناريوهات صناعية جامدة.

يركز “رو-ألفا” بصفة خاصة على مهام “التلاعب ثنائي اليدين”. هذه العمليات تتطلب تنسيقاً دقيقاً بين ذراعين آليتين، وتحكماً شديد التعقيد في الحركة. تعد هذه المهام من أعقد التحديات في هندسة الروبوتات.

تطوير النموذج يرتبط بمفهوم “الذكاء الاصطناعي الفيزيائي” (Physical AI) المتنامي. هنا، لا تقتصر النماذج البرمجية على التحليل، بل تمتد لتوجيه الآلات للعمل في بيئات يصعب التنبؤ بها. مايكروسوفت تسعى لتقليص الفجوة بين الذكاء المحاكى والتفاعل المادي.

إلى جانب الرؤية الحاسوبية، يتضمن “رو-ألفا” قدرات استشعار لمسي. هذا العنصر حيوي لسد الفجوة بين الأوامر الرقمية والتفاعل المادي الحقيقي. الشركة تعمل أيضاً على إضافة أنماط استشعار أخرى، مثل استشعار القوة، ضمن مراحل التطوير.

التحدي الأكبر يكمن في محدودية البيانات واسعة النطاق لتدريب الروبوتات، خاصة فيما يتعلق بحاسة اللمس. مايكروسوفت تعتمد على المحاكاة لتوليد مسارات حركة اصطناعية داخل “بيئة إنفيديا الرقمية” (Nvidia Isaac Sim). تُدمج هذه البيانات مع عروض فعلية من مجموعات بيانات تجارية ومفتوحة المصدر.

آشلي لورنس، نائب الرئيس للشؤون المؤسسية في مسرّع أبحاث مايكروسوفت، أشار إلى أن نماذج “الرؤية-اللغة-الفعل” (VLA) تمكّن الآلات من الإدراك والتفكير والتصرف باستقلالية أكبر في بيئات أقل تنظيماً. دييبو تالا، نائب رئيس الروبوتات والذكاء الاصطناعي الطرفي في إنفيديا، أكد أهمية هذا النهج القائم على البيانات الاصطناعية لتجاوز ندرة البيانات الواقعية.

لا يغيب العنصر البشري عن هذه المعادلة. النظام يتيح للمشغلين التدخل أثناء النشر الفعلي، عبر أجهزة تحكم عن بُعد. يمكنهم تقديم تصحيحات وملاحظات يتعلم منها النموذج تدريجياً.

هذا المزيج من المحاكاة والبيانات الواقعية والتصحيح البشري يعكس اتجاهاً متزايداً نحو تعويض النقص في بيانات “الذكاء المتجسد” (Embodied AI) المرتبطة بالتفاعل الفيزيائي المباشر.

مقالات ذات صلة