جوجل تمنح «جيمناي» حق الوصول إلى أرشيف الصور الشخصية

نموذج Nano Banana 2 يحول الصور الشخصية إلى محتوى بصري ذكي

منذ 53 دقيقة

مراسل في قسم التكنولوجيا، يركز على متابعة أخر مستجدات أخبار التكنولوجيا

تحول محرك الذكاء الاصطناعي «جيمناي» (Gemini) من أداة لتوليد الصور العامة إلى منصة تعتمد على التاريخ الشخصي للمستخدمين. بدأت جوجل دمج مكتبة الصور (Google Photos) مع نموذجها الجديد «نانو بانانا 2» (Nano Banana 2)، مما يسمح للنظام باستدعاء ملامح الوجوه والروابط العائلية المسجلة مسبقاً لإنتاج محتوى بصري مخصص.

تجاوزت هذه الخطوة الحاجة إلى كتابة أوصاف نصية مطولة أو رفع صور مرجعية يدوياً. النظام بات قادراً على فهم طلبات مثل «ارسم عائلتي بأسلوب الرسوم المتحركة» عبر سحب البيانات البصرية من الأرشيف السحابي مباشرة. تاريخياً، انتقلت خدمات التخزين السحابي من مجرد «مستودعات رقمية» صامتة إلى أدوات معالجة نشطة، وهو ما يظهر في قدرة «جيمناي» الحالية على تمييز الأشخاص الذين تم تصنيفهم مسبقاً داخل التطبيق.

توضح وثائق التحديث الصادرة عن جوجل أن الميزة تتيح إنتاج صور فنية، مثل تحويل لقطات واقعية إلى نمط «صلصالي» (Claymation)، مع الحفاظ على هوية الأشخاص الحقيقيين. تعتمد هذه التقنية على «السياق المخزن» بدلاً من التخمين البرمجي. وفي محاولة لتعزيز الشفافية، أضافت الشركة خيار «المصادر» (Sources) الذي يسمح للمستخدم بتتبع الصور التي استند إليها الذكاء الاصطناعي في تكوين النتيجة النهائية.

تجارب الاستخدام الأولية تشير إلى أن الدقة ليست مطلقة؛ فالنظام قد يفشل في التقاط التفاصيل الدقيقة للهوية من المحاولة الأولى. تتيح جوجل للمشتركين إمكانية تصحيح النتائج عبر أوامر إضافية أو تزويد المحرك بصور مرجعية أكثر وضوحاً. هذا التطور يضع جوجل في منافسة مباشرة مع منصات مثل «ميدجورني» و«DALL-E»، لكن مع ميزة إضافية تتمثل في امتلاكها لأكبر قاعدة بيانات صور شخصية في العالم.

تؤكد الشركة أن ملفات المستخدمين لا تُستخدم لتدريب النماذج العامة للذكاء الاصطناعي، بل يقتصر الوصول على تحسين الاستجابات الفردية بشكل مجهول. الميزة بدأت في الظهور تدريجياً لمشتركي باقات «Google AI Plus» و«Pro» و«Ultra»، على أن تشمل متصفح كروم في مراحل لاحقة.

الوسوم

منذ 53 دقيقة

مقالات ذات صلة