تكنولوجيا

غوغل تطلق Gemini Omni لإنشاء فيديو «الأفاتار» وتدمجه في يوتيوب شورتس

نموذج جديد لإنتاج فيديو الأفاتار وتعديل المقاطع المسجلة

محرر أخبار تقنية في النيل نيوز، يهتم بتغطية المستجدات في عالم التكنولوجيا والإنترنت

أطلقت شركة غوغل نموذجها الجديد Gemini Omni المتخصص في توليد وتحرير مقاطع الفيديو فائقة الواقعية، معلنةً عن دمجه مباشرة في منصة يوتيوب شورتس لتمكين المستخدمين من إنشاء محتوى رقمي دون الحاجة للتصوير المباشر. تعتمد التقنية الجديدة على ميزة «الأفاتار» التي تتيح إنتاج مقاطع فيديو عمودية تحاكي صوت وشكل المستخدم بناءً على أوامر نصية، مع الحفاظ على تناسق الحركات وتفاصيل المشهد.

بدأت غوغل فعلياً إتاحة Gemini Omni لمشتركي خطط Google AI Plus وPro وUltra، في حين أكدت الشركة وصول الميزة لمستخدمي يوتيوب شورتس مجاناً بدءاً من الأسبوع الجاري. يمتلك النموذج قدرة على معالجة مدخلات هجينة تشمل النصوص والصور والمقاطع الصوتية، حيث يستند في عمله إلى نماذج الذكاء الاصطناعي الخاصة بالشركة لفهم قوانين الفيزياء واللغة الطبيعية لضمان دقة الحركة وظهور النصوص المكتوبة داخل الفيديو بشكل صحيح.

يتجاوز النموذج مهام التوليد نحو التحرير المتقدم للمقاطع المسجلة بواسطة كاميرات الهواتف؛ إذ يسمح بتغيير مواقع الكاميرا افتراضياً، واستبدال عناصر الخلفية، وإضافة شخصيات جديدة مع ضمان استمرارية بصرية دقيقة. بينما تتيح أدوات التحكم في Gemini Omni دمج صور لقطع ملابس محددة أو مقاطع صوتية لضبط إيقاع الحركة داخل الفيديو المولد، بالتزامن مع توفير هذه الأدوات عبر منصة Google Flow لتعزيز قدرات صناعة المحتوى.

أكدت غوغل أن Gemini Omni يحلل السياق الجغرافي والفيزيائي للمهام المطلوبة؛ فعند طلب إنتاج مشهد سباحة في منطقة جغرافية محددة، يقوم المحرك باستحضار خصائص المياه والإضاءة لتلك المنطقة لضمان الواقعية. تعتمد التقنية على معالجة الأوامر المعقدة التي تتطلب استجابة من مصادر بيانات متعددة لإنتاج مقطع فيديو واحد يدمج كافة التعليمات.

تتضمن ميزات التحرير الجديدة إمكانية إجراء عمليات «زوم أوت» لمقاطع مصورة مسبقاً مع استكمال تفاصيل البيئة المحيطة غير الموجودة في الكادر الأصلي. تهدف هذه الأدوات إلى تقليص الاعتماد على برامج المونتاج التقليدية، حيث يتم تنفيذ التعديلات عبر حوار مباشر مع المحرك الذكي.

مقالات ذات صلة