Imagen 4: جوجل تُطلق أحدث نماذجها لتوليد الصور.. هل تنافس DALL-E 3؟

أطلقت جوجل رسميًا أحدث طفل لها في عالم الذكاء الاصطناعي، نموذج Imagen 4، لتوليد الصور من النصوص. يأتي هذا الإصدار الجديد بوعد بتطورات كبيرة في دقة عرض النصوص داخل الصور مقارنة بالإصدار السابق، Imagen 3. ولمن يبحث عن دقة مُتناهية وتطابق تام مع التعليمات، تقدم جوجل أيضًا Imagen 4 Ultra، وإن كان ذلك بتكلفة إضافية.
تجربة Imagen 4 عبر واجهة برمجة التطبيقات
أتاحت جوجل كلا النموذجين للتجربة الأولية عبر واجهة برمجة التطبيقات Gemini API، مقابل رسوم رمزية، مع إتاحة تجربة محدودة مجانية عبر منصة Google AI Studio. تُشير جوجل إلى أن Imagen 4 هو “الخيار الأمثل لمعظم المهام”، بتكلفة 0.04 دولار للصورة الواحدة. أما Imagen 4 Ultra، فيُكلف 0.06 دولار للصورة، أي بزيادة 50%.
نماذج جوجل تُنافس عمالقة توليد الصور
استعرضت جوجل بعض الصور التي ولّدها Imagen 4، منها قصة مصورة تُظهر مركبة فضائية تتعرض لهجوم من كائن فضائي. أظهرت الصور دقةً في مطابقة التعليمات، وإن بدت كأنها من تطبيق رسوم ثلاثية الأبعاد. يمكنكم الاطلاع على المزيد من الأمثلة على مدونة جوجل الرسمية. ورغم التطورات الملحوظة في Imagen 4، إلا أن الانطباع العام يُشير إلى أنه لا يزال خلف منافسين أقوياء، مثل DALL-E 3 من OpenAI و Midjourney 7، وذلك في مجال توليد الصور تحديدًا، بينما يُظهر نموذج Veo 3 من جوجل تقدمًا ملحوظًا في مجال توليد الفيديو.
تكلفة استخدام Imagen 4
يُعتبر عامل التكلفة من أهم العوامل التي تؤثر على اختيار المستخدمين للنموذج المناسب. وفي حين أن Imagen 4 يُقدم تكلفة مُنافسة، تبرز أهمية مُقارنة الجودة المُقدمة من النماذج المُختلفة قبل اتخاذ القرار.









