تكنولوجيا

بذكاء يضاهي GPT-5.. أوبن إيه آي تطلق نماذج صوتية تنهي “تلعثم” الآلة

نماذج جديدة تدعم 70 لغة وتكلفة تبدأ من سنتات للدقيقة

صحفي في قسم التكنولوجيا بمنصة النيل نيوز، يتابع أحدث الأخبار التقنية

أتاحت شركة “أوبن إيه آي” (OpenAI) ثلاثة نماذج صوتية جديدة عبر واجهة برمجة التطبيقات (API)، تدمج لأول مرة قدرات الاستدلال المنطقي مع الاستجابة اللحظية، في خطوة تهدف لتجاوز عقبة التأخير (Latency) التي أعاقت انتشار المساعدات الصوتية الذكية منذ ظهورها قبل عقد. وتتصدر هذه الحزمة نسخة (GPT-Realtime-2) التي تمتلك قدرات تفكير ومعالجة تعادل نموذج GPT-5 المرتقب، حيث صُممت لإدارة حوارات معقدة وفهم السياق وتعديل نبرة الصوت آليًا بناءً على حالة المستخدم الانفعالية، مع قدرة لافتة على التعامل مع المقاطعات البشرية أثناء الحديث.

ويعتمد النموذج الرئيسي على نافذة سياق ضخمة تصل إلى 128 ألف توكن، ما يتيح إجراء محادثات مطولة دون فقدان ترابط الأفكار، بينما حددت الشركة تكلفة المعالجة بـ 32 دولارًا لكل مليون توكن صوتي مدخل، و64 دولارًا للمخرجات. وبخلاف الأنظمة التقليدية التي تعتمد على تحويل الصوت لنص ثم معالجته، تعمل هذه النماذج بأسلوب “المعالجة المباشرة” (Native Multimodal)، وهي التقنية التي تسعى من خلالها الشركة للتفوق على المنافسين في قطاع خدمة العملاء والرعاية الصحية.

بالتزامن مع ذلك، أطلقت الشركة نموذج (GPT-Realtime-Translate) المتخصص في الترجمة الفورية لـ 70 لغة مدخلة إلى 13 لغة مخرجة، في حين بدأت شركة “دويتشه تليكوم” (Deutsche Telekom) فعليًا في اختبار النموذج لتمكين عملائها من التواصل بلغاتهم الأم دون انقطاع. وأكدت “أوبن إيه آي” أن هذا النظام يحافظ على إيقاع المتحدث الأصلي حتى عند استخدام مصطلحات تقنية أو لهجات محلية، مع توفير خيار التحكم في مستويات الاستدلال بين خمس درجات لموازنة السرعة مع عمق الإجابة.

وفي مسار موازٍ، يدعم نموذج (GPT-Realtime-Whisper) عمليات النسخ الصوتي المباشر وتحويل المحادثات إلى نصوص وترجمتها إلى ترجمة مرئية (Subtitles) فورية بمعدل تأخير شبه منعدم. وتفرض الشركة طبقات أمان صارمة داخل واجهة البرمجة لتعليق أي محادثة تنتهك سياسات الاستخدام، بينما تتوفر كافة النماذج حاليًا للاختبار عبر (Playground) أو التكامل البرمجي المباشر، بسعر 0.034 دولار للدقيقة لنموذج الترجمة، و0.017 دولار لنموذج النسخ النصي.

مقالات ذات صلة