منوعات

صراع عمالقة التكنولوجيا الصينية: Tencent و ByteDance تتحديان DeepSeek في سباق الذكاء الاصطناعي

كتب: عمرو خالد

يشهد عالم الذكاء الاصطناعي تنافسًا شديدًا، خاصةً مع ظهور نماذج لغوية متقدمة تتميز بقدرات استنتاجية وإدراكية عالية. فبعدما أعلنت شركة DeepSeek عن نموذجها R1 الشهر الماضي، سارعت كل من Tencent و ByteDance إلى إطلاق نماذجهما الخاصة للدخول في هذا السباق المحموم.

Tencent ونموذج Hunyuan T1: منافس قوي لـDeepSeek

أطلقت Tencent نموذجها للاستدلال Hunyuan T1، والذي يعتمد على تقنية التعلم المعزز واسع النطاق (LSRL)، وهي نفس التقنية التي استخدمتها DeepSeek. وقد تم اختبار النموذج الجديد عبر روبوت الدردشة Yuanbao، محققًا نتائج مبهرة. فقد سجل 87.2 نقطة في اختبار Massive Multitask Language Understanding (MMLU) Pro، متفوقًا على DeepSeek-R1 (84 نقطة)، وإن كان لا يزال أقل من نموذج o1 من OpenAI (89.3 نقطة).

كما حقق Hunyuan T1 نتائج متميزة في اختبارات أخرى، مثل اختبار AIME 2024 للرياضيات (78.2 نقطة) واختبار C-Eval لتقييم قدرات اللغة الصينية (91.8 نقطة)، مُنافسًا بذلك DeepSeek-R1 بأداء قريب جدًا.

أما من حيث التكلفة، فيتبع Hunyuan T1 نفس نهج DeepSeek-R1 تقريبًا، مع سعر إدخال بيانات يبلغ 1 يوان صيني لكل مليون رمز خلال النهار، و 4 يوانات لكل مليون رمز كمخرجات، وهو سعر أقل من سعر DeepSeek-R1 خلال النهار، بينما يتساوى السعران ليلاً.

هيكلية هجينة لتحسين الأداء وتقليل التكاليف

تعتمد تقنية Hunyuan T1 على هيكلية هجينة تجمع بين Transformer (من جوجل) و Mamba (من جامعتي كارنيجي ميلون وبرينستون)، مما يساهم في تقليل تكاليف التدريب والاستخدام، وخفض استهلاك الذاكرة، وتعزيز كفاءة المعالجة.

ByteDance و تقنية DAPO: نقلة نوعية في التعلم المعزز

لم تتوقف المنافسة عند Tencent، فقد كشفت ByteDance، المالكة لتطبيق تيك توك الشهير، عن تقنية DAPO (اختصار لـDecoupled Clip and Dynamic Sampling Policy Optimisation)، وهي خوارزمية جديدة تعتمد على التعلم المعزز القابل للتوسع، وتُحسّن من قدرات نماذج الاستدلال. يمكنك الاطلاع على المزيد من التفاصيل حول تقنية DAPO هنا.

تُساعد هذه الخوارزمية النماذج اللغوية الكبيرة على تطوير مهاراتها في الإدراك والتفكير المعقد، من خلال تحسين آليات التحقق الذاتي من المعلومات وتنقيتها. وقد أظهرت نتائج الاختبار تفوقها على تقنية GRPO التي تستخدمها DeepSeek، حيث سجلت 50 نقطة في اختبار AIME 2024 للرياضيات عند تطبيقها على نموذج Qwen2.5-32B من علي بابا، متفوقة على DeepSeek-R1 (47 نقطة) بنفس النموذج.

ومن أبرز مميزات DAPO، تقليل عدد خطوات التدريب بنسبة 50%، مما يجعلها أكثر كفاءة وأقل استهلاكًا للطاقة الحاسوبية.

وقد لاقت هذه التقنية إشادة واسعة من الخبراء، حيث وصفها المهندس في Google DeepMind فيليب شميد بأنها أفضل من نهج GRPO المستخدم في DeepSeek.

يُظهر هذا التنافس الشديد بين شركات التكنولوجيا الصينية تصميمها على المنافسة بقوة في مجال الذكاء الاصطناعي، مُقدمة نماذج جديدة بأسعار تنافسية، وتقنيات متطورة، مما يعزز من مكانة الصين كلاعب رئيسي في هذا السوق المتنامي.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى