تكنولوجيا

فشل كاشفات الذكاء الاصطناعي: معركة ويكيبيديا ضد المحتوى الآلي

مهارة 'المُبشّرن' في كلود تكشف ثغرات أدوات الكشف عن الكتابة الآلية

صحفي في قسم التكنولوجيا بمنصة النيل نيوز، يتابع أحدث الأخبار التقنية

في محاولة لمواجهة تدفق المحتوى الآلي، تضمنت إرشادات محرري ويكيبيديا قواعد صارمة تهدف إلى استبدال اللغة المنمقة بالحقائق المجردة. على سبيل المثال، يوجهون كلود لاستبدال عبارة: “تأسس المعهد الإحصائي لكتالونيا رسمياً عام 1989، مسجلاً لحظة محورية في تطور الإحصاءات الإقليمية في إسبانيا” بعبارة أكثر وضوحاً: “تأسس المعهد الإحصائي لكتالونيا عام 1989 لجمع ونشر الإحصاءات الإقليمية”.

هذا التكتيك يكشف عن قدرة النماذج اللغوية على التكيف، حيث يقرأ كلود هذه الإرشادات ويبذل قصارى جهده، كآلة مطابقة للأنماط، لإنشاء مخرجات تتناسب مع سياق المحادثة أو المهمة المطلوبة.

لماذا تفشل أدوات كشف الكتابة بالذكاء الاصطناعي؟

حتى مع هذه المجموعة الواثقة من القواعد التي صاغها محررو ويكيبيديا، سبق وأن كتبنا عن سبب عدم عمل كاشفات الكتابة بالذكاء الاصطناعي بشكل موثوق: لا يوجد شيء فريد بطبيعته في الكتابة البشرية يميزها بشكل موثوق عن كتابة نماذج اللغة الكبيرة.

أحد الأسباب يكمن في أنه على الرغم من ميل معظم نماذج الذكاء الاصطناعي لأنماط لغوية معينة، يمكن توجيهها لتجنبها، كما هو الحال مع مهارة “المُبشّرن”. وهو ما واجهته OpenAI في صراعها المستمر لسنوات ضد الشرطة الطويلة (em dash).

بل إن البشر أنفسهم قد يكتبون بأساليب تشبه الروبوتات الدردشة. على سبيل المثال، هذا المقال، الذي صاغه كاتب محترف، قد يحمل سمات تثير كاشفات الذكاء الاصطناعي – خاصة إذا استخدمنا حتى شرطة طويلة واحدة – لأن معظم نماذج اللغة الكبيرة التقطت تقنيات الكتابة من أمثلة الكتابة الاحترافية التي جُمعت من الويب.

وعلى هذا المنوال، تضمنت إرشادات ويكيبيديا تحذيراً جديراً بالاهتمام: فبينما تشير القائمة إلى بعض المؤشرات الواضحة، على سبيل المثال، لاستخدام ChatGPT غير المعدل، إلا أنها لا تزال تتألف من ملاحظات وليست قواعد صارمة. دراسة أولية نُشرت عام 2025، واستُشهد بها في الصفحة، وجدت أن المستخدمين الكثيفين لنماذج اللغة الكبيرة يكتشفون المقالات المولدة بالذكاء الاصطناعي بدقة تبلغ حوالي 90% من الوقت. لكن هذا يبدو رائعاً حتى تدرك أن 10% من هذه الاكتشافات هي إيجابيات كاذبة، وهو ما يكفي لإمكانية استبعاد بعض الكتابات عالية الجودة في سعي الكشف عن المحتوى الرديء.

بالنظر إلى كل هذا، ربما يعني ذلك أن عمل كشف الذكاء الاصطناعي قد يحتاج إلى التعمق أكثر من مجرد الإشارة إلى صياغات معينة، ليتغلغل في المحتوى الوقائعي الجوهري للعمل نفسه.

مقالات ذات صلة