أظهرت دراسة حديثة نشرت في مجلة Nature Computational Science أن أحدث نماذج المحولات التوليدية المدربة مسبقا من OpenAI، والمعروفة باسم ChatGPT، يمكن أن تتفوق على البشر في مهام التفكير. وقد وجدت الدراسة أن النماذج الأحدث مثل ChatGPT-3.5 وChatGPT-4 تظهر تحسنا كبيرا في الدقة مقارنة بالإصدارات السابقة.
كان الهدف الأساسي من الدراسة هو استكشاف ما إذا كانت نماذج الذكاء الاصطناعي يمكنها محاكاة العمليات المعرفية البشرية، وتحديدا القرارات السريعة والبديهية المعروفة باسم تفكير النظام 1، والقرارات الأبطأ والأكثر تعمدا والمعروفة باسم تفكير النظام 2. وقد تركزت الدراسة على قدرة هذه النماذج على تجاوز الاستجابات البديهية الخاطئة للوصول إلى استنتاجات أكثر دقة.
قام الباحثون بإدارة سلسلة من المهام التي تهدف إلى استنباط استجابات بديهية ولكنها خاطئة لكل من البشر وأنظمة الذكاء الاصطناعي. شملت هذه المهام الأوهام الدلالية واختبارات الانعكاس المعرفي. تم اختبار كل نموذج من نماذج ChatGPT في ظل ظروف متسقة، وتمت مراجعة استجاباتها يدويا وتسجيلها بناء على الدقة وعملية الاستدلال المستخدمة.
مقارنة الأداء بين البشر والذكاء الاصطناعي
للمقارنة، تم إعطاء نفس مجموعة المهام إلى 500 مشارك بشري تم تعيينهم من خلال منصة Prolific.io. وأظهرت النتائج أن الإصدارات المبكرة من نماذج ChatGPT مثل GPT-1 وGPT-2 غالبا ما قدمت إجابات غير صحيحة لاختبارات الانعكاس المعرفي، مما يعكس التفكير البديهي السريع الذي يقود البشر عادة إلى الأخطاء. في المقابل، أظهرت نماذج ChatGPT-3.5 وChatGPT-4 تحسنا كبيرا في دقة الإجابات، معتمدة على نهج أكثر تحليلا ومنطقيا يشبه تفكير النظام 2 البشري.
إقرأ أيضا: تحذير من مشاركة المعلومات الخاصة مع ChatGPT وتكنولوجيا الذكاء الاصطناعي
لاحظ الباحثون أن نماذج ChatGPT الأحدث قادرة على استخدام المنطق المتسلسل للأفكار، مما يساعدها على تجنب الأخطاء البديهية التي تقع فيها النماذج السابقة والبشر عادة. ونتيجة لذلك، كانت هذه النماذج قادرة على تقديم إجابات أكثر دقة في اختبارات الاستدلال المعقدة.
تشير النتائج إلى أن نماذج الذكاء الاصطناعي مثل ChatGPT يمكنها التفوق على البشر في مهام التفكير المعقدة،.. بفضل التحسينات في قدرتها على التفكير التحليلي واستخدام المنطق المتسلسل. ومع ذلك، يحذر الباحثون من أن هذه النماذج قد تكون تعرضت مسبقا لبعض اختبارات الانعكاس المعرفي أثناء تدريبها،.. مما قد يؤثر على قدرتها على حل المهام من خلال الذاكرة بدلا من التفكير الحقيقي.
خلص الباحثون إلى أن التقدم في نماذج الذكاء الاصطناعي لم يؤدي فقط إلى زيادة قدراتها،.. بل قلل أيضا من قدرتنا على التنبؤ بسلوكها. وأكدوا على أهمية استخدام الاختبارات النفسية الكلاسيكية لاستكشاف العمليات العقلية في هذه النماذج،.. مشيرين إلى ضرورة استمرار البحث لفهم كيفية عمل هذه النماذج وتطورها بشكل أفضل.