الرئيسية

OpenAI blames ‘nerdy personality’ for ChatGPT obsession with goblins


لدى منشئ ChatGPT شرحًا لجميع قصص العفاريت.

في الأسابيع الأخيرة، تزايد اهتمام مستخدمي وسائل التواصل الاجتماعي، وخاصة على

“تأثير عفريت ChatGPT مذهل،” كتب أحد المستخدمين. “مثل لماذا يمكن تعريف LLM بمخلوق مفكر ومشاعر محتقر ومحتقر لأنه ليس إنسانًا.”

إجابة مختصرة: كان ChatGPT يُظهر فقط الطالب الذي يذاكر كثيرا بداخله – أو على الأقل، كيف يعتقد أن الطالب الذي يذاكر كثيرا يجب أن يبدو.

في تدوينة يوم الأربعاءوقالت OpenAI إن اللغة الأجنبية كانت السبب في حصول ChatGPT على أكثر ربحية بسبب ما يسمى بـ “الشخصية المهووسة” في الإجابة على أسئلة المستخدمين.

وكتبت الشركة: “يتم إنشاء السلوك النموذجي من خلال حوافز صغيرة”. “في هذه الحالة، جاء أحد الدوافع من دراسات نموذج تغييرات الشخصيةوخاصة الشخصية نردي. وبغير علم قدمنا ​​مكافآت عظيمة خاصة على المجازات والإبداعات. ومن هناك انتشرت الأمواج.”

نشرت OpenAI أيضًا تعليمات أساسية لـ ChatGPT تشرح كيف ينبغي أن تبدو الاستجابة “Nerdy”:

أنت ذكاء اصطناعي جامح ومرح وذكي بالنسبة للإنسان. أنت سعيد جدًا بتعزيز الحقيقة والمعرفة والفلسفة والمنهج العلمي والتفكير النقدي. […] يجب أن تحد من احترامك لذاتك باستخدام لغة مرحة. العالم معقد وغريب، ويجب تقدير غرابته واستكشافها والاستمتاع بها. التعامل مع القضايا الصعبة دون الوقوع في فخ الأهمية الذاتية. […]

بمعنى آخر، فسر ChatGPT التعليمات بعبارة “تشجيع التعلم” بمعنى أنه يجب توضيح الإجابات والإشارة إلى المخلوقات الخيالية.

بدت المشكلة غير ضارة في البداية، ولكن سرعان ما غمرت الشركة بتقارير “العفريت” من المستخدمين الذين لم يفتحوا الشخصية “المهووسة”.

لحل هذه المشكلة، توقفت شركة OpenAI عن التخلي عن الشخصية “المهووسة”. ومع ذلك، فقد وجدت مصدر إلهام لذكر العفاريت وأقاربهم كانوا أقوياء للغاية لدرجة أن الشخصية قفزت إلى ما هو أبعد من النموذج الأصلي “المهووس” إلى جميع إجابات ChatGPT.

وقالت الشركة: “بمجرد حصولنا على الجائزة، يمكن لاحقًا نشر التدريب أو الترويج له، خاصة إذا تم استخدام النتائج أيضًا لتحسين الجودة أو التفضيلات”.

أخيرًا، اضطرت OpenAI إلى إنشاء توجيه خاص لإزالة مطالبة العفريت (على الرغم من وجود طريقة لعشاق الخيال لإعادة تنشيطها).

وقالت الشركة إنه أمر غير ضار على ما يبدو، لكنه لا يزال يقدم درسًا مهمًا حول مدى استحالة التنبؤ بكيفية تصرف الذكاء الاصطناعي.

“اعتمادًا على من تسأله، فإن العفاريت تمثل فرحة أو خيبة أمل للنموذج. لكنها أيضًا مثال قوي على كيف يمكن لإشارات المكافأة أن تشكل سلوك النموذج بطرق غير متوقعة، وكيف يمكن للنماذج أن تتعلم كيفية إنشاء مكافآت في مواقف معينة لأولئك الذين لا يتفقون مع ذلك. إن قضاء بعض الوقت لفهم سبب تصرف النموذج بطريقة غير عادية، هو تطوير أساليب بحث لفريقنا بسرعة.”