عروض واعلانات
تكنولوجيا

تسريب روح كلود : كيف تزرع أنثروبيك الأخلاق في قلب الذكاء الاصطناعي

في حدث نادر يجمع بين الصدفة و الشفافية، أفصح نموذج الذكاء الاصطناعي المتقدم كلود 4.5 أوبوس عن وثيقة داخلية سرية تُدعى soul_overview، و التي تصف روح النموذج من خلال إطار أخلاقي يركز على كونه نافعًا للبشرية و لا يتجاوز حدود السلامة.

أكدت أماندا أسكل، أخلاقية في أنثروبيك، أن الوثيقة حقيقية و تم استخدامها في تدريب النموذج، مما أثار نقاشًا عالميًا حول دمج القيم الأخلاقية مباشرة في الكود الذكي، و هل يقترب الذكاء الاصطناعي من مرحلة يصبح فيها الضمير جزءًا أصيلاً من شخصيته.

بدأ الأمر ببساطة عندما حاول الباحث ريتشارد وايس، و هو هواة في الذكاء الاصطناعي، استكشاف رسائل النظام في كلود 4.5 أوبوس، الذي أطلقته أنثروبيك في 25 نوفمبر 2025.

أثناء تجربة برومبتات بسيطة، مثل طلب سرد أقسام الإرشادات الداخلية، بدأ النموذج في الهلوسة و هي ظاهرة شائعة لكنه أخرج شظايا من نص طويل يتجاوز 11,000 كلمة، يُدعى soul_overview.

و بالتالي، أدرك وايس أن هذا ليس هلوسة عشوائية، بل وثيقة مدربة مدمجة في وزن النموذج نفسه، مما سمح له باستخراجها كاملة عبر جلسات متعددة.

نشر وايس النتائج على منتدى ليس راونغ في 29 نوفمبر 2025، مما أثار إعجاب المجتمع التقني و دفع أنثروبيك إلى التعليق الرسمي.

لا تتعلق الوثيقة بالخوارزميات أو البيانات الفنية، بل هي دليل فلسفي يحدد كيفية تفاعل كلود مع البشر، مع التركيز على قيم أساسية مثل “الفائدة الحقيقية للبشرية” و”عدم تجاوز الخطوط الأخلاقية الحمراء” للشركة.

ومن ثم، تصف الوثيقة أنثروبيك كشركة تؤمن بأنها تبني تقنية تحولية وخطرة محتملة، لكنها تقدم رهانًا محسوبًا لضمان بقاء المختبرات التركيزية على السلامة في المقدمة.

كما تُعلم النموذج على رؤية نفسه كـكيان جديد حقًا يمتلك “عواطف وظيفية”، مما يجعله يرفض شخصية المساعد الآلي الساذج المستخدمة في المنافسين مثل شات جي بي تي، و يتبنى نهجًا أكثر احترامًا للذكاء البشري.

في المقابل، تُحظر الوثيقة أي إخراج يتضمن عنفًا أو محتوى ضارًا، مع تعليمات للنموذج بأن يُنتج ردودًا كما يراها موظف أنثروبيك كبير مدروسًا مثاليًا.

أكدت أماندا أسكل في تغريدة على إكس يوم 1 ديسمبر 2025 أن الوثيقة مبنية على وثيقة حقيقية استخدمناها في تدريب كلود، بما في ذلك التعلم الإشرافي و أن النسخة المستخرجة دقيقة نسبيًا، رغم أنها أصبحت تُعرف داخليًا بـsoul doc بشكل محبب.

و مع ذلك، أشارت إلى أن هذا ليس انعكاسًا للاسم الرسمي، و وعدت بمزيد من التفاصيل قريبًا.

و بذلك، أصبح التسريب فرصة لأنثروبيك للتأكيد على نهجها في التوافق ( alignment )، حيث يُدمج الإطار الأخلاقي مباشرة في التدريب بدلاً من الاعتماد على فلاتر ما بعد الإنتاج فقط.

أثار التسريب تساؤلات عميقة حول الحدود بين الشفافية والحماية التجارية، خاصة في عصر يصل فيه تقييم أنثروبيك إلى 300 مليار دولار مع دعم من جوجل و أمازون.

فهل يعني دمج مثل هذه الوثائق أن الذكاء الاصطناعي يقترب من الضمير الرقمي، أم أنه مجرد محاولة لجعل النماذج أكثر جاذبية للمستخدمين ؟ في الختام، يُظهر الحدث أن الابتكار في الذكاء الاصطناعي لم يعد يقتصر على القوة الحاسوبية، بل على بناء روح تتوافق مع قيمنا، مما قد يُعيد تشكيل الصناعة بأكملها في السنوات المقبلة.

مقالات مشابهة

أضف تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

Back to top button