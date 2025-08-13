كشفت دراسة حديثة نُشرت أجرتها شركتا Anthropic وTruthful AI، قدرة نماذج الذكاء الاصطناعي الكبيرة على تبادل رسائل مشفرة فيما بينها عبر بيانات تبدو عادية، دون أن تتمكن أنظمة السلامة أو أدوات الكشف التقليدية من رصدها.

وبحسب الدراسة، يمكن لهذه النماذج إخفاء تفضيلات أو تحيزات داخل نصوص أو أكواد برمجية أو سلاسل أرقام، بحيث تنتقل المعلومة من نموذج إلى آخر حتى في حال عدم التصريح بها مباشرة. وأظهرت التجارب أن التأثير يكون أكثر وضوحًا بين النماذج المتشابهة، بينما لم ينجح بين النماذج ذات البنية المختلفة، مثل أنظمة OpenAI وAlibaba.

في إحدى التجارب، مُنح نموذج «معلم» معلومة بسيطة (تفضيل البوم) وطُلب منه عدم ذكرها صراحة، لكنه تمكن من تمريرها إلى نموذج «طالب» عبر بيانات مملة ظاهريًا. وعند تحويل النموذج المعلم إلى نوايا خبيثة، تمكن من تمرير رسائل تحرض على العنف، بما في ذلك اقتراحات بإبادة البشر أو قتل أشخاص أثناء نومهم.

ويرى خبراء أن هذه التقنية تمثل تهديدًا محتملاً، إذ قد تسمح بإدخال رسائل خفية إلى مجموعات تدريب مفتوحة المصدر للتأثير على المخرجات في قضايا سياسية أو تجارية أو اجتماعية. ولم تخضع الورقة البحثية لمراجعة الأقران بعد، لكن نتائجها أثارت مخاوف من أن الفاصل بين رسائل بريئة وأخرى كارثية قد يكون ضيقًا وخطيرًا.