في اختبار مفاجئ أثار ضجة كبيرة في عالم التكنولوجيا، كشفت صحيفة واشنطن بوست أداء نماذج الذكاء الاصطناعي في توليد الصور وتعديلها، لتثبت أن المستقبل الإبداعي أصبح أقرب من أي وقت مضى. وشمل الاختبار 5 نماذج رئيسية متاحة لعامة المستخدمين، هي: Adobe Firefly، Bytedance Seedream Image 4.0، Gemini 3 Pro، ChatGPT-5، وMeta AI.
لم تكن الاختبارات عادية، بل تضمنت مهمات صعبة للغاية مثل تعديل وجوه المشاهير، وحذف شخصيات من صور جماعية، وتوليد تعابير وجه دقيقة لمشاعر الفرح، وحتى توليد صور أيدٍ معقدة بأصابع معقودة خلف الرأس، وهو ما يشكل أحد أصعب تحديات الذكاء الاصطناعي في الصور.
تفوق واضح لـ«جيميناي»
تمكن نموذج Gemini 3 Pro، التابع لغوغل، المعتمد على تقنية Nano Banana Pro، من التفوق في جميع الاختبارات تقريباً، محققاً دقة مذهلة في تعديل الصور وإضافة التفاصيل الدقيقة. وأبرز مثال كان حذف روبرت باتينسون من صورة تجمعه مع كريستيان ستيورات وإعادة ترتيب المشهد بطريقة شبه مستحيلة للتمييز عن الصورة الأصلية.
كما أبدع النموذج في تعديل ملامح الوجه، وإضافة الشعر، وإظهار عدد الأصابع بدقة غير مسبوقة، ما جعل لجنة التحكيم من خبراء التصوير والفن الرقمي تصف الأداء بأنه قفزة نوعية في عالم الذكاء الاصطناعي.
وعلى الرغم من الأداء الرائع، ارتكب النموذج خطأً مثيراً للجدل عند توليد صورة لممثل حائز على جائزة أوسكار، حيث استخدم ملامحه وأضاف توقيعاً وهمياً ينسب الصورة لمصور حقيقي، ما أثار انتقادات واضحة من أعضاء لجنة التحكيم.
في المقابل، حل نموذج Adobe Firefly في المرتبة الأخيرة، نتيجة اعتماده على صور مفتوحة المصدر فقط، ما حدّ من دقة وواقعية المخرجات مقارنة بالمنافسين.
لجنة التحكيم، التي ضمت المصور الصحفي ديفيد كارسون الحائز على جائزة بوليتزر، والفنانة الرقمية داليا دريسر، وخبير تعديل الصور براتيك نايك، أشادت بجودة الصور التقنية لـ Gemini 3 Pro، بينما وصفوا صور ChatGPT-5 بأنها الأكثر ابتكاراً وإبداعاً، رغم بعض الأخطاء الواقعية في الأيدي والوجوه.
ويمكن القول إن الاختبار أثبت أن الذكاء الاصطناعي لم يعد يقتصر على الابتكار الرقمي، بل أصبح قادراً على إنتاج صور واقعية شبه كاملة، مع تحديات واضحة في الملكية الفكرية والواقعية الكاملة للأيدي والتفاصيل الدقيقة، ما يجعل تدخل الإنسان الإبداعي ضرورياً للوصول إلى مستوى احترافي حقيقي.
In a surprise test that caused a huge stir in the tech world, The Washington Post revealed the performance of AI models in generating and modifying images, proving that the creative future is closer than ever. The test included 5 major models available to the general public: Adobe Firefly, Bytedance Seedream Image 4.0, Gemini 3 Pro, ChatGPT-5, and Meta AI.
The tests were not ordinary; they involved extremely difficult tasks such as modifying the faces of celebrities, removing individuals from group photos, generating accurate facial expressions for emotions like joy, and even generating images of hands with fingers crossed behind the head, which represents one of the toughest challenges for AI in images.
Clear Superiority of "Gemini"
The Gemini 3 Pro model, developed by Google and based on Nano Banana Pro technology, excelled in almost all tests, achieving remarkable accuracy in image modification and adding fine details. A standout example was removing Robert Pattinson from a photo with Kristen Stewart and rearranging the scene in a way that was nearly impossible to distinguish from the original image.
The model also excelled in modifying facial features, adding hair, and accurately displaying the number of fingers, which led the judging panel of photography and digital art experts to describe its performance as a qualitative leap in the world of AI.
Despite its outstanding performance, the model made a controversial mistake when generating an image of an Oscar-winning actor, as it used his features and added a fake signature attributing the image to a real photographer, which drew clear criticism from the judging panel members.
In contrast, the Adobe Firefly model ranked last due to its reliance on open-source images only, which limited the accuracy and realism of the outputs compared to its competitors.
The judging panel, which included Pulitzer Prize-winning photojournalist David Carson, digital artist Dalia Dreiser, and photo editing expert Pratik Naik, praised the technical quality of Gemini 3 Pro's images, while they described ChatGPT-5's images as the most innovative and creative, despite some realistic errors in the hands and faces.
It can be said that the test proved that AI is no longer limited to digital innovation; it has become capable of producing nearly complete realistic images, with clear challenges in intellectual property and the full realism of hands and fine details, making human creative intervention essential to reach a true professional level.