OpenAI ترد على جوجل بنموذج ImageGPT… هل فشلت في المنافسة ؟

تيلي ناظور : نوفل سنوسي
أعلنت شركة OpenAI عن إصدار نموذجها الجديد لتوليد الصور بالذكاء الاصطناعي، و الذي يحمل اسم ChatGPT ImageGPT 1.5.
و يأتي هذا الإعلان في سياق سباق متسارع بين كبرى شركات التقنية لتطوير نماذج مرئية ذكية، ويُنظر إلى النموذج الجديد كخطوة من OpenAI للرد على نموذج نانو بانانا المتقدم من شركة Google، و الذي أحدث ضجة في عالم الذكاء الاصطناعي المرئي.
و رغم الزخم الذي رافق الإعلان، فإن التجارب الأولية على ImageGPT 1.5 كشفت عن نقاط ضعف كبيرة، خاصة في تعامله مع اللغة العربية.
فالمستخدمون اشتكوا من ضعف في فهم التعليمات النصية بالعربية، بالإضافة إلى الهلوسة البصرية في النتائج، حيث يُدخل النموذج عناصر غير منطقية، و يبالغ في إبراز تفاصيل معينة بشكل لا يخدم جمالية الصورة أو دقتها.
في الوقت الذي تُراهن فيه OpenAI على ImageGPT كأداة منافسة، يرى العديد من المتابعين أن النموذج لم يرتقِ بعد لمستوى النماذج المنافسة، و على رأسها nano banana من Google، و الذي يُعد اليوم واحدًا من أكثر النماذج دقة و واقعية في توليد الصور.
رغم أن إطلاق ImageGPT 1.5 يُعد مؤشرًا على استمرار الابتكار داخل OpenAI، إلا أن النتائج الحالية للنموذج لا ترقى لتطلعات المستخدم العربي، و لا تنافس جدياً النماذج القوية التي دخلت السوق بقوة في الأشهر الأخيرة.
السباق نحو الذكاء الاصطناعي التوليدي مستمر… ولكن من يتأخر اليوم، قد يخرج من اللعبة غدًا.
من بين أبرز التحديات التي يواجهها ImageGPT 1.5 هو افتقاره للقدرة على فهم السياق الثقافي و اللغوي للنصوص باللغة العربية.
فغالبًا ما تأتي الصور الناتجة غير منسجمة مع خلفية المجتمعات الناطقة بالعربية، سواء من حيث الملابس أو المعمار أو حتى الرموز البصرية المستخدمة.
هذا الخلل يعكس ضعفًا في تدريب النموذج على بيانات عربية كافية و متنوعة، و هو ما يجعل التجربة أقل فعالية للمستخدمين في المنطقة.
في ظل الصعود المتسارع لنماذج مثل نانو بانانا و جيميناي التي باتت تقدم حلولًا متكاملة لتوليد الصور بجودة عالية و فهم عميق للسياقات المتعددة، تجد OpenAI نفسها في وضع لا يُحسد عليه.
إذ أن صورة الريادة التي اعتادت الشركة الحفاظ عليها بدأت تتآكل بفعل التحديثات السريعة و الذكية التي تقدمها الشركات المنافسة، خصوصًا Google.
إذا أرادت OpenAI استعادة مكانتها، فإنها مطالبة بإعادة النظر في استراتيجيتها تجاه دعم اللغات غير الإنجليزية، و على رأسها اللغة العربية، فضلًا عن تعزيز آليات الفهم البصري و السياقي داخل نموذجها.
تحسين تجربة المستخدم و نتائج الصور ليس خيارًا، بل ضرورة ملحة للبقاء ضمن دائرة التنافس.




