"أبل" تطلق نموذج "MGIE" لتحرير الصور بقدرات فائقة
كشفت شركة أبل بالتعاون مع باحثين من جامعة كاليفورنيا عن "MLLM-Guided Image Editing" والتي يُطلق عليها اختصارًا "MGIE"، وهو نموذج متعدد الوسائط قادر على تحرير الصور من خلال أوامر نصية بسيطة.
تُشير هذه التطورات إلى دخول "أبل" إلى مجال تحرير الصور بالذكاء الاصطناعي، ما يمثل خطوة مهمة في جهود الشركة لتطوير الذكاء الاصطناعي.
قدرات النموذج الجديد
يُمثل نموذج "MGIE" نقطة تحول في استكشاف "أبل" لتطبيقات الذكاء الاصطناعي، إذ يستغل قوة النماذج اللغوية الكبيرة متعددة الوسائط لتفسير الأوامر النصية وتنفيذ التعديلات على الصور.
كما يقضى هذا النموذج على الحاجة إلى وصف تفصيلي، ما يتيح للمستخدمين نقل تعليماتهم للتحرير بسهولة من خلال أوامر اللغة الطبيعية.
اقرأ أيضًا: "أبل" تعمل على إنتاج أجهزة قابلة للطي
يبزر "MGIE" بقدرته على فهم التعليمات الدقيقة، ووفقًا للورقة البحثية المُصاحبة للنموذج، فإن الأدوات التقليدية تفشل في التحرير عند مواجهة أوامر غامضة أو موجزة، ما يؤدي إلى نتائج دون المستوى.
ويتجاوز "MGIE" هذه القيود من خلال استغلال النماذج اللغوية الكبيرة لفهم النية وراء التعليمات التعبيرية، ما يعزز قدراته في التحرير.
كما يحول النموذج الصور الداخلية بسلاسة استنادًا إلى تعليمات المستخدم، فعندما يُكلف بجعل البيتزا أكثر صحة، يُضيف النموذج بشكل بديهي الخضروات إليها ما يخلق صورًا جذابًا ومغذية.
ويتوافق "MGIE" في التقاط التفاصيل المعقدة مثل انعكاس البرق على سطوح المياه، ما يُظهر دقته وتنوعه الفائق.
اقرأ أيضًا: الكشف عن ميزات الذكاء الاصطناعي في أجهزة "أبل" العام الجاري
ويؤكد إطلاق "أبل" لهذا النموذج على التزامها بتعزيز الابتكار والتعاون داخل مجتمع الذكاء الاصطناعي، وتدعو الشركة المطورين إلى استكشاف النموذج والمساهمة في تطور التكنولوجيا.
شاهد أيضًا: