علي بابا تطلق نموذج ذكاء اصطناعي قادرًا على قراءة المشاعر البشرية لمنافسة OpenAI
أعلنت شركة "علي بابا" الصينية عن تطوير نموذج ذكاء اصطناعي جديد يحمل اسم R1-Omni، وهو قادر على تحليل المشاعر البشرية من خلال ملامح الوجه في مقاطع الفيديو، بالإضافة إلى وصف الملابس والبيئة المحيطة.
يأتي هذا الابتكار في إطار مساعي الشركة لتعزيز مكانتها في مجال الذكاء الاصطناعي ومنافسة النماذج المتقدمة التي تطورها "أوبن إيه آي" الأمريكية.
تقنية متطورة لتحليل المشاعر
وتم تطوير النموذج في مختبر "تونجي" التابع لـ"علي بابا"، وهو نسخة محسنة من نموذج HumanOmni الذي طوره الباحث جياشينج تشاو.
ويعتمد R1-Omni على تقنية التعلم المعزز مع المكافأة القابلة للتحقق "RLVR"، ما يجعله قادرًا على تحليل المشاعر باستخدام الصور والفيديو والصوت، حيث يمثل هذا التقدم إضافة نوعية في مجال الرؤية الحاسوبية، حيث يعزز دقة فهم المشاعر البشرية مقارنة بالنماذج السابقة.
اقرأ أيضًا: «علي بابا» تنافس «تشات جي بي تي» بروبوت بمكبرات صوت ذكية
آلية التدريب والاختبار
وخضع النموذج لتدريب مكثف باستخدام 580 مقطع فيديو من مجموعتي بيانات رئيسيتين هما EMER، التي تركز على شرح كيفية اشتقاق المشاعر، وHumanOmni، التي تحتوي على بيانات مصنفة يدويًا، كما تم تحسين دقته عبر نظام مكافآت ذكي يساعده في تقديم توقعات أكثر موثوقية.
وتم اختبار R1-Omni على مقاطع فيديو حقيقية، حيث أظهر قدرته على تحليل المشاعر بدقة، ففي أحد الاختبارات، حلل مشهد لامرأة شابة تنظر للأسفل بتفكير واضح، حيث لاحظ تغير تعابير وجهها تدريجيًا من الارتباك إلى الغضب البسيط، إلا أن التصنيف النهائي للنموذج اختلف عن التصنيف البشري، مما يبرز تحديات فهم المشاعر الدقيقة.
منافسة متصاعدة في الذكاء الاصطناعي
تأتي هذه الخطوة في ظل تصاعد المنافسة في مجال الذكاء الاصطناعي، خاصة بعد بروز شركة DeepSeek الصينية، وتوسع "علي بابا" في تقديم تقنيات جديدة، بما في ذلك شراكتها مع "أبل" لتوفير الذكاء الاصطناعي على أجهزة "آيفون" داخل الصين.
كما أن نموذجها الجديد يتاح مجانًا عبر منصة Hugging Face، في خطوة تهدف إلى جذب المستخدمين، خاصة مع التكلفة المرتفعة لنموذج GPT-4.5 من OpenAI، الذي يتوفر فقط ضمن باقة اشتراك بقيمة 200 دولار شهريًا.
تطبيقات الذكاء العاطفي
ويمثل R1-Omni تطورًا ملحوظًا في مجال الذكاء العاطفي، حيث يمكن استخدامه في تحسين تفاعل روبوتات الدردشة مع العملاء، ورصد علامات التعب لدى السائقين، مما يعزز من إمكانيات الذكاء الاصطناعي في فهم المشاعر والاستجابة لها بذكاء أكبر.