الذكاء الاصطناعي يستخدم فيديوهات "تيك توك" كبيانات للتدريب
تحتاج نماذج الذكاء الاصطناعي حاليًا إلى البيانات التي يمكن أن تتدرب عليها حتى تتقن المهام المطورة لإنجازها، ولذلك تتسابق شركات التقنية العاملة في سوق الذكاء الاصطناعي نحو وضع أيديها على أي كلمة نصية، أو ثانية من فيديو، أو صورة رقمية، لاستخدامها لتدريب نماذجها لتكون أذكى من المنافسين.
ولذلك عندما خرجت تقارير تكشف عن سعي المدير التنفيذي السابق لشركة "Activision" بوبي كوتيك، إلى الاستحواذ على منصة "تيك توك"، وتضمنت قائمة"كوتيك" لممولي الصفقة اسم سام ألتمان، مؤسس ومدير أوبن إيه آي، لم يكن الأمر مفاجئًا أبدًا.
اقرأ أيضاً..دراسة تكشف تخلي الشركات عن استخدام كلمات المرور لمواجهة الذكاء الاصطناعي
وحاولت "ميرا موراتي"، المديرة التقنية بشركة "أوبن إيه آي"، أن تجيب على تساؤل "جوانا ستيرن"، محررة "وول ستريت جورنال"، بشأن البيانات التي تستخدمها شركتها لتدريب نموذجها الذكي المثير للجدل "Sora"، والمتخصص في إنشاء مقاطع فيديو من أوامر نصية، في حوار جمعهما معًا مؤخرًا.
ولكن "موراتي" حاولت المراوغة ولم تكن محددة، فقالت: "استخدمنا جميع الفيديوهات المتاحة للعامة على الإنترنت، بجانب الفيديوهات التي لدينا ترخيص مدفوع لاستخدامها".
وركزت مديرة "OpenAI" التقنية على أن نموذج "سورا" سيخرج للنور نهاية العام الجاري، لكن ذلك يتعلق بإجراء بعض التعديلات عليه لتقديم دقة أعلى لمحاكاة حركات اليدين، وكذلك حل بعض المشاكل الخاصة بمدى دقة المشاهد وواقعيتها.
ويمكن أن يتحقق ذلك بمزيد من التدريب على بيانات ممثلة في كم ضخم من الفيديوهات المتنوعة، لكن جمع وبناء قاعدة بيانات بهذا الحجم ستستغرق وقتًا طويلاً، إلا إذا كانت جاهزة بالفعل، لدى منصة بحجم "تيك توك".
وستكون قاعدة بيانات "تيك توك" من الفيديوهات بمثابة منجم ذهب بالنسبة لـ"أوبن إيه آي"، فمنصة الفيديوهات الشهيرة تستقبل أكثر من 34 مليون فيديو يوميًا، أغلبها يعتمد على تصوير مشاهد للبشر يؤدون أنشطة مختلفة ما بين الساخر والراقص والمشوّق، وكذلك التعليمي والترويجي.
شاهد أيضاً..