تكتيك بسيط يساعد على تقليص التحيز في الذكاء الاصطناعي
التحيز جزء من الطبيعة البشرية، ولأن الإنسان يصنع الآلات فقد نقل التحيز إليها بشكل غير متعمد. في وقتنا الحالي، يستحيل عدم رؤية تأثيرات وتداعيات تحيز البشر بحق بعضهم البعض، والآن تم إضافة تحيز الآلات إلى المعادلة ما جعلنا في وضع خطر للغاية.
الضرر وخطورة التحيز الآلي مشكلة من شقين، الشق الأول هو التأثير، فالإنسان يثق بموضوعية الذكاء الاصطناعي بشكل كبير جداً وبالتالي إن لم يتم رصد التحيز الذي تم إدخاله خلال عملية التدريب فإن المشكلة ستتضاعف. الشق الثاني يتعلق بالأتمتة، ففي بعض الأحيان يتم توصيل نماذج الذكاء الاصطناعي بوظيفة برمجية ما يؤدي الى أتمتمة التحيز، وهذا يجعلنا في وضع حرج للغاية.
ما هو تحيز الذكاء الاصطناعي؟
تحيز الذكاء الاصطناعي هو حين تقوم الخوارزميات خصوصاً تلك التي تعتمد على التعلم العميق، بالتمييز بين الأشخاص على أساس العرق أو الجنس وغيرها. وكما سبق وقلنا التحيز يتسرب إلى الخوارزميات من خلال بيانات التدريب أو خلال عملية إعداد البيانات.
على سبيل المثال إذا تم تغذية خوارزمية التعلم العميق بصور الوجوه ذات البشرة الفاتحة أكثر مما يتم تغذيتها بصور الوجوه ذات البشرة الداكنة فحينها التحيز سيكون لأصحاب البشرة الفاتحة. كما يمكن إدخال التحيز خلال مرحلة إعداد البيانات، والتي تتضمن تحديد السمات التي تريد للخوارزمية أن تضعها في الاعتبار.
لماذا لا يتم بكل بساطة إزالة المتغيرات الحساسة من البيانات؟
السؤال المباشر الذي قد يخطر على بال أي شخص كان هو عن سبب عدم القيام بإزالة المتغييرات الحساسة من البيانات من أجل القضاء كلياً على التحيز؟
في الواقع الأمر ليس بهذا البساطة والتخلص من المتغيرات الحساسة لا يحل المشكلة. حتى لو تم التخلص من المتغيرات الحساسة فإن إرتباطها ببيانات أخرى سيبقى، فالبيانات عبارة عن مجموعة من المعلومات والأرقام والنتائج المرتبطة ببعضها البعض ووسائل التعلم الآلي يمكنها أن تستنتج ،عن طريق الاحتمالات، المتغيرات الخفية أي التي تم التخلص منها. فخوارزميات التعلم الآلي قادرة وبكل بساطة على إعادة تعريف البيانات من خلال بيانات أخرى موجودة فيها وبالتالي ستبني حكمها على معطيات متحيزة.
«اختبار التذوق الأعمى» للقضاء على التحيز
اختبار التذوق الأعمى موجود منذ عقود وهو تذوق شيء ما من دون معرفة ماهيته وتقييمه بالاعتماد على حاسة التذوق فقط.
في السبيعينيات راج اختبار تذوق أعمى لكوكا كولا وبيبسي، أي تحديد أي مشروب يفضلون من دون معرفة الإسم (الهوية). النتيجة كانت أن الغالبية فضلت بيبسي على كوكا كولا، ولكن على أرض الواقع وبمجرد معرفة «الماركة» فإن التحيز كان يصب لصالح كوكا كولا على حساب منافسه.
الخلاصة هي أن إزالة المعلومات المتعلقة بالهوية، في هذه الحالة، غلاف كوكا كولا، أزال التحيز بشكل كلي ودفع الناس للإعتماد على حاسة التذوق فقط.
وعليه اختبار التذوق الأعمى قلل من نسبة التحيز لدى البشر من خلال إزالة معلومات التعريف الرئيسية من عملية التقييم، ويمكن اعتماد نهج مشابه للتخلص من التحيز عند الآلات. ولكن لا يجب التوقف هنا، لأنه كما سبق وذكرنا، إزالة الهوية لن يحل المشكلة، فهناك مسارات أخرى إضافية يجب اعتمادها سواء لناحية التجربة والتقييم والتعديل.
دراسة حالة: التحيز في تكرار نتائج الدراسات العلمية
في عالم الطب والعلوم يتم نشر نتائج التجارب السريرية، ثم تقوم مجموعة من العلماء بتقييمها من أجل تحديد قابلية تكرارها على أرض الواقع. والنتيجة هي أن ٨٦٪ من الدراسات العلمية المنشورة في مجال الأدوية وعلم الأحياء والعلوم الإجتماعية غير قابلة للتكرار، وفق تقييمات العلماء، ما يؤدي الى خسائر سنوية تقدر ٢٨ بليون دولار كما أنها تؤخر عمليات أساسية وهامة وحيوية للبشر مثل إكتشاف اللقاحات وإكتشاف علاجات لبعض الأمراض كما حصل خلال جائحة كورونا.
المشكلة الأساسية هنا تتمحور حول التحيز، فحين يقوم العلماء بمراجعات التنائج فالتركيز يكون على المعطيات الكمية مع تجاهل كليا للمعطيات النوعية، أي منح الأرقام أهمية على حساب الكلمات.مراجعات البشر بدروها تتأثر بالهوية، كإسم الجامعة التي أجرت بالبحث مثلاً. هذه الصورة يتم نقلها الى أجهزة الذكاء الإصطناعي التي تقيم بتحيز مماثل لتحيز البشر. للتخلص من التحيز، فإن إختبار التذوق الأعمى يعني التخلص من الهوية، ثم الاعتماد على البيانات النوعية لدعم أو نقض البيانات الكمية من خلال مسار من محدد قائم على التجربة والتدقيق والمقارنة.
تطبيق منهجية «التذوق الأعمى» في عالم الأعمال
اختبار التذوق الأعمى يمكن تطبيقه في عالم الأعمال لتقليص التحيز من أجل الحصول على نتائج أفضل. لنأخذ على سبيل المثال ما يحدث عند تحليل الأداء المالي للشركات الكبرى أمام المساهمين والمحللين. «الجمهور»هنا سيستخدم المضمون للتبؤ بأداء الشركة المستقبلي والذي يؤثر بسرعة وبقوة على أسعار الأسهم .
ولكن المتلقي البشري متحيز فهو يميل لإستخدام الأرقام التي تم عرضها، وليس البيانات النوعية ، كما أنه يميل لمنح هوية الشخص المتحدث أهمية كبرى، مثلاً التحيز سيكون لجيف بيزوس أو إيلون ماسك ولما يقولونه مقارنة بغيرهم الأقل شهرة.
أنظمة الذكاء الاصطناعي يمكنها أن تنظر إلى ما هو أبعد من المعلومات التي تحفز التحيز والتعامل مع العوامل النصية «الكلمات وليس الأرقام» وغيرها من العوامل الأخرى لتقديم تقييمات موضوعية يمكن الإستناد عليها لإتخاذ القرارات حين يتم تدريبها بشكل صحيح.
لماذا وضعت قمة العشرين الابتكار ضمن أهم ملفاتها وكيف يطبق واقعيا؟
مفاتيح رئيسة لإدارة التحيز عند بناء الذكاء الاصطناعي
اختيار نموذج التعلم الصحيح للمشكلة
هناك سبب لتميز نماذج الذكاء الاصطناعي، فكل مشكلة تحتاج الى حلول مختلفة . لا يوجد نموذج واحد يمكن اعتماده من أجل تجنب التحيز ولكن هناك عدة دلائل يمكن رصدها مبكراً تدلل على التحيز.
على سبيل المثال، نماذج التعلم الخاضعة للإشراف وغير الخاضعة للإشراف فلكل واحدة منها إيجابيات وسلبيات. يمكن للنماذج غير الخاضعة للإشراف التي تجمع أو تقوم بتقليل الأبعاد أن تتعلم التحيز من مجموعة بياناتها. إذا كان الانتماء إلى المجموعة (أ) يرتبط ارتباطًا وثيقًا بالسلوك (ب) ، فيمكن للنموذج أن يخلط بين الاثنين. وبينما تسمح النماذج الخاضعة للإشراف بمزيد من التحكم في التحيز في اختيار البيانات ، فإن هذا التحكم يمكن أن يدخل التحيز البشري في العملية.
قد يبدو عدم التحيز من خلال الجهل - باستثناء المعلومات الحساسة من النموذج - كحل عملي ، لكنه لا يزال يحتوي على نقاط ضعف وعليه لا يكفي بشكل منفرد بل يجب دمجه بأمور أخرى.
وعليه يجب تحديد أفضل نموذج لحالة معينة وإستكشافه من كل الجوانب للعثور على الثغرات وإصلاحها رغم أن المقاربة هذه تتطلب وقتاً طويلاً لكنها أفضل بكثير من اكتشاف المشكلة بعد البدء بالعمل بنظام الذكاء الاصطناعي.
اختيار مجموعة بيانات تمثيلية للتدريب
هناك خيط رفيع يفصل بين البيانات التي يمكنها أن تؤدي إلى التحيز وبين تلك التي تضمن مرونة في عملية تحليل البيانات. لذلك يجب التأكد من أن بيانات التدريب متنوعة وتتضمن مجموعات مختلفة لناحية التقسيم. التقسيم في البيانات يمكنه أن يصبح مشكلة كبيرة لاحقاً في حال لم تكن البيانات الفعلية مقسمة بالطريقة نفسها.
لا يفضل أن يكون هناك نماذج مختلفة لمجموعات مختلفة. وفي حان تم الاكتشاف بأنه لا يوجد بيانات كافية لمجموعة واحدة، يمكن استخدام الترجيح لزيادة أهميته في التدريب ولكن هذا الأمر يجب أن يتم بحذر شديد لأنه يمكن أن يؤدي إلى تحيزات جديدة غير متوقعة.
مراقبة الأداء باستخدام بيانات حقيقة
لا يوجد شركة تصنع ذكاء اصطناعياً متحيزاً بشكل متعمد، ولكن النماذج المتحيزة هي التي أدت الى ذلك. لهذا السبب يجب محاكاة تطبيقات الواقع قدر الإمكان عند إنشاء الخوارزميات.
ما يمكن فعله هو الاعتماد على البيانات الإحصائية بالإضافة الى البيانات الحقيقة، مثلاً في حال كان يتم تحديد سمات الأشخاص الذين يتخلفون عن سداد القروض، فإن رجحت الإحصائيات فئة معينة فحينها يحب العمل على «السبب» وإدخاله في نظام الذكاء الإصطناعي. الغاية هو خلق المساواة في النتائج وضمان تكافؤ الفرص.
لماذا يعتبر الاستقرار المالي من أهم عناصر تحقيق النمو الاقتصادي؟