كيف تعمل النماذج اللغوية الكبيرة "LLMs"؟ وهل تمثل تهديدًا حقيقيًا للبشر؟
يندرج "شات جي بي تي"، و"غوغل بارد"، وغيرهما من روبوتات الدردشة التي تعمل بالذكاء الاصطناعي تحت مظلةٍ شاملة تُعرَف بنماذج اللغات الكبيرة Large Language Models (LLMs). إن فهم ماهية هذه النماذج وكيفية عملها سيجعلنا نُكِن لها كل الاحترام والتقدير من جهة، ولكن من الجهة الأهم سيجعلنا نُحسن استخدامها بالتركيز على ما تبرع فيه.
يتم تدريب نماذج اللغات الكبيرة "LLMs" على قدرٍ هائل من المعلومات وقواعد البيانات، ولكن جميع الشركات -تقريبًا- تتحفظ عن إخبارنا بمزيد من التفاصيل حول مصدر هذه البيانات وما إذا كانت بيانات شخصية، ونعتقد أن هناك بيانات شخصية فعلاً، أم لا. لحُسن الحظ أن هناك بعض الخيوط التي إذا اتبعناها، يمكننا أن نُكون صورة شاملة حول مصادر هذه البيانات الهائلة.
وفقًا لهذه الدراسة، فإن نموذج LaMDA "أحد نماذج اللغات الكبيرة والذي بُني عليه غوغل بارد" لُقِّم بمعلومات من ويكيبيديا، والمنتديات العامة Public Forums، و"وثائق الأكواد- Code Documents" -بالنسبة للبرمجة- الموجودة على المواقع المختلفة ومواقع الأسئلة والأجوبة Q&A Sites بالتحديد. بالمناسبة، هذا السبب وغيره من الأسباب الأخرى الكثيرة، كفيلة لتجعلنا لا نعتمد على أدوات الذكاء الاصطناعي في الأمور المحورية مثل الاستشارات الطبية وما إلى ذلك، وكنا قد تحدثنا عن هذا الموضوع في مقالٍ سابق.
ولكن لحظة قبل المزيد من التعمق.. ما هي الـ LLMs بالضبط؟
نموذج اللغة الكبير Large Language Model (LLM) هو نموذج لغوي متقدم تم تدريبه على قدرٍ مهول من قواعد البيانات باستخدام تقنيات التعلم العميق "Deep Learning".
تمتاز هذه النماذج بالقدرة على إنشاء نصوص تُشبه النصوص البشرية، فضلاً عن تنفيذ المهام المختلفة التي يتم إملاؤها عليه بلغاتنا وكلماتنا الشائعة، فبمجرد جملة بسيطة، يستطيع أي شخص أن يستفيد من نماذج اللغة الكبيرة في الكثير من الأشياء كما نعرف جميعًا من واقع تجربتنا لـ"شات جي بي تي" وغيره من النماذج التي تندرج تحت الـ "LLMs".
لمن يعيش تحت صخرة ولم يسبق له استخدام أحد تطبيقات نماذج اللغة الكبيرة "مُجددًا؛ مثل شات جي بي تي" من قبل، فهذه الأدوات تستطيع فعل كل شيء تقريبًا بداية من إنشاء نصوص يصعب تفريقها عن النصوص البشرية دون الاستعانة بالأدوات المُخصصة لذلك، ومرورًا بالقدرة على ترجمة أي لغة تقريبًا -بدقة مقبولة تتطور مع الوقت- إلى أي لغة أخرى، وحتى إمكانية تلخيص النصوص وإنشاء الأكواد البرمجية والإجابة على أكثر الأسئلة تعقيدًا، والقائمة لا تنتهي.
لم تُوصَف النماذج اللغوية بالـ"كبيرة" من فراغ، فهي عادةً لا تعمل على حاسوب واحد، بل تُقدَّم كسيرفر أو واجهة تطبيقات برمجية API، أو واجهة ويب Web interface.
اقرأ أيضًا:من "Web 1.0" حتى "Web 3.0".. هل تعرف أجيال الإنترنت الثلاثة؟
كيف تعمل نماذج اللغة الكبيرة LLMs؟
للإجابة على هذا السؤال، نحتاج إلى العودة إلى نقطة جمع البيانات بقدرٍ مهول. بغض النظر عن مصدر وماهية هذه البيانات التي ترفض الشركات الحديث عنها، فإنها تُعَالَج من خلال شبكة عصبية neural network، أو مُحرك ذكاء اصطناعي AI engine مكون من مجموعة من العُقَد nodes والطبقات المختلفة التي تعمل كفلاتر لمعالجة البيانات وتشكيل الأنماط المختلفة التي ستُسهّل عليها القيام بوظيفتها.
تعمل الشبكات العصبية باستمرار على تحسين طريقة تفسير المدخلات والمُخرجات بآليات عدة أبرزها التجربة والخطأ Trial and error. تعتمد مُعظم النماذج اللغوية الكبيرة على معمارية المُحوّل Transformer architecture؛ تستطيع هذه المعمارية أن تقرأ قدرًا من المعلومات تعجز أمخاخنا عن استيعابه، ليس هذا فحسب، حيث تستطيع كذلك أن تربط بين هذه المعلومات وتتنبأ بالكلمات المنطقية التي تُكمل الجُمل المختلفة، وهذه ميزة وعيب في نفس الوقت؛ ميزة للشمولية والقدرة على فعل أي شيء تقريبًا، وعيب لاحتمالية الأخطاء الواردة ودعونا نتحدث عن ذلك قليلاً..
لا يستطيع "شات جي بي تي" و"غوغل بارد" وغيرهما من تطبيقات النماذج اللغوية الكبيرة التمييز بين المعلومات ومعرفة ما إذا كانت دقيقة أم لا؛ فقط تُقيم مُخرجاتها اللغوية من ناحية المنطق والطبيعية مقارنة بقواعد البيانات التي استُخدِمَت لتدريبها، هذا يعني أن روبوتات الدردشة تكون قد أتمت وظيفتها على أكمل وجه -بالنسبة لها، على افتراض أنها قادرة على الإدراك- عندما تُخرج لك نتائج مصقولة من الناحية اللغوية بغض النظر عن دقة المُخرجات نفسها، وأعتقد أن هذا الأمر يُفسر دبلوماسية ونمطية معظم إجابات روبوتات الدردشة التي تعمل بالذكاء الاصطناعي.
بالمناسبة، يُوجد قدر من العشوائية -الإيجابية- في أكواد هذه التطبيقات المصدرية، لهذا السبب من غير المرجح أن تحصل على نفس الجواب مرتين، حتى لو لم تُغير أي شيء في طلبك.
تلخيصًا للطريقة التي تعمل بها نماذج اللغة الكبيرة: يبدأ الأمر بقراءة الـ "LLMs" لقدرٍ ضخم من المعلومات الموجودة على الإنترنت "إذا كان له وصول على الشبكة" أو على قواعد البيانات الخاصة بها؛ الموضوع أشبه بالتعلم من مكتبة ضخمة مليئة بالكُتب والمعلومات. بفضل المعمارية تستطيع هذه النماذج فهم وتذكر قدر كبير من البيانات التي تصل إليها؛ يتم تحويل الجُمل والمعلومات المُعقدة إلى صيغ أبسط حتى يُمكن فهمها، بعد ذلك يتم تجميع هذه الصيغ البسيطة "مثل الكلمات" في صورة جُمل وعبارات طبيعية ومستساغة لنا نحن البشر، وهذا ما نراه أمامنا عندما نسأل "شات جي بي تي" مثلاً عن شيء ما.
اقرأ أيضًا:نموذج الذكاء الاصطناعي "Gemini".. خارق حقًا ولكن هل خدعتنا "غوغل"؟
أنواع النماذج اللغوية الكبيرة
مع التطور المستمر لهذه النماذج نُلاحظ وجود أكثر من نوعٍ لها، فهناك مثلاً نموذج الـ "Zero-shot model"، أو نموذج "التعلم دون معرفة مُسبَقة"، وأبرز أمثلته GPT-3، إذ يتم تدريب هذا النموذج على قدرٍ ضخم من البيانات، وعادة ما تكون إجاباته دقيقة ويكون موجّهًا للاستخدام العام دون الحاجة إلى تدريبات إضافية.
لدينا أيضًا نموذج الـ "Fine-tuned or domain-specific model" أو "النموذج اللغوي المُتخصص" وهو يُشبه النوع السابق من حيث التدرب على قواعد بيانات ضخمة، ولكن الفارق الوحيد أن هذه البيانات تكون مُخصصة لشيء معين، مثل البرمجة، وتطبيق هذا النموذج يتجسد بامتياز في أداة "Codex" البرمجية من شركة "OpenAI".
ثالثًا يأتي نموذج الـ "Language representation model" أو "نموذج تمثيل اللغة" ويُركز هذا النموذج المُدرَّب بالذكاء الاصطناعي والتعلم العميق على اللغة أكثر من أي شيء آخر، وإذا أردت تطبيقًا مشهورًا له فألقِ نظرة على نموذج "BERT".
لعل أهم وأفضل نوع من أنواع النماذج اللغوية الكبيرة هو نموذج الـ "Multimodal" أو "النموذج مُتعدد الاستخدامات" والمثال الأبرز على هذا النوع هو أداة "جيميناي Gemini" من "غوغل"، وأيضًا "GPT-4" من "OpenAI"، ونظرًا لأن هذا النوع قد يكون أشهرهم، فمن المفترض أن تكون على دراية بوظيفته، أو بالأحرى وظائفه، والتي لا تشمل النصوص فحسب بالطبع، وإنما الكثير والكثير من الأشياء الأخرى مثل التعامل مع الصور ومقاطع الفيديو المختلفة.
مُستقبل نماذج اللغة الكبيرة
بعد أن وصلنا للنموذج متعدد الاستخدامات، من المتوقع أن تكون الخطوة القادمة هي الوصول للذكاء الاصطناعي العام Artificial general intelligence (API)، ومن هنا قد تكون بداية النهاية والبداية الحقيقية لزحف الذكاء الاصطناعي الذي نراه في أفلام الخيال العلمي، فالروبوتات التي نراها في هذه النوعية من الأفلام تُمثل الذكاء الاصطناعي العام، وجميعنا نعرف ما الذي تستطيع فعله!