يتساءل مستخدمو الذكاء الاصطناعي التوليدي دائما عن فوارق الجودة في النتائج التي يتحصلون عليها عندما يطرحون نفس الطلب بلغات مختلفة. فالنتيجة الإنجليزية غالبا ما تكون الأكثر جودة من بقية النتائج، وخاصة تلك التي تصدر بلغات غير غربية. الإجابة المبسطة عن سر ذلك الفارق هي التصميم المرتكز على اللغة الإنجليزية في أنظمة الذكاء الاصطناعي، والذي يؤدي بدوره إلى تراجع كبير في دقة الترجمة والمعالجة الآلية لبقية اللغات وخاصة لغات الجنوب العالمي. ولكن وراء ذلك التبسيط توجد عدة أسباب هيكلية وتقنية أكثر تعقيدا.
هناك خطاب مغر عن أعجوبة الذكاء الاصطناعي، وعن النماذج اللغوية الكبرى تحديدا، التي هي أساس قدرة هذا النوع من الذكاء على البحث والتلخيص والترجمة وإنشاء المحتوى. هذا الخطاب مفاده أنها مرايا تعكس المعرفة الإنسانية، وفي هذا الخطاب، فإن أي تحيزات تظهر هي مشكلات عرضية وقابلة للتصحيح، وخارجة في جوهرها عن التقنية ذاتها.
"الممارسة العملية تكشف أن النماذج اللغوية الكبرى لا تعكس المعرفة الإنسانية في شموليتها"
لكن الممارسة العملية تكشف أن هذه النماذج لا تعكس المعرفة الإنسانية في شموليتها، بقدر ما تخضع لهندسة خاصة تتحكم فيها بيانات تدريبها وخياراتها التصميمية والافتراضات المعرفية لمنشئيها. فهذه النماذج، بحسب بنيتها الحالية وطريقة تدريبها، تبدو آليات لإعادة إنتاج "استعمارية المعرفة"، وضمان استمرار التسلسلات الهرمية الاستعمارية التي تضع المعرفة الأوروبية والأمريكية على القمة، بينما تستبعد المعرفة التي تنتجها الثقافات والمجتمعات الأخرى وتضعها في مراتب أدنى.
فقد دأب علماء البيانات على تأكيد أن البيانات ليست مادة خاما محايدة، بل إنتاج اجتماعي مشبَّع بعلاقات السلطة التي تسكن الواقع. فاستخراج البيانات السلوكية البشرية مثلا وتسليعها لاستخدامها في أنظمة الذكاء الاصطناعي، يشكل ضربا جديدا مما يمكن أن نطلق عليه "استعمار البيانات"، أي أن الآثار الرقمية لأنشطة مليارات البشر، وأغلبهم يعيش أساسا في الجنوب العالمي، يجري تحويلها إلى قيمة تتراكم في الغالب لدى شركات الشمال العالمي.
وبالنسبة للنماذج اللغوية الكبرى تحديدا، فإن سياسات التمثيل في بيانات التدريب هي الأساس. حيث تتعلم هذه النماذج من النصوص المُجمَّعة من الإنترنت والكتب وسائر المصادر الرقمية. والمحتوى الثقافي لتلك النصوص، أي الثقافات الممثَّلة، يشكل مباشرة طريقة "فهمَ" النموذج للواقع الثقافي.
💬 التعليقات (0)