الجانب المُظلم للبيانات الضّخمة، أو كيف تؤثّر الخوارزميات سلبًا في حيواتنا دون أن نشعر. لمحة سريعة حول كتاب Weapons of Math Destruction

نُشر يوم 17 نوفمبر 2018 بواسطة يوغرطة بن علي (Youghourta Benali)


كما هو معلوم فإن العديد من الخدمات (خاصة على الإنترنت) أصبحت تعتمد بشكل أكبر على التقنية والأتمتة وعلى الخوارزميات. مصطلحات مثل “البيانات الضخمة” Big Data، الذكاء الاصطناعي، و"تعلّم الآلة” machine learning أصبحت تُستخدم هنا وهناك، إما للتعبير عن التقنيات الحديثة المُستخدمة في مُختلف الخدمات والتطبيقات التي نعتمد عليها بشكل أكبر، أو لمجرد أغراض دعائية. إن دقّقت النظر فإنّك ستجد هذه المُصطلحات تُستخدم دائمًا بشكل إيجابي، فقد تقرأ مثلًا عن تطبيق جديد يستخدم الذكاء الاصطناعي استطاع اكتشاف أورام خبيثة لم يستطع أطباء أصحاب خبرات طويلة اكتشافها، أو أن هذه الشركة أو تلك تسهل عليك حياتك بمعرفة تفضيلاتك وخياراتك واقتراح المُنتجات التي سترغب في شرائها (رغم الجانب المُظلم المُتعلّق بالخصوصية) ونحو ذلك. لكن ما يخفى على الكثيرين منّا هو أن للبيانات الضخمة هذه جانب مُظلم، وقد يكون مُظلمًا بشكل قد يدفعنا إلى إعادة النّظر في طريقة اعتمادنا عليها أو حتى التخلّص منها بشكل كامل.

المقصود بالبيانات الضخمة هو تجميع أكبر قدر من البيانات حول نظام/مجال مُعيّن بُغية تحليلها واستخراج أنماط patterns لم يكن بالإمكان اكتشافها بشكل يدوي/بشري، بل وحتى إمكانية التنبؤ ببعض الأحداث ضمن ذلك النظام/المجال.

الكاتبة حاصلة على شهادة الدكتوراه في الرياضيات من جامعة هارفارد وسبق لها وأن عملت في القطاع المصرفي.

تحدّد الكاتبة 3 خصائص إن توفّرت في أية خوارزمية فإنه يُمكننا وصفها بأنها “سلاح دمار شامل” ويتعلق الأمر بكل من:

  * عدم الشّفافية Opacity: والمقصود به هو كون الخوارزمية علبة سوداء/مُغلقة المصدر فلا ندري (أي عامة الناس ممن تتحكم فيهم هذه الخوارزميات) كيف تعمل ولا على أي أساس تتخذ قراراتها.
  * حجم التأثير Scale: والمقصود به أعداد البشر الذين يُمكن للخوارزمية أن تؤثّر في حياتهم كبير/مُعتبر.
  * عدم وجود تغذية راجعة فعّالة feedback loop تسمح بتصحيح الأخطاء التي تقع فيها الخوارزميات.

تضرب الكاتبة عدّة أمثلة بما يُنظر إليه اليوم على أنّه “تحسين للأداء باستخدام الخوارزميات والبيانات الضخمة”. في حين أن هذا التحسين قد يكون بالنّفع بشكل عام (وقد يكون هذا النّفع ماديّا بحتًا) إلّا أنه يلحق ضررًا بالغًا بالكثيرين، خاصّة من الفئات المُهمّشة والمحرومة أو من الأقلّيات.

على سبيل المثال، تخيّل أن سلسلة مطاعم أكل سريع، والتي عادة ما تُوظّف مئات الأشخاص مقابل رواتب زهيدة، تخيّل أنّها تحاول تحسين أداء عمل الموظّفين عبر استخدام خوارزميات تهدف إلى تقليص (أو القضاء) على أيّة أوقات أو موارد غير مستغّلة. فتجد أن الخوارزمية قد تقرر تغيير برنامج عمل موظف ما بسبب أن موظّفًا آخر قد طُرِد أو ترك وظيفته. فتجد أن الموظف الذي غيّرت له برنامج عمله غير قادر على برمجة أيامه بشكل مُسبق، مما يؤثّر سلبًا عليه، على صحّته، على أولاده وعلى حياته بشكل عام.

مثال آخر حول الجانب المُظلم لهذه الخوارزميات، يتعلّق هذه المرة بمُدرِّسة (مُعلِّمة) فقدت وظيفتها بحكم أن خوارزمية تقييم الأداء قررت بأنه يجب فصلها. حاولت المُدرّسة فهم سبب فصلها لكن لم تُفلح لأن الخوارزمية مُغلقة ولا أحد يعلم جميع العوامل التي تأخذها في الحسبان، لكن تبيّن لاحقًا أن الخوارزمية تعتمد في حساب أداء كل مُدرّس على نسبة التّقدّم الذي يُسجّلها تلاميذ كل مُدرّس. وبحكم أن هذه المُدرّسة كانت مسؤولة عن قسم تبّين لاحقًا بأن نتائج امتحانات العام السابق تم التلاعب بها، فإن الخوارزمية سجّلت “تراجعًا ملحوظًا” في أداء التلاميذ هذا العام وبالتالي قرّرت فصل المُدرّسة التي كانت من أفضل المُدّرسين في مدرستها. الأدهى والأمر هو أن نفس الخوارزمية قد تصل إلى نفس النتائج حتى ولو لم يتم التلاعب بنتائج أية امتحانات، فيكفي أن يحصل المُدرّس على قسم تلاميذه إما ممتازون جدًا أو سيّؤون جدًا حتى تكون نسبة التحسن في أدائهم السّنوي صغيرة جدًا (يعني الخوارزمية بُنيت على أساس لا وجود لأي تلاميذ في طرفي النقيضين).

نقطة في غاية الأهمية يجب أخذها بالحسبان لما يتعلّق الأمر بالخوارزميات وبالبيانات الضخمة وهو أن الأمر لا يتعلّق بمجرد بيانات كما قد يبدو للوهلة الأولى، بل حتى هذه الخوارزميات لا تخلو من الأفكار المُسبقة. فبحكم أن من يكتب هذه الخوارزميات هم بشر، فقد يأخذون بالحسبان بعض العوامل في بناء تلك الخوارزميات وفي المُعادلات التي تعتمد عليها. فعلى سبيل المثال قد يُلاحظ من ضمن بيانات يتم تحليلها أن نسبة نجاح الطّلبة من بعض الأحياء الفقيرة مُنخفض مقارنة بغيره من الأحياء، وبشكل أو بآخر ستجد هذه المعلومة طريقها إلى تلك الخوارزميات التي قد تأخذها في الحسبان لدى قبول أو رفض طالب من أحد هذه الأحياء لما يتقدّم إلى بعض الجامعات المرموقة (أو يتقدّم بطلب قرض لدى بنك، أو حتى وظيفة في شركة ما). وبحكم أن هذه الخوارزميات والبيانات الضخمة ستسعى إلى الحصول على أدق/أفضل نتائج مُمكنة فقد يُستغل هذا المعامل بشكل يتجنب جميع الطلبة المُتقدّمين من هذا الحي بالذات، وهو ما سيرفع نسب الفشل في هذه الأحياء بشكل آلي وسيرفع نسبة البطالة وربما حتى الإجرام فيها أيضًا، مما سيزيد الوضع سوءًا. بعبارة أخرى، بحكم أن الأحكام المُسبقة في هذه الخوارزميات تؤخذ بعين الاعتبار في البداية وبحكم أنها لا تُراجع بعد ذلك، حتى ولو حصلت الجامعات التي تستخدمها على أفضل الطلبة المُتقدّمين لديها فإنها ستؤزم وضع الكثيرين من الطبقات المُهمّشة والأقلّيات.

بعبارة أخرى الإشكال الكبير لما يتعلّق الأمر بالخوارزميات هو اعتقادنا -بحكم اقتران هذا المُصطلح بالرياضيات- هو أنها موضوعية بشكل كامل، في حين أن شخصية كاتبها وآراؤه المُسبقة ستؤخذ بالحسبان سواء كان ذلك عمدًا أو عن غير قصد.

في رأيي يجب على كل مُبرمج أو من يعمل في مجال البيانات الضخمة أو حتى من يرغب في استخدامها على نطاق واسع قراءة هذا الكتاب. بعد الفراغ من قراءة هذا الكتاب ستتكون لديك نظرة أكثر اتزانًا حول هذا المجال، فليس بالحل السحري لجميع المشاكل لكنه يُمكنه أن يحل مشاكل كثيرة إن عرفنا كيفية استخدامه بشكل مدروس.

كما سبق وأن أشرت له في مُراجعة كتاب آخر (الجميع يكذب، أو كيف تكون البيانات الضّخمة أصدق من الجميع. لمحة سريعة حول كتاب Everybody Lies) يفضل قراءة هذا الكتاب (الذي يلقي الضوء على الجانب المُظلم للبيانات الضخمة) إلى جانب كتاب آخر يُركّز على قوّتها واستخداماتها (مثل الكتاب آنف الذكر) حتى يتكون لديك فهم متوازن لهذا المجال.