أحد أكثر الجوانب تحفظاً في التمويل، وهو قرار منح الائتمان لشخص ما، يتم تحويله بواسطة تسجيل الائتمان قائمة على الذكاء الاصطناعي. هذا تغيير تدريجي للأفراد الذين يمتلكون تاريخاً ائتمانياً غنياً وكانوا مع البنوك لفترة طويلة من الزمن. ومع ذلك، يمكن أن يكون هذا تغييراً جذرياً للمقترضين ذوي الملفات الرقيقة وأولئك الموجودين في الاقتصاد غير الرسمي. يمكن أخيراً اكتشافهم بدلاً من أن يكونوا غير مرئيين للنظام. تناقش هذه المقالة تطبيق البيانات البديلة لإنشاء درجات ائتمان قائمة على الذكاء الاصطناعي للأفراد والشركات الصغيرة التي تفتقر إلى سجل ائتماني تقليدي، ومخاطر عدم العدالة والتحيز عندما تكون بيانات المكاتب غير متوفرة، والدفع التنظيمي لإنشاء ذكاء اصطناعي قابل للتفسير في الاكتتاب للسكان الذين يعانون من نقص الخدمات المصرفية.
تفترض التصنيفات الائتمانية التقليدية نوعاً من الوجود المالي. يفترضون أن الفرد لديه حساب مصرفي، ومنتجات مالية رسمية، واقترض قرضاً أو استخدم بطاقة ائتمان من قبل. يفترضون أن أصحاب العمل يديرون الرواتب بطريقة رسمية وأن التجار يعملون في الجزء المرئي من الاقتصاد - الجزء الموثق. من الناحية العملية، فإن نسبة هائلة من العالم ليست كذلك. غالباً ما لا يكون لدى الشباب قروض أو بطاقات. يمكن للمهاجرين امتلاك خلفيات ائتمانية جيدة في بلدانهم الأصلية ولا شيء في البلدان الجديدة. معظم معاملاتهم تتم نقداً أو في منصات رقمية لا تبلغ المكاتب: العاملون في الأعمال المؤقتة، الباعة المتجولون، أصحاب المتاجر غير الرسميين، وعدد كبير من رواد الأعمال الصغار. حيث توجد المكاتب، حتى تغطيتها قد تكون سطحية أو متحيزة نحو السكان الحضريين العاملين رسمياً. يبدو ملف المكتب لمثل هؤلاء المتقدمين فارغاً أو شبه فارغ للمقرضين. نظراً لأن فرق المخاطر مدربة على الثقة في بيانات المكاتب، فإنها ترتكب أخطاء لصالح الحذر. النتيجة متوقعة: زيادة الرفض، تضييق الحدود، زيادة الأسعار، أو الاستبعاد الكامل.
هؤلاء المقترضون ليسوا بالضرورة أكثر خطورة؛ الأمر فقط أن النظام أصم وأعمى عن الإشارات التي تميز حياتهم المالية فعلياً. المفهوم الأساسي لتطبيق الذكاء الاصطناعي على تسجيل الائتمان هنا واضح ومباشر. حيث تكون إحصاءات المكاتب مفقودة أو متفرقة للغاية، ابحث في مكان آخر. هناك العديد من البصمات الرقمية في الحياة الحديثة. عندما يتم جمع مثل هذه البصمات بطريقة مسؤولة بموافقة وتحويلها إلى إشارات أكثر تنظيماً، يمكنها أن تخبر الكثير عن استقرار الشخص، وقدرته على الكسب، وفرص سداده. غالباً ما يكون أحد المصادر الأولى والأكثر قيمة هو بيانات الاتصالات. يفهم مشغلو الهواتف المحمولة كيف يملأ شخص ما الأرصدة المدفوعة مسبقاً بشكل منتظم، سواء كانوا يستخدمون نفس الرقم على مر السنين أو يتبدلون بشكل متكرر، سواء كانوا مستقرين أو عشوائيين في نشاطهم، وما إذا كانوا يحصلون على حزم بيانات بنفس الحجم. الفرد الذي يحتفظ برقم واحد مع مرور الوقت، ويعيد شحن الرقم، ويظهر أنماط استخدام متسقة يكون عموماً أكثر تجذراً داخل المجتمع وأكثر اتساقاً في سلوكه مقارنة بشخص يتوقف أو يتأرجح في الاستخدام. ما إذا كان هناك استقرار يرتبط بتقليل مخاطر الائتمان.
مصدر آخر للقوة هو التجارة الإلكترونية وبيانات المنصات الرقمية. القليل يمكن أن يحتويه ملف المكتب لسائق طلب سيارات الأجرة، ولكن يمكن للمنصة الوصول إلى عدد الرحلات، الدخل في الأسبوع، بيانات الإلغاء، تقييمات العملاء، ومدة السائق. التاجر الصغير كبائع في سوق يترك وراءه تاريخاً من الطلبات المكتملة، المبالغ المستردة، الشكاوى المقدمة، نفاد المخزون، وأنماط النمو. في حالة الأعمال غير الرسمية، يمكن استخدام بيانات المنصة كأقرب معادل للبيانات المالية الرسمية. بعد ذلك، هناك الحساب المصرفي، المحفظة الرقمية، وبيانات تدفق الأموال من واجهة برمجة التطبيقات للخدمات المصرفية المفتوحة. على الرغم من أن المقترض قد يفتقر إلى تاريخ ائتماني طويل، فإنه أيضاً يميل إلى أن يكون لديه حساب حيث يتم إيداع الراتب، دخل العمل المؤقت، التحويلات، أو إيرادات الأعمال. من خلال تحليل التدفقات الواردة والصادرة المستندة إلى الوقت، يمكن للمقرضين تقدير الدخل الشائع، تقلبه، ما إذا كان لديه احتياطيات أم لا، وما هي نسبة الدخل التي تم تخصيصها بالفعل للنفقات المتكررة مثل الإيجار، المرافق، والديون الحالية. في حالة المقترض الذي يعاني من نقص الخدمات المصرفية، غالباً ما يكون الاكتتاب بتدفق الأموال أكثر موثوقية من بطاقة الأداء التقليدية، التي تعتمد كثيراً على القروض السابقة. توفر طبقة إضافية واحدة من خلال واجهات برمجة تطبيقات الرواتب والتوظيف.
في الحالات التي يكون فيها أصحاب العمل متصلين بخدمات الرواتب، يستطيع المقرضون تأكيد التوظيف، الأرباح الشهرية، مدة التوظيف، والتغييرات في التعويض. بالنسبة لأولئك الذين لديهم عدة وظائف بدوام جزئي، ستكون هذه الصورة المركبة أكثر إفادة من قسيمة دفع واحدة. أخيراً، مع الاستخدام السليم، يمكن استخدام البيانات السلوكية وبيانات مستوى الجهاز للمساعدة في كل من تقدير الاحتيال والمخاطر. مدة الوقت الذي يستخدم فيه الفرد نفس الجهاز، انتظام مواقع تسجيل الدخول، كيفية استخدامهم للتطبيق على مدار الأشهر، بالإضافة إلى وقت اليوم الذي يقومون فيه عادة بالمعاملات، قد توفر مؤشرات على الأصالة والثبات. يجب التعامل مع هذه الإشارات بحذر لمنع التمييز بالوكالة، على الرغم من أنها يمكن أن تكون ذات دعم مفيد. كل هذه المصادر مرتبطة بحقيقة أنها تخبر عن الحياة الحقيقية للشخص وكيف يعيش، كيف يكسب ويدفع حتى عندما يكون واضحاً أنه لم يضع إصبعه على بطاقة ائتمان في حياته.
\
هذه المصادر الأخرى من البيانات كثيفة السكان وغير منظمة. هيكل سجلات الاتصالات، أحداث المنصة، المعاملات المصرفية، وقياس بيانات الجهاز ليس مثل تقرير المكتب التقليدي. إنها صاخبة، متعددة الأبعاد، ومليئة بأنماط الخصوصية. في هذه المرحلة، يكون الذكاء الاصطناعي، ولا سيما التعلم الآلي الحديث، ضرورياً. تبدأ دورة الحياة المشتركة بتجميع البيانات. يتمتع المقرضون بإمكانية الوصول إلى شركاء الاتصالات، تغذية الخدمات المصرفية المفتوحة، واجهات برمجة تطبيقات الرواتب، وشركاء المنصة بشرط قوانين حماية البيانات والموافقة المباشرة للعملاء.
يمتصون البيانات الخام في بيئات آمنة ويطبعونها. يتم تحويل أنشطة إعادة شحن الهاتف، رصيد المحفظة، وطلبات التجارة الإلكترونية إلى سلاسل زمنية لها تنسيقات منتظمة. يتم القضاء على الشذوذات والمضاعفات غير الضرورية ومعالجة القيم المفقودة. من هذا، يتم بناء الميزات من قبل علماء البيانات. يقومون بإنشاء متغيرات موجزة بدلاً من مجرد إدخال جميع المعاملات الخام في نموذج: متوسط التدفق النقدي الصافي الشهري؛ حصة الأشهر التي تكون فيها المدخرات إيجابية؛ أطول فترة متتالية من عدم الدفع للدائنين؛ أشهر انخفاض الأرباح؛ النمو أو التحلل في أرباح المنصة؛ تقلب ساعات العمل؛ دوام الموقع أسبوعاً بعد أسبوع.
تحاول هذه السمات ضغط الحياة الاقتصادية للفرد في أرقام يمكن للنموذج هضمها. أشجار التعزيز المتدرج، الغابات العشوائية، والشبكات العصبية هي خوارزميات التعلم الآلي التي يتم تدريبها على البيانات التاريخية حيث تكون النتيجة معروفة بالفعل. في حالة تسجيل الائتمان، النتيجة عادة ما تكون تخلف المقترض عن السداد خلال فترة زمنية محددة، قل ستة أو اثني عشر شهراً. يتعرف النموذج على مجموعات من الميزات التي تشير إلى مخاطر أكثر أو أقل. الأنماط الموجودة بين ضامني الاكتتاب البشريين لم يكن من الممكن تحديدها بواسطة التمييز البشري، مثل التفاعلات الطفيفة بين تقلبات التدفقات النقدية ومدة المنصة. التحقق أمر بالغ الأهمية. يتم تطبيق النموذج على البيانات التي لم يتم تدريبه عليها بحيث يكون أداؤه حقيقياً وليس نتيجة للإفراط في التركيب.
تُستخدم مقاييس مثل AUC، معامل جيني، وإحصائيات كولموغوروف-سميرنوف لقياس قوة التمييز، بينما تشير مخططات المعايرة إلى ما إذا كانت الاحتمالات المتوقعة متطابقة مع معدلات التخلف عن السداد الفعلية. بالإضافة إلى الأرقام الرئيسية، يحتاج المقرضون إلى النظر في الأداء بناءً على الشريحة: المقترضون الجدد في الائتمان مقابل المقترضين ذوي الخبرة، المهن المختلفة، المناطق، ونطاقات الدخل. عند النشر، سيقوم النموذج بعد ذلك بتقييم المتقدمين الجدد على الفور، وسيتم تقديم استجابة في غضون ثوان قليلة. لا يمكن أن تنتهي العملية هناك. تتغير الإحصائيات مع الوقت، تطور المنصات سياساتها، ويتطور الاقتصاد الكلي.
\
:::tip تم توزيع هذه القصة كإصدار من قبل Sanya Kapoor تحت برنامج المدونات التجارية لـ HackerNoon.
:::
\



