анкета, яку заповнює позичальник;
інформація на даного позичальника з кредитного бюро організації, у якій зберігається кредитна історія всього дорослого населення країни;
дані рухів по рахунках, якщо мова йде про вже діючого клієнта банку.
У самому спрощеному виді скорингова модель являє собою зважену суму визначених характеристик. У результаті виходить інтегральний показник (score); чим він вище, тим вище надійність клієнта, і банк може упорядкувати своїх клієнтів по ступеню зростання кредитоспроможності.
Інтегральний показник кожного клієнта порівнюється з якимсь числовим порогом, або лінією розділу, що, власне кажучи, є лінією беззбитковості і розраховується з відношення, скільки в середньому потрібно клієнтів, що платять у термін, для того, щоб компенсувати збитки від одного боржника. Клієнтам з інтегральним показником вище цієї лінії видається кредит, клієнтам з інтегральним показником нижче цієї лінії – не видається.
Усе це виглядає дуже просто, однак складність полягає у визначенні, які характеристики варто включати в модель і які вагові коефіцієнти повинні їм відповідати. Скоринг виділяє ті характеристики, що найбільш тісно зв'язані з ненадійністю або, навпаки, з надійністю клієнта. Скорингова модель не знає, чи поверне даний позичальник кредит, але знає, що в минулому люди цього віку, цієї ж професії, з таким же рівнем освіти і з таким же числом утриманців кредит не повертали. Тому скорингова система давати кредит цій людині не рекомендуватиме.
У цьому полягає дискримінаційний (не в статистичному, а в соціальному значенні цього слова) характер скоринга, тобто якщо людина по формальних ознаках близька до групи з поганою кредитною історією, то йому кредит не дадуть. Тому навіть при дуже високому ступені використання автоматизованих систем скоринга здійснюється суб'єктивне втручання у випадку, коли кредитний інспектор має додаткову інформацію, що доводить, що людина, класифікована як ненадійна, насправді «гарна», і навпаки.
У Великобританії найбільше часто використовуються наступні характеристики для оцінки кредитного ризику [75, с.32]:
Вік
Кількість дітей/утриманців
Професія
Професія чоловіка(і)
Доход
Доход чоловіка(і)
Район проживання
Вартість житла
Наявність телефону
Скільки років живе по даній адресі
Скільки років працює на даній роботі
Скільки років є клієнтом даного банку
Наявність кредитної картки/чекової книжки
В інших країнах набір характеристик, що найбільше тісно зв'язані з імовірністю дефолта імовірністю, що позичальник не поверне кредит або затримається з виплатою, буде відрізнятися в силу національних економічних і соціально-культурних особливостей. Чим більш однорідна популяція клієнтів, на якій розробляється модель, тим точніше прогнозування дефолта. Тому очевидно, що не можна автоматично перенести модель з однієї країни в іншу або з одного банку в іншій. Навіть усередині одного банку існують різні моделі для різних груп клієнтів і різних видів кредиту.
З метою побудови моделі спочатку виділяється вибірка клієнтів кредитної організації, про яких уже відомо, гарними позичальниками вони себе зарекомендували чи ні, іноді така вибірка називається «навчальною». Вона може варіюватися від декількох тисяч до сотні тисяч, що не є проблемою на Заході, де кредитний портфель банку може складатися з десятків мільйонів клієнтів. Вибірка підрозділяється на дві групи: «гарні» і «погані» ризики. Це виправдано в тім змісті, що банк при ухваленні рішення про кредитування на першому етапі вибирає з двох варіантів: давати кредит або не давати. При всій «дитячості» визначень «гарний»/«поганий», це саме ті терміни, що використовуються кредитними аналітиками.
Визначення «поганого» ризику може бути різним у залежності від політики банку, у Західній Європі «поганим» ризиком звичайно вважається клієнт, що затримується з черговою виплатою на три місяці. Іноді до «поганого» ризику відносяться клієнти, що занадто рано повертають кредит, і банк не встигає нічого на них заробити.
Таким чином, скоринг являє собою класифікаційну задачу, де виходячи з наявної інформації необхідно одержати функцію, що найбільше точно розділяє вибірку клієнтів на «поганих» і «гарних».
Методи власне класифікації досить різноманітні і містять у собі [68]:
статистичні методи, засновані на дискримінантному аналізі (лінійна регресія, логістична регресія);
різні варіанти лінійного програмування;
дерево класифікації або рекурсійно-партиційний алгоритм (РПА);
нейронні мережі;
генетичний алгоритм;
метод найближчих сусідів.
Традиційними і найбільш розповсюдженими є регресійні методи, насамперед лінійна багатофакторна регресія :
р = wo + w1x1 + w2x2 + … + wnxn , (3.2)
де р імовірність дефолта, w вагові коефіцієнти, x – характеристики клієнта.
Недолік даної моделі полягає в тім, що в лівій частині рівняння знаходиться імовірність, що приймає значення від 0 до 1, а перемінні в правій частині можуть приймати будьяк значення від –¥ до + ¥.
Логістична регресія дозволяє перебороти цей недолік:
log (p/(1p)) = wo + w1x1 + w2x2 + … + wnxn... (3.3)
Для застосування логістичної регресії необхідні набагато більш складні розрахунки для одержання вагових коефіцієнтів і, отже, більш могутня комп'ютерна база й удосконалене комп'ютерне забезпечення. Але при сучасному рівні розвитку комп'ютерної техніки це не є проблемою, і в даний час логістична регресія є лідером скорингових систем.
Перевага логістичної регресії ще й у тім, що вона може підрозділяти клієнтів як на дві групи (0 поганий, 1 гарний), так і на кілька груп (1, 2, 3, 4 групи ризику).
Усі регресійні методи чуттєві до кореляції між характеристиками, тому в моделі не повинні бути сильно корельовані незалежні перемінні.
Лінійне програмування також приводить до лінійної скорингової моделі. Провести абсолютно точну класифікацію на поганих і гарних клієнтів неможливо, але бажано звести помилку до мінімуму. Задачу можна сформулювати як пошук вагових коефіцієнтів, для яких помилка і буде мінімальною.
Дерево класифікації і нейронні мережі являють собою системи, що розділяють клієнтів на групи, усередині яких рівень ризику однаковий і максимально відрізняється від рівня ризику інших груп. Нейронні мережі використовуються головним чином при визначенні кредитоспроможності юридичних осіб, де аналізуються вибірки меншого розміру, ніж у споживчому кредиті. Але найбільш успішною областю їх застосування стало виявлення шахрайства з кредитними картками завдяки їх здатності виявляти нестандартні ситуації.
Генетичний алгоритм заснований на аналогії з біологічним процесом природного добору. У сфері кредитування це виглядає в такий спосіб: мається набір класифікаційних моделей, які піддаються «мутації», «схрещуються», і в результаті відбирається «найсильніший», тобто модель, що дає найбільш точну класифікацію.
При використанні методу найближчих сусідів вибирається одиниця виміру для визначення відстані між клієнтами. Усі клієнти у вибірці одержують визначене просторове положення. Кожен новий клієнт класифікується виходячи з того, яких клієнтів поганих або гарних більше довкола нього.
На практиці використовується комбінація декількох методів, і компанії зберігають свої скорингові моделі в найсуворішому секреті, тому складно сказати, який метод краще.
Ціль процесу розробки скоринг карт побудувати найбільш повний профіль ризику для кожного клієнта. Такий широкий підхід робить скорингкарти не тільки більш ефективними, але і менш сприйнятливими до змін в одній окремій області. Такий профіль ризику повинний містити в собі характеристики, що відбивають стільки незалежних типів інформації, скільки можливо.
Так, кредитна скорингкарта користувача повинна містити в собі:
демографічну інформацію про клієнта (вік, місце проживання, регіон і стаж роботи);
розділ кредитних характеристик, що відбивають володіння нерухомістю, професію, платоспроможність,деяку фінансову інформацію;
ступінь довіри клієнтові у відношенні погашення боргів (загальний коефіцієнт неповернення боргу);
а також іншу значиму для розгляду інформацію про існуючих позичальників.
Профіль позичальника також допомагає при наступному моніторингу скорингкарт по релевантності. Більшість аналітиків, що займаються вивченням ризиків, використовують щомісячні звіти типу "стабільність системи" або "стабільність чисельності клієнтів" для підтвердження ефективності застосування карт при поточній чисельності клієнтів. Ці звіти показують міри ефективності, виходячи лише з характеристик, використовуваних у скорингкарті. Загальний же профіль ризику більш реалістично відбиває поточні зміни чисельності, ніж при використанні обмеженої кількості перемінних зі скорингкарти. У найпростішій формі, ризикова таблиця складається з групи характеристик, що згідно статистики є прогнозуючими при поділі облікових записів на гарні і погані (табл.3.2).
Таблиця 3.2 Приклад ризикових таблиць скоринг-кредитування [31]
Назва характеристики | Атрибут | Збільшення рейтингу |
ВІК | До 23 | 63 |
ВІК | 23 – 25 | 76 |
ВІК | 25 – 28 | 79 |
ВІК | 28 – 34 | 85 |
ВІК | 34 – 46 | 94 |
ВІК | 46 – 51 | 103 |
ВІК | Від 51 | 105 |
КАРТКИ | “AMERICAN EXPRESS”, “VISA OTHERS”, “VISA MYBANK”, “NO CREDIT CARDS” | 80 |
КАРТКИ | “CHEQUE CARD”, “MASTERCARD/EUROC”, “OTHER CREDIT CARD” | 99 |
КАРТА EC | 0 | 86 |
КАРТА EC | 1 | 83 |
ДОХОД | До 500 | 93 |
ДОХОД | 500 – 1550 | 81 |
ДОХОД | 1550 – 1850 | 75 |
ДОХОД | 1850 – 2550 | 80 |
ДОХОД | Від 2550 | 88 |
СТАТУС | “E”, “I”, “U” | 79 |
Кожному атрибутові ("Вік" це характеристика, "2325" атрибут) привласнюється рейтинг на основі статистичного аналізу з урахуванням різних факторів, таких як прогнозна сила характеристик, кореляція між характеристиками і вага характеристик. Загальний рейтинг кандидата це сума рейтингів усіх його атрибутів, що присутні у таблиці.