Смекни!
smekni.com

Совершенствование развития кредитной политики коммерческого банка (стр. 17 из 22)

При построении модели оценки кредитоспособности огромную помощь эксперту окажет разнообразная аналитическая отчетность. Поскольку данные в хранилище представлены в многомерном виде, то, несомненно, наиболее удобно получать отчетность в виде набора срезов данных – кросс – таблиц. [42]

Рисунок 3.4 - Суммы, которые получили заемщики (или требовали потенциальные заемщики)

Например, на рисунке 3.4 видно распределение сумм кредитов по возрасту заемщиков. Также информация отображается в разрезе как "хороших", так и "плохих" кредитов.

Более наглядно распределение представляется в виде кросс-диаграммы (рисунок 3.5).

Рисунок 3.5 - Представление данных в виде кросс-диаграммы


На рисунке наглядно видно, что в основном берут кредит лица до 30 лет, от 30 до 50 менее активно, от 50 до 70 практически не берут. Видимо, условия кредитования не устраивает лиц, старше 30 лет в большинстве случаев. Банку, для привлечения данной категории лиц придется менять условия кредитования (например, уменьшить плату за кредит). Если анализировать причину такого количества отказов в выдачи кредитов, то выяснится, что потенциальные заемщики неадекватно оценивали свои возможности по погашению кредита (это наглядно видно на самоорганизующихся картах далее).

В Deductor 4 в OLAP-кубе с помощью инструмента "селектор" можно агрегировать факты по какому-либо измерению, оставляя только те объекты, которые соответствуют указанному условию. Например, можно объединить сумму кредитов по возрастам заемщиков, оставив только тех, которые в сумме берут 50% кредитов. На рисунках 3.6 и 3.7 представлены селектор и заемщики, взявшие 50% от общей суммы.

Рисунок 3.6 – Селектор

Так подтверждается популярность кредитования среди молодежи. Это небольшой пример применения аналитической отчетности. На практике можно таким образом анализировать любую информацию о заемщиках, имеющуюся в хранилище в произвольных разрезах.

После процесса построения дерева решений при помощи программы Tree Analyzer получаем следующую модель оценки кредитоспособности физических лиц, описывающую ситуацию, относящуюся к определенному банку. Эта модель представлена в виде иерархической структуры правил – дерева решений (рисунок 3.8). [40, URL: http://www.basegroup.ru/library/practice/solvency/]

Рисунок 3.7 - Заемщики, взявшие 50% всех кредитов

Рисунок 3.8 - Дерево решений – модель определения кредитоспособности физических лиц


Анализируя полученное дерево решений (см. рисунок 3.4) можно сделать вывод, что при помощи дерева решений можно проводить анализ значащих факторов. Такое возможно благодаря тому, что при определении параметра на каждом уровне иерархии, по которому происходит разделение на дочерние узлы, используется критерий наибольшего устранения неопределенности. Таким образом, более значимые факторы, по которым проводится классификация, находятся на более близком расстоянии (глубине) от корня дерева, чем менее значимые. Например, фактор "Обеспеченность займа" более значим, чем фактор "Срок проживания в данной местности". Фактор "Основное направление расходов" значим только в сочетании с другими факторами. Еще одним интересным примером значимости различных факторов служит отсутствие в построенном дереве параметра "Наличие автотранспорта", что говорит о том, что на сегодняшний день это наличие не является определяющим при оценке кредитоспособности физического лица.

Можно заметить, что такие показатели как "Размер ссуды", "Срок ссуды", "Среднемесячный доход" и "Среднемесячный расход" вообще отсутствуют в полученном дереве. Данный факт можно объяснить тем, что в исходных данных присутствует такой показатель как "Обеспеченность займа", и т.к. этот фактор является точным обобщением четыре вышеописанных показателей, алгоритм построения дерева решений выбрал именно его.

Очень важной особенностью построенной модели является то, что правила, по которым определяется принадлежность заемщика к той или иной группе записаны на естественном языке. Например, на основе построенной модели получаются следующие правила:

1. ЕСЛИ Обеспеченность займа = Да И Срок проживания в данной местности, лет > 5,5 И Количество лет > 19,5 И Наличие недвижимости = Да И Наличие банковского счета = Да ТО Давать кредит = Да (Достоверно на 98%)

2. ЕСЛИ Обеспеченность займа = Да И Срок проживания в данной местности, лет > 5.5 И Наличие недвижимости = Да И Количество лет > 21.5 И Срок работы на данном направлении, лет <= 5.5 И Пол = Муж И Наличие банковского счета = Нет И Основное направление расходов = Одежда, продукты питания и т.п. ТО Давать кредит = Нет (Достоверно на 88%).

Правильно построенное на данных прошлых периодов дерево решения обладает одной еще очень важной особенностью. Эта особенность называется способность к обобщению. Т.е. если возникает новая ситуация (обратился потенциальный заемщик), то, скорее всего, такие ситуации уже были и достаточно много. Вследствие чего можно с большой долей уверенности сказать, что вновь обратившийся заемщик поведет себя так же, как и те заемщики, характеристики которых очень похожи на характеристики вновь обратившегося. На основе построенной модели можно определять принадлежность потенциального заемщика к одному из классов. Для этого необходимо воспользоваться диалоговым окном "Эксперимент" программы Tree Analyzer (рисунок 3.9), в котором, последовательно отвечая на вопросы, можно получить ответ на вопрос: "Давать ли кредит".

Пример получения результата. Вопросы: Обеспеченность займа: Да > Наличие недвижимости: Да > Пол: Муж > Наличие банковского счета: Нет > Основное направление расходов: Покупка товаров длительного пользования.

Ответ: Кредит давать: Да (достоверно на 96 %).


Рисунок 3.9 - Окно "Эксперимент"

Используя такой подход можно устранить сразу оба вышеописанных недостатка скоринговой системы оценки кредитоспособности. То есть:

1) Стоимость адаптации сводится практически к минимуму за счет того, что алгоритмы построения модели классификации (дерево решений) – это самоадаптируемые модели (вмешательство человека минимально).

2) Качество результата достаточно велико за счет того, что алгоритм выбирает наиболее значимые факторы для определения конечного ответа. Плюс ко всему полученный результат является статистически обоснованным.

Основные преимущества системы:

1) Гибкая интеграция с любыми сторонними системами, т.е. получение информации для анализа и перенос результатов не вызывает проблем.

2) Консолидация информации о заемщиках в специальном хранилище данных, т.е. обеспечение централизованного хранения данных, непротиворечивости, а также обеспечение всей необходимой поддержки процесса анализа данных, оптимизированного доступа, автоматического обновления данных, использование при работе терминов предметной обрасти, а не таблиц баз данных.

3) Широкий спектр инструментов анализа, т.е. обеспечение возможности эксперту выбрать наиболее подходящий метод на каждом шаге обработки. Это позволит наиболее точно формализовать его знания в данной предметной области.

4) Поддержка процесса тиражирования знаний, т.е. обеспечение возможности сотрудникам, не разбирающимся в методиках анализа и способах получения того или иного результата получать ответ на основе моделей подготовленных экспертом. Так, сотрудник, оформляющий кредиты должен ввести данные по потребителю и система автоматически выдаст решение о выдачи кредита или об отказе.

5) Поддержка групповой обработки информации, т.е. обеспечение возможности дать решение по списку потенциальных заемщиков. Из хранилища автоматически выбираются данные по лицам, заполнившим анкету вчера (или за какой угодно буферный период), эти данные прогоняются через построенную модель, а результат экспортируется в виде отчета (например, в виде excel файла), либо экспортируется в систему автоматического формирования договоров кредитования или писем с отказом в кредите. Это позволит сэкономить время и деньги.

6) Поддержка актуальности построенной модели, т.е. обеспечение возможности эксперту оценить адекватность текущей модели и, в случае каких либо отклонений, перестроить ее, используя новые данные.

Приведенный выше пример – это приближенный вариант того, как можно использовать методы интеллектуального анализа данных, в частности, деревья решений, для достижения поставленной задачи: уменьшения риска при операциях кредитования физических лиц. Хотя и при таком первом приближении наблюдаются положительные результаты. Дальнейшие усовершенствования могут затрагивать такие моменты как: более точный подбор определяющих заемщика факторов; изменение самой постановки задачи, так, например, вместо двух значений целевого параметра, можно использовать более детальную информацию (Вернул/ Не вернул/ Не вовремя), или использовать в качестве целевого значения вероятность того, что деньги выплачены вовремя.

Таким образом, для эффективного формирования кредитного портфеля банкам необходимо взять на вооружение передовые технологии добычи знаний и применить их для оценки потенциальных заемщиков. Благодаря этому можно будет не бояться предстоящей конкуренции на этом рынке. Подготовка решения данного вопроса сейчас позволит обкатать саму процедуру и в дальнейшем избежать ошибок и расходов в связи с массовым применением таких подходов в дальнейшем.