Ликвидация бизнеса. Приказы. Оборудование для бизнеса. Бухгалтерия и кадры
Поиск по сайту

Как построить скоринговую модель. Методы построения скоринговых моделей. Определение результатов разработанной скоринговой модели

Скоринг (от английского score, счет) - это способ оценки кредитоспособности. Вам как заемщику скоринг интересен для самодиагностики: узнать причины отказа в кредитовании или оценить шансы на будущий кредит. В статье расскажем, как узнать свой скоринговый балл и как его увеличить.

Принцип работы скоринга

Для оценки кредитоспособности скорингу нужны данные. Данные могут быть из разных источников: кредитной истории, анкеты заемщика, социальных сетей и т. д. Скоринг обрабатывает данные и выставляет оценку в баллах. Чем выше скоринговый балл, тем выше шансы получить кредит на выгодных условиях.

Скоринговый балл — величина непостоянная. Он меняется в зависимости от действий заемщика. Например, заемщик взял кредит — выросла кредитная нагрузка и скоринговый балл снизился. Просрочил платеж — балл упал еще ниже. Если заемщик аккуратно без просрочек выплатит кредит — балл увеличится.

Виды скоринга

Банки используют заявочные, поведенческие и мошеннические скоринги.

Заявочный скоринг делится на социодемографический и кредитный. Первый анализирует анкету заемщика: возраст и пол, работу, стаж, размер доходов. Второй анализирует кредитную историю: сколько кредитов брал заемщик, как платил, сколько платит сейчас и т. д.

Поведенческий скоринг предсказывает, как заемщик будет выплачивать кредит: равномерно, с опережением или с просрочками. Поведенческий скоринг может провести, например, зарплатный банк — он знает, как заемщик пользуется картой, сколько денег и на что тратит.

Мошеннический скоринг борется с намеренными невыплатами кредитов. Этот скоринг анализирует базы МВД, ФССП, внутренней службы безопасности, а также подозрительные данные в кредитной истории, например, частую смену адресов и телефонов.

Вы как заемщик можете оценить себя двумя видами скоринга: кредитным и социодемографическим.

Кредитный скоринг

Кредитный скоринг используется для оценки заемщиков, которые уже брали кредиты. Скоринговый балл рассчитывается на основе анализа кредитной истории.

Пример отчета кредитного скоринга

Социодемографический скоринг

Социодемографический скоринг предназначен для заемщиков с пустой или отсутствующей кредитной историей. Он анализирует возраст, пол, семейное положение, наличие иждивенцев, образование, профессию, трудовой стаж, доходы и регион проживания.

Соцдем скоринг сверяет данные проверяемого заемщика с предыдущими клиентами банка, чтобы оценить благонадежность. Например, по статистике банка люди старше 30 лет вносят платежи по кредитам стабильнее, чем молодежь. Поэтому заемщики от 30 лет при прочих равных условиях получают более высокий скоринговый балл.


Пример отчета социодемографического скоринга

Расшифровка скоринговых баллов

Кредитный Социодемогр. Расшифровка
690-850 1000-1200 Максимальный результат. Вы относитесь к категории надежных заемщиков. Таким банки охотно одобряют кредиты на лучших условиях
650-690 750-1000 Хороший результат. Высокая вероятность получить кредит на стандартных условиях.
600-650 500-750 Приемлемый результат. Банк потребует дополнительные справки для подтверждения платежеспособности, например, 2-НДФЛ.
500-600 250-500 Слабый результат. С таким баллом вы вряд ли получите кредит в крупных банках. Обратитесь в небольшие региональные банки или кредитные кооперативы.
300-500 0-250 Худший результат. В банках кредит вряд ли одобрят. Обращайтесь в МФО или КПК. Предложите кредитору залог.

Как повысить скоринговый балл

Если у вас низкий кредитный скоринг, вариант его повышения один — улучшать кредитную историю. Для этого:

  • и проверьте, все ли в ней соответствует действительности. Иногда кредитные организации передают данные с большим опозданием, а то и вовсе не передают. Например, вы кредит погасили, а в кредитной истории он числится открытым. Это снижает скоринговый балл.
    Читайте статью
  • Закройте просрочки платежей и необязательные кредиты: кредитные карты, микрозаймы, кредиты на технику. Чем меньше открытых кредитов, тем выше скоринговый балл.
  • Если за последние два года у вас были кредиты с просрочками, нужно восстановить репутацию надежного заемщика. Для этого берите новые кредиты и аккуратно их выплачивайте. Не дают кредит без обеспечения — предоставьте залог, найдите созаемщика. Воспользуйтесь услугой . Через полгода-год скоринговый балл увеличится.

Чтобы увеличить балл социально-демографического скоринга, изучите «факторы» из отчета и постарайтесь их исправить. Например, если вы ИП, трудоустройтесь и проработайте полгода в найме. Найдите созаемщика, съездите за границу, найдите источник дополнительного дохода.

Запомнить

Скоринг помогает заемщикам оценить собственную кредитоспособность и разобраться в причинах банковских отказов.

Скоринги бывают разные: одни анализируют кредитную историю, другие анкету, третьи ищут признаки мошенничества. Вам доступны два вида скоринга — и социодемографический. Первый актуален для заемщиков с опытом кредитования, второй — для тех, кто никогда не брал кредиты.

Скоринговый балл меняется в зависимости от кредитного поведения. Балл можно снизить или повысить.

Практически каждый, кто хоть раз получал отказ в оформлении кредита, слышал от менеджера такую фразу: «Решение было принято скоринговой системой. Ваши показатели надежности в качестве заемщика не соответствуют норме». Какова же эта норма, что такое скоринг и как пройти «кредитный детектор» на «отлично»? Давайте попробуем разобраться.

Общие сведения

Итак, что такое своеобразная система оценки надежности заемщика, построенная на целом ряде параметров. Когда человек подает заявку на получение кредита, первое, что ему предлагают сделать — заполнить анкету. Вопросы анкеты придуманы не просто так. Это и есть скоринговая модель оценивания потенциального заемщика. В зависимости от ответа по каждому пункту присваивается определенное количество баллов. Чем их больше, тем выше вероятность получения положительного решения о выдаче денежных средств.

Тут имеется один нюанс. Если у вас негативная кредитная история, то дальнейшие ответы на вопросы и число набранных баллов чаще всего уже не имеют значения. Уже одного этого факта достаточно для отказа.

Цели и задачи скоринга в современных банках

Любая скоринговая модель, применяемая в системе кредитования, вводится с целью получения таких результатов:

  • увеличение кредитного портфеля из-за снижения доли необоснованных отказов по кредитам;
  • ускорение процедуры оценки потенциального заемщика;
  • снижение уровня невозврата кредитных средств;
  • повышение качества и точности оценки заемщика;
  • централизованное накопление данных о клиенте;
  • снижение резерва на сумму вероятных потерь по кредитам;
  • оценка динамики изменений индивидуального кредитного счета и всего портфеля кредитов в целом.

Кредитный скоринг: как это работает?

Для достижения поставленных целей в банках применяется скоринговая модель оценки кредитоспособности. Она предполагает минимальное влияние на результат менеджера или сговора сотрудников банка.

Практически вся информация, вносимая в анкету, должна подтверждаться наличием документов. Менеджер банка исполняет в данном случае чисто техническую роль - вносит данные в программу. Когда все пункты анкеты закружены, компьютерная программа просчитывает и выдает результат - количество набранных вами баллов. Дальше ситуация может развиваться по-разному.

Если вы набрали слишком мало баллов, можете быть уверены: в кредите откажут.

Число баллов оказалось намного выше среднего? Если сумма кредита небольшая, решение может быть принято прямо на месте. В случае если вы претендуете на получение довольно внушительной суммы, вам будет объявлено о том, что первый этап проверки вы прошли, и заявка передана на рассмотрение в службу безопасности банка.

Количество баллов «плавает» посерединке? Менеджер, скорее всего, потребует привести поручителя или назначит серию дополнительных проверок.

Виды скоринга

В общем случае скоринговая модель состоит из семи видов оценки, четыре из которых имеют отношение к кредитованию, а три — к маркетингу. Для кредитной практики характерны такие виды скоринга:

  1. По заявкам (Application-скоринг). Эта модель чаще всего используется для оценки надежности и платежеспособности клиентов. Построена она, как уже было сказано, на оценивании анкеты и присвоении каждому ответу соответствующего количества баллов.
  2. От мошенничества (Fraud-скоринг). Помогает вычислить потенциальных мошенников, сумевших пройти первый этап тестирования. Принципы, способы и методы тестирования на мошенничество являются коммерческой тайной каждого банка.
  3. Прогноз поведения (Behavioral-скоринг). Тут проводится анализ поведения заемщика по отношению к кредиту, вероятность изменения платежеспособности. По результатам оценивания проводится корректировка максимальной суммы кредита.
  4. Работа по возвратам (Collection-скоринг). Эта модель применяется к проблемным кредитам, на стадии возврата неоплаченных задолженностей. Программа помогает сформировать план мероприятий по возврату кредита: от предупреждения до передачи дела в суде или коллекторскую фирму.

Три остальных вида выглядят так:

  1. Предпродажная оценка (Pre-Sale) — выявляет потенциальные потребности заемщика, позволяет предложить дополнительно тот или иной продукт.
  2. Отклик (Response) — оценивает вероятность согласия клиента с предложенными программами кредитования.
  3. Оценка истощения (Attrition) — оценка вероятности того, что клиент прекратит свои взаимоотношения с банком на данном этапе или в будущем.

Недостатки скоринговой системы

Оценка кредитоспособности физических лиц имеет свои недостатки. Основным является то, что система недостаточно гибкая и плохо адаптируется под реальные параметры. Например, скоринговая модель, принятая в США, поставит высокий балл человеку, сменившему большое количество мест работы. Такой человек считается замечательным специалистом, очень востребованным на рынке труда. У нас же такой факт сыграет с заемщиком злую шутку. Наибольшее количество баллов получит человек, имеющий всего одну запись в трудовой. Если заемщик часто меняет работодателя, то он считается неблагонадежным, неуживчивым и плохим специалистом. Его рейтинг в глазах банка стремительно падает, ведь за следующим увольнением может и не последовать новая работа, а значит, начнутся просрочки в платежах.

Чтобы максимально адаптировать систему под наши условия жизни, анкеты для оценки должны разрабатывать специалисты высочайшей категории и квалификации. Но любые результаты, полученные подобным образом, все равно будут зависимы от мнения и влияния человека. Так что абсолютно беспристрастной оценки все равно не получается.

Так что любая система скоринга имеет, по крайней мере, два недостатка:

  • дороговизна адаптации под современные реалии;
  • влияние субъективного мнения специалиста на выбор модели оценки клиента.

Кроме того, сама система оценивания также несовершенна. Дело в том, что при выставлении баллов учитывается только формальное положение вещей. Система не способна правильно оценивать реальность. Например, если клиент имеет комнатку в коммуналке на Арбате, то система поставит ему высокий балл. Ведь имеется московская прописка и жилье в центре. А шикарный особняк площадью в несколько тысяч квадратных метров, расположенный в небольшом поселке на берегу Черного моря, система обозначит как «жилье в селе» и снизит балл за отсутствие московской прописки.

Какие данные участвуют в построении модели

В тех случаях, когда проводится оценка кредитоспособности физических лиц, сотрудник банка должен опираться на целый ряд критериев. Все их можно разделить на три большие группы, в каждую из которых входит множество показателей.

  • семейное положение;
  • возраст;
  • наличие детей, их возраст и количество.

Финансовые:

  • сумма основного ежемесячного дохода;
  • место работы, должность;
  • количество записей в трудовой книжке;
  • период трудоустройства в последней фирме;
  • наличие обременений (долгов, непогашенных кредитов, алиментов и других выплат);
  • наличие собственного жилья, автомобиля, банковских счетов и депозитов.

Дополнительные:

  • существование дополнительных источников дохода, не подтвержденных документально;
  • возможность предоставления поручителя;
  • другие сведения.

Скоринговая модель оценки кредитоспособности юридического лица построена немного по-другому. Тут ключевыми параметрами считаются Но поскольку они рассчитываются исходя из финансовых отчетов кампании-соискателя, то в случае чего они могут быть скорректированы. С учетом такой возможности объективность оценки сильно уменьшается. Поэтому для оценки юридических лиц применяется скоринг с динамическими показателями.

Первый шаг основывается на сборе сведений, которые нельзя исчислить материальными показателями. К ним относятся положение на рынке, экспертное мнение о финансово-экономической устойчивости.

Следующий шаг — определение финансовых показателей. Здесь изучаются коэффициенты ликвидности, обеспеченности собственными средствами, объективные показатели финансовой устойчивости, рентабельности, оборачиваемости средств и так далее.

По итогам двух независимых оценок банк принимает решение о выдаче займа.

Кто может получить высокую оценку

Если говорить о физических лицах, то тут оценка заемщика также проводится по многим показателям. Существует множество факторов, способных положительно повлиять на рейтинг:

  • высокая зарплата;
  • наличие собственного движимого и недвижимого имущества;
  • долгий срок проживания в конкретном регионе;
  • наличие депозитов;
  • документальное подтверждение доходов;
  • наличие стационарного телефона дома и на работе;
  • подтверждение официального трудоустройства, особенно на государственных предприятиях и в бюджетной сфере;
  • наличие открытых счетов (депозитных, пенсионных, расчетных) в банке-кредиторе;
  • наличие значительной суммы авансового платежа при получении ипотеки или автокредита;
  • возможность предоставления рекомендаций, поручителя или созаемщика;
  • отличная кредитная история.

Как обмануть систему и можно ли это сделать?

Считается, что раз оценку проводит бездушная машина, то можно ее обмануть, заранее выяснив «правильные» ответы на вопросы. На самом деле это далеко не так.

Скоринговая модель оценки клиента построена таким образом, что все ответы на вопросы можно проверить при помощи соответствующих документов. Кроме того, банки часто объединяются в целые сети и сбрасывают результаты своих проверок в одну общую систему. Так что если в процессе дополнительной проверки обман будет выявлен, на вашей репутации заемщика будет поставлен жирный крест. Нигде и никогда вы больше кредита не получите.

Приукрасить действительность можно попытаться лишь в том случае, когда данные в систему вносятся лишь со слов клиента. Однако найти такой банк довольно трудно, и проценты там настолько грабительские, что вы и сами вряд ли захотите оформить там кредит.

Скоринг и история кредитования

Если учесть, что как минимум половина жителей нашей страны уже имела опыт обращения за кредитом, в первые ряды выходит такой показатель оценивания заемщика, как кредитная история. Поскольку БКИ с некоторых пор пополнились данными о заемщиках микрофинансовых организаций и других подобных учреждений, на рынке появились скоринговые модели, скорректированные с учетом наличия и состояния кредитной истории.

Эти модели оценивают заемщиков по вероятности невозврата денежных средств, возникновения просрочек, количеству ранее погашенных кредитов и других параметров.

Кроме того, банкам предлагается услуга автоматического информирования о клиентах. Подключив такую услугу, банк будет знать:

  • об открытии клиентом счетов в других финучреждениях;
  • о получении новых кредитов;
  • о возникновении любых просрочек;
  • новые паспортные данные клиента;
  • об изменении лимитов по счетам, кредиткам и так далее.

Это позволит еще больше отрегулировать систему банковского скоринга и получать максимум информации о потенциальных заемщиках.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

  • Введение
    • 1.4 Нейронные сети
    • 1.5 CHAID анализ
    • 1.6 Другие методы
    • 2.1 Постановка задачи
    • 3.1 Задача Монжа-Канторовича
    • 3.2 Применение задачи Монжа-Канторовича к скорингу
  • Заключение
  • Список литературы

Введение

Скоринг - это эвристический способ построения рейтингов и классификации различных объектов на группы. Он основывается на предположении о том, что люди со схожими социальными показателями ведут себя одинаково. Он применяется в банковской сфере, маркетинге, страховом деле.

Основной целью традиционного скоринга является классификация клиентов банка на “хороших” и “плохих”, исходя из которой кредитор может выбирать соответствующие действия по отношению к данному клиенту. “Плохого” клиента, к примеру, можно определить как клиента с низкой эмпирической вероятностью возвращения кредита. Но, как правило, такое определение “плохого” клиента расширяется до любого нежелательного банку поведения клиента. Классификация осуществляется на основе скоринговой карты с помощью которой рассчитывается скоринговый балл клиента. скоринг дискриминантный байесовский

Из литературы, посвященной скорингу, отметим несколько работ.

“Руководство по кредитному скорингу” под редакцией Элизабет Мейз, 2008 г. - единственная книга о скоринге на русском языке. Описываются общие понятия, разбираются методы построения скоринговой карты, обсуждается применение скоринга на практике. Книга состоит из статей написанных зарубежными специалистами в области финансов.

Диссертационная работа Сэмюэла Глассона “Метод цензурированной выборки для кредитного скоринга”, 2007 г. В ней исследуются инструменты анализа выживаемости, применительно к кредитному скорингу, в условиях цензурированных данных. Разбирается применение метода линейной регрессии и в частности метода Бакли-Джеймса. Практическая часть работы содержит в себе применение этих методов к оценке времени кредитного дефолта и времени выплаты очередного платежа.

Диссертационная работа Кристины Болтон “Логистические регрессии и их применение в кредитном скоринге”, 2009 г. Разбирается концепция кредитного скоринга применительно к банковскому делу в Южной Африке. Рассматриваются методы построения скоринговой модели с особым акцентом на метод логистической регрессии. Применяется этот метод для создания скоринговой модели.

Диссертационная работа Маттиаса Кремпля “Адаптивные модели и их применение в кредитном скоринге”, 2011. Акцент ставится на изучении методов построения предсказывающих моделей в условиях дрейфа и задержки данных. Представлен новый метод для построения скоринговых моделей, базирующийся на методе дерева принятия решений. Представленный метод применяется для оценки дрейфа в двух наборах реальных финансовых данных.

В приведённых выше работах имеется общая проблема: применение методов к построению скоринговых моделей не обосновано. Отсюда вытекает сомнение в правильности полученных данных. Задача состоит в построении метода, применение которого было бы обосновано. В данной работе представляется метод, решающий эту задачу.

Существует множество подходов к построению скоринговой модели. В главе 1 данной работы описаны методы применяемые в вышеприведённых диссертациях. В главе 2 вводится математическая модель скоринга и разбирается эмпирический Байесовский подход к построению скоринговой модели: подход описывается теоретически, а после применяется к реальным данным банка “Сбербанк России” для построения скоринговой модели. В главе 3 вводится метод, основывающийся на задаче Монжа-Канторовича. Приведено теоретическое обоснование использования данного метода. Затем он применяется для построения скоринговой модели на данных используемых в главе 2.

Глава 1. Методы построения скоринговых моделей

1.1 История появления и развития скоринга

Изначально скоринг разрабатывался с целью автоматизации процесса решения о выдаче кредита. До внедрения скоринга, решение о том, кому выдать кредит в каком размере, принималось кредитным экспертом. Он решал это, опираясь на опыт и собственное мнение, руководствуясь параметрами клиента, влияющими на его кредитоспособность.

В 1940-х годах началось внедрение скоринговых систем. В 1941 Давид Дюран опубликовал первую исследовательскую работу по кредитному скорингу, в которой оценивал роль различных факторов в прогнозирующей системе. После окончания Второй мировой войны, резко вырос спрос на кредитные продукты, и стало ясно, что традиционные методы принятия решения плохо работают в условиях большого числа клиентов. Взрыв спроса на кредиты, отчасти обусловленный введением кредитных карт, мотивировал кредиторов внедрять автоматизированные системы принятия решения о выдаче кредитов. Параллельное развитие вычислительной техники, способствовало этому и давало возможность обрабатывать большие массивы финансовых данных.

В 1956 году была создана компания FICO, занимавшаяся разработками в области потребительских кредитов. В 60-х годах началось внедрение компьютерных технологий в область скоринга. В 1963 году было предложено использование дискриминантного анализа данных для кредитного скоринга. И, наконец, в 1975 с принятием "US Equal Credit Opportunity Act I", скоринг был окончательно признан.

Важным шагом в развитии кредитного скоринга было появление скоринга поведения (behavior scoring) в начале 90-х. Его целью является предсказание выплат уже имеющихся клиентов.

В недавнее время развитие скоринговых систем было обусловлено регулированием со стороны внешней среды. Как часть требований к достаточности капитала, предъявляемых банкам в связи с вступлением в силу второго Базельского соглашения (Basel Committee for Banking Supervision 2001), учреждения должны внимательно следить за рисками, связанными с их кредитными портфелями. Методы кредитного скоринга позволяют это делать.

С момента введения первой скоринговой системы, использовалось множество математических и статистических методов. Среди статистических можно назвать: дискриминантный анализ, линейную регрессию, логистическую регрессию и дерево принятия решений. Другие методы пришли из математики: математическое программирование, нейронные сети, генетические алгоритмы и экспертные системы. Далее мы разберём наиболее распространённые методы и поговорим об их достоинствах и недостатках.

1.2 Линейный дискриминантный анализ и линейная регрессия

Линейный дискриминантный анализ - метод для классификации объектов на заранее определённые категории. Идея в том, чтобы найти такую линейную комбинацию объясняющих переменных, которая наилучшим образом разделила бы объекты на категории. Под разделением наилучшим образом имеется ввиду такое, при котором обеспечивается максимальная дистанция между средними данных категорий. Скоринговый балл рассчитывается как линейная функция от значений атрибутов клиента:

Здесь, - значения атрибутов клиента, - параметры модели, которые максимизируют отношение

где - вектор средних для хороших и плохих клиентов, - общая ковариационная матрица.

Линейный дискриминантный метод предполагает выполнение двух условий. Во-первых, ковариационные матрицы независимых переменных для обеих групп должны совпадать. Во-вторых, независимые переменные должны быть распределены нормально. Часто, в скоринге, независимые переменные дискретные или распределены не нормально. Отсюда, возникают проблемы в применении этого метода. Однако было показано, что даже в случае нарушения нормальности, данный метод широко применим. Его преимуществом можно назвать простоту применения.

Схожий метод линейной регрессии, также используется для формирования скоринговой модели. В случае двух категорий, он эквивалентен методу линейного дискриминантного анализа и выражает зависимость одной переменный (зависимой) от других (независимых). В общем виде представляется так:

Зависимая переменная;

Объясняющие независимые переменные;

Неизвестные коэффициента регрессии, которые находятся методом наименьших квадратов;

Для применения модели линейного скоринга требуется выполнение следующего предположения: связь между зависимой и независимыми переменными должна быть линейной. В противном случае, точность оценки значительно ухудшается. Ошибки же должны быть независимы и распределены нормально.

Как и в случае дискриминантного анализа, в условиях кредитного скоринга, предположения, требуемые для применения линейной регрессии, нередко нарушаются. Линейная регрессия может дать оценку вероятности вне диапазона , что является неприемлемым. К примеру, логистическая регрессия лишена этого недостатка.

1.3 Логистическая регрессия и пробит-регрессия

Данные виды регрессии больше подходят для построения скоринговой модели, так как допускают категорийное представление данных. Модель логистической регрессии задаётся следующим образом:

где - оценка вероятности того, что клиент “плохой”, - вектор неизвестных параметров регрессии, который вычисляется через условие максимизации отношения правдоподобия.

Модель логистической регрессии базируется на функции логарифм. В свою очередь, пробит-регрессия базируется на нормальном распределении и задаётся следующим образом:

где. Вектор находится также как и в модели логистической регрессии.

Так как логистическая регрессия и пробит-регрессия используют схожие по форме распределения, результаты применения данных моделей также схожи. Логистическая регрессия пользуется большим предпочтением, так как вычисления проще, чем в пробит-регрессии и имеется больше инструментов для работы с ней. За счёт своей бинарной природы, логистическая регрессия предпочтительней линейной регрессии в использовании для построения скоринговых моделей. На практике же было выяснено, что разница в точности предсказываемых результатов незначительна. Тем не менее, наблюдается преобладание логистической регрессии в скоринговых системах.

1.4 Нейронные сети

Искусственные нейронные сети являются симуляцией нейронных сетей имеющихся в природе. Возникло это понятие при попытке смоделировать процессы, происходящие в мозге человека.

Нейронные сети, также называемые многослойным перцептроном, особенно подходят для решения задачи классификации. Они широко используются в различных сферах: финансах, компьютерных науках, физике и медицине. Популярность нейронных сетей отчасти обуславливается возможностью моделировать сложные ситуации без особых затрат со стороны использующего этот метод. По своей природе нейронные сети автоматически обнаруживают любую нелинейную ситуацию в данных и подстраиваются под неё. Также многослойные нейронные сети являются универсальными аппроксиматорами, то есть могут аппроксимировать любую функцию сколь угодно точно.

Нейронные сети состоят из слоев которые, в свою очередь, состоят из узлов. Есть 3 типа слоёв в сетях: входной, скрытые, выходной. Входной слой образуют атрибуты клиента, такие как пол, возраст и т.п.

Выход для k-го узла с m входами представляется так:

где - активационная функция, - вектор входных данных, - весовой вектор который обозначает силу связи между узлами.

Основным недостатком является то, что не смотря на возможность добиться высокой точности прогноза, понять причины, по которым было принято то или иное решение, невозможно.

В контексте кредитного скоринга было показано, что нейронные сети работают не хуже традиционных методов.

1.5 CHAID анализ

Данный метод отлично подходит для нахождения связей между данными, особенно если связи нелинейные. Он применяется для построения деревьев принятия решений, и имеет много общего с классическими методами, такими как дискриминантный анализ и линейная регрессия.

Аббревиатура CHAID расшифровывается как Chi-squared Automated Interaction Detector.

Гибкость данного метода делает его привлекательным для использования, но это не означает, что его стоит использовать вместо традиционных методов. В случае, когда встречаются строгие теоретические предположения о распределении, традиционные методы предпочтительней. Как техника исследования или в случае, когда традиционные методы не срабатывают, CHAID анализ является непревзойдённым инструментом.

CHAID строит не бинарные деревья (т.е. деревья у которых может быть более двух ветвей) на основе относительно простого алгоритма, который особенно хорошо подходит для анализа больших массивов данных. Алгоритм основывается на применении теста хи-квадрат.

1.6 Другие методы

Дерево принятия решений.

Метод разделяет данные на подмножества, каждое из которых более однородно в своем поведении, нежели исходное множество данных. Каждое из этих подмножеств делится далее, по такому же алгоритму. Результат деления именуется «листом» это дерева. Имеются и другие методы, работающие по схожему принципу.

Достоинства этого метода - простота и интуитивность. Метод способен работать с отсутствующими наблюдениями. Особенно он применим в случае, когда о данных до их исследования практически ничего неизвестно и нельзя построить какие-либо догадки или гипотезы.

Главный недостаток этого метода - сложность компьютерных расчетов. Вследствие громоздкости получаемых деревьев, процесс изучения модели трудоёмкий. Изменения в ситуации может привести к пересмотру всего дерева решений.

В основном метод используется как вспомогательный. К примеру для определения переменных, которые наиболее сильно объясняют поведение зависимой переменной.

Метод k ближайших соседей. Непараметрический метод классификации объектов. Основывается на метрике, определяющей схожесть между данными.

Первоначально вводятся тренировочные данные, разделенные на классы. Затем вводятся оцениваемые данные и определяется схожесть между введёнными и тренировочными данными. На основе метрики выбирается k ближайших соседей. Новый элемент относят к тому классу, к которому принадлежит большинство его соседей.

Количество соседей k определяется компромиссом между компенсацией и дисперсией. Чем меньше класс, тем меньше выбирается k. При этом необязательно, что при больших k результат будет лучше.

Одно из преимуществ данного метода - легко добавить новые данные, не изменяя при этом модель. Непараметрическая сущность этого метода позволяет работать с иррациональностями в функциях риска на пространстве признаков.

Отсутствие формального метода для выбора k и невозможность вероятностной интерпретации результата, так как результатом являются ожидаемые частоты, являются главными недостатками метода. Данные сложности могут быть решены использованием методом Байесовской аппроксимации.

Данный метод мало используется в скоринге. Одной из причин этого является то, что для классификации одного объекта необходимо иметь базу по всем объектам.

Более новый метод опорных векторов , построенный на машинном обучении, показал себя не хуже традиционных скоринговых методов. Он состоит из двух процессов: первый преобразует входные данные к данным высокой размерности в пространстве признаков; второй классифицирует данные с помощью линейного классификатора. Классификатором может выступать, например, линейный дискриминантный анализ.

1.7 Сравнение различных методов

Был проведён ряд сравнительных исследований для скоринговых методов. Критериями для ранжирования служили процент ошибок при классификации и ROC-кривая. Исследовались 8 наборов данных.

Средняя оценка

Нейронные сети

Опорных векторов

Логистическая регрессия

Линейный дискриминантный анализ

Линейные LS-SVM

Расширенное дерево Байеса

Наивный байесовский классификатор

Радиально базисные функции

k-ближайших соседей (k=100)

Линейный SVM

Квадратичный дискриминантный анализ

Дерево принятия решений

Линейное программирование

Дерево принятия решений

Дерево принятия решений

k-ближайших соседей (k=10)

Дерево принятия решений

Из таблицы видно, что нейронные сети и метод опорных векторов явились наилучшими на исследуемых 8 наборах данных. Кроме того традиционные методы, такие как линейный и дискриминантный анализ показали себя конкурентоспособными. Отсюда следует, что, вероятно, большинство данных для кредитного скоринга лишь немного нелинейны. Вследствие чего линейные методы показали себя на уровне с нелинейными.

Не существует оптимальной скоринговой модели для любой ситуации. Выбор модели зависит от данных и цели, на которую направленно создание модели. Кроме того, метод, оценивающий наилучшим образом, не обязательно будет лучшим в данной ситуации.

Глава 2. Эмпирический Байесовский подход

В данной главе разберём эмпирический Байесовский подход и с помощью него построим скоринговую модель. Построение будем вести исходя из статистики по потребительским кредитам банка “Сбербанк России”.

2.1 Постановка задачи

Предположим, имеется некий банк, занимающийся кредитованием частных лиц. В банк за получением кредита обращаются клиенты. Решение о выдаче кредита банк выносит на основе информации о клиенте.

Информацию о клиенте банк получает из разных источников: от самого клиента, от кредитного бюро и из других источников. Мы будем рассматривать информацию, предоставляемую самим клиентом. Банк получает её через заполненную заемщиком анкету.

В анкете заемщик указывает следующие данные: пол, возраст, семейное положение, наличие детей, ежемесячный доход, наличие недвижимости и прочее.

На основании этих данных разобьём клиентов на группы, в которых они схожи по определённым признакам. Для каждого клиента Байесовским методом найдём рейтинг - эмпирическая вероятность того, что клиент вернёт кредит при условии, что он принадлежит данной группе.

Для применения метода необходимо, чтобы данные удовлетворяли следующим условиям:

· независимость - клиенты не имеют сговора по выплате кредита;

· однородность - данные взяты из одной генеральной совокупности;

· равновероятность - клиенты равновероятно распределяются по группам.

Их выполнение проверяется ниже.

2.2 Построение скоринговой модели

Введем вероятностное пространство. Обозначим в этом пространстве - клиент банка.

Каждый клиент банка имеет набор характеристик согласно заполненной анкете. Например: в браке или нет, уровень дохода, разбитый по категориям, наличие машины и прочие характеристики. Согласно этим характеристикам введём разбиение пространства на множества

Таким образом, множество клиентов разбито на группы.

Введём случайные величины.

Количество клиентов в j-й группе.

Исходя из данных, мы можем построить совместное эмпирическое распределение вероятностей.

где - априорная эмпирическая вероятность события A,

Эмпирическая вероятность события B при условии А,

Эмпирическая вероятность события A при условии B, которую называют апостериорной вероятностью,

Эмпирическая вероятность события B.

Данная формула позволяет переоценить вероятность события A, учитывая тот факт, что произошло событие B.

Из определения условной вероятности можем записать:

Выразив из (1) и подставив в эту формулу выражение для, получим:

2.3 Применение модели к данным

В нашем распоряжении имеются данные о 1977 клиентах банка “Сбербанк России” включаю информацию о том, вернули они кредит или нет.

Для применения Байесовского подхода необходимо убедиться в выполнении 3-х гипотез:

· о независимости - клиенты не имеют сговора по выплате или не выплате кредита;

· об однородности - данные взяты из одной генеральной совокупности;

· о виде распределения - данные распределены равновероятно.

Гипотеза о независимости

Для проверки этой гипотезы воспользуемся ранговым критерием Спирмена. Статистикой данного критерия является коэффициент ранговой корреляции, определяемый следующим образом.

Даны два ряда наблюдений: и. На основании этих наблюдений построим пары рангов. Под рангом понимаем номер места, занимаемого наблюдением в вариационном ряду. Аналогично понимаем ранг. Затем, переставляем пары рангов в порядке возрастания первой компоненты. Получившийся ряд обозначим.

Коэффициент корреляции находится по формуле:

Критическая область критерия. Для нахождения воспользуемся тем, что закон распределения стремится к, при больших n. Отсюда. Здесь - функция распределения стандартного Гауссова закона.

При уровне значимости, =1.959964. Граница критической зоны. Найденный коэффициент корреляции.

Таким образом, статистика критерия не попадает в его критическую область, и мы можем принять гипотезу о независимости при уровне значимости 0.05.

Гипотеза об однородности

Формулируется гипотеза следующим образом. Даны две выборки и из распределений и соответственно, с функциями распределений и. Тогда гипотеза об однородности.

Для проверки данной гипотезы воспользуемся критерием Смирнова.

Статистикой данного критерия является, где - эмпирические функции распределения, построенные по выборкам и. Критическая область задаётся в виде. При больших n и m границу критической области можно принять равной, где. - функция распределения Колмогорова.

Таким образом, гипотеза об однородности отвергается, в случае если. При уровне значимости 0.05 . - граница критической области. Статистика.

Статистика критерия не попадает в критическую область, и мы можем принять гипотезу об однородности при уровне значимости 0.05.

Гипотеза о виде распределения

Сформулируем гипотезу. Нам дана выборка из распределения с функцией распределения, которая неизвестна. Необходимо проверить, что - функция распределения равномерного распределения на отрезке .

Для этого воспользуемся критерием согласия Пирсона.

Статистикой критерия является. Здесь - частота попадания наблюдений в i-й отрезок, - вероятность попадания в i-й отрезок. Если проверяемая гипотеза верна, при больших n статистика подчиняется распределению хи-квадрат с k-1 степенью свободы.

Гипотеза отвергается в случае, если статистика превышает критическое значение.

Значение статистики посчитаем с помощью программного пакета Statistica - =24,19468, k-1=39. Граница критической области при уровне значимости.

Таким образом значение статистики не превышает критического уровня и гипотеза о равномерном распределении клиентов по группам принимается при уровне значимости 0.05.

Итак, данные удовлетворяют всем гипотезам, приведённым выше, и мы можем приступить к нахождению рейтингов.

Имеющиеся данные содержат множество различных характеристик клиентов. Для построения будем использовать 4 из них, наиболее значимых. Взять большее количество элементов нам не позволяет ограниченность нашей выборки (1977 элементов).

Выбранные характеристики: возраст и пол заёмщика, наличие детей, выплаты по кредиту в % от суммарного дохода заёмщика. Характеристика возраст принимает 3 значения - 18-29, 30-45, 46-…; пол заёмщика два значения - мужской и женский; наличие детей два значения - есть дети, и нет детей; выплаты принимают 5 значений - (<5%),(6-10%), (11-16%), (17-22%),(23-55%).

Каждое конкретное значение характеристики назовём свойством заёмщика. Разобьём всех наших клиентов на множества, опираясь на наличие конкретного свойства у данного клиента. К примеру, - множество клиентов у которых нет детей.

Приведём эти обозначения:

Дети, = Нет детей, = Есть дети;

Возраст, =Возр1(18-29), =Возр2(30-45), =Возр3(46-…);

Пол, =Женский, =Мужской;

Выплаты по кредиту в % от суммарного дохода заемщика, =Вып1(<5), =Вып2(6-10), =Вып3(11-16), =Вып4(17-22), =Вып5(23-55).

Образуем новые множества, как комбинацию всех возможных свойств клиента - по всевозможным К примеру, множество состоит из женщин в возрасте 18-29 лет без детей, выплачивающих <5% от своего суммарного дохода. Количество таких множеств равно 60.

Таблица 2.1. Кодировка множеств.

Нет детей

Есть дети

Заметим, что - образуют разбиение всего множества клиентов:

Построим совместное эмпирическое распределение двух дискретных случайных величин - и, где ={0,1}, ={, i=1:60}. Строить его будем как отношение количества клиентов удовлетворяющих паре значений случайных величин (X,Y) к общему количеству клиентов.

Зафиксируем количество клиентов соответствующих каждой возможной паре (X,Y).

Таблица 2.2. Количество клиентов вернувших и не вернувших кредит в каждой группе. 0 - вернули кредит, 1 - не вернули кредит.

Построим совместное эмпирическое распределение вероятностей. Для этого разделим количество клиентов вернувших и не вернувших кредит в каждой из групп на общее количество клиентов.

Таблица 2.3. Совместное эмпирическое распределение вероятностей.

Рисунок 2.1. Эмпирическая функция распределения при X=0.

Рисунок 2.2. Эмпирическая функция распределения при X =1.

Рисунок 2.3. Гистограмма совместного распределения при X=0.

Рисунок 2.4. Гистограмма совместного распределения при X=1.

Найдём эмпирическое распределение вероятностей попадания в каждую из групп. Для этого разделим количество клиентов в каждой группе на общее количество клиентов. Общее количество клиентов.

Таблица 2.4. Эмпирическое распределение вероятностей попадания в каждую группу.

Рисунок 2.5. Гистограмма попадания в группу i.

Исходя из этого, получаем классификацию:

· Клиенты из группы 60 рисковые

· Клиенты из групп 1-5, 7-12, 15, 17, 25, 31, 32, 33, 35-37, 39, 40, 42, 54-56, 58 - среднерисковые

· Клиенты из групп 6, 13, 14, 16, 18-24, 26-30, 34, 38, 41, 43-53, 57, 59 - надежные

Глава 3. Подход, основанный на задаче Монжа-Канторовича

3.1 Задача Монжа-Канторовича

Задача Монжа.

Даны два вероятностных пространства и и неотрицательная измеримая функция на, ...

Подобные документы

    Дискриминантный анализ как раздел многомерного статистического анализа. Дискриминантный анализ при нормальном законе распределения показателей. Применение дискриминантного анализа при наличии двух обучающих выборок. Решение задачи в системе statistika.

    курсовая работа , добавлен 21.01.2011

    Модели дискриминантного анализа. Эффективность классических западных и российских моделей предсказания банкротства. Отраслевая специфика. Описание статей, включающее характеристики выборки, метод, список факторов и прогнозную силу метода анализа.

    реферат , добавлен 24.07.2016

    Основы линейного регрессионного анализа. Особенности использования функции Кобба-Дугласа. Применение множественной линейной регрессии. Сущность метода наименьших квадратов. Пути избегания ложной корреляции. Проверка значимости коэффициентов регрессии.

    реферат , добавлен 31.10.2009

    Экономическая классификация стран, характеристика основных показателей экономического развития. Статистические методы анализа, описание дискриминантного, кластерного, факторного и графического анализа. Параметры исследование экономической безопасности.

    дипломная работа , добавлен 14.10.2013

    История появления функционально-стоимостного анализа, его методика, принципы, задачи и этапы проведения. Использование системного анализа и поэлементной отработки конструкции каждой детали Ю.М. Соболевым. Применение функционально-стоимостного анализа.

    контрольная работа , добавлен 08.04.2012

    Теоретические и методологические основы экономического анализа, его предмет, объект, задачи. Характеристика принципов экономического анализа, подходы и особенности их использования на практике. Определение тенденций развития предприятия на основе анализа.

    курсовая работа , добавлен 20.12.2010

    Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.

    контрольная работа , добавлен 15.06.2009

    Сущность модели Ольсона как одной из наиболее перспективных современных разработок в теории оценки стоимости компании. ЕВО в практической оценке, особенности ее работы в России. Особенности линейной информационной динамики Ольсона и Фельтхама-Ольсона.

    контрольная работа , добавлен 07.04.2011

    Понятие экономической информации, ее сущность и особенности, классификация и разновидности, характеристика и отличительные черты. Сущность, предмет и объекты экономического анализа, цели и задачи. Взаимосвязь анализа с другими науками, его организация.

    шпаргалка , добавлен 05.04.2009

    Методы разработки экономико-математической модели: постановка задачи, система переменных и ограничений. Виды решения экономико-математической модели оптимизации производственной структуры сельскохозяйственного предприятия, анализ двойственных оценок.


Для построения скоринговых моделей (причем независимо от выбранного математического подхода) берется репрезентативная выборка из предыдущих заявителей (от нескольких тысяч до сотен тысяч - что не проблема для отрасли, обслуживающей десятки миллионов клиентов). Для каждого заявителя из выборки извлекается полная информация из анкеты-заявления и информация из его кредитной истории за фиксированный период времени (обычно 12, 18 или 24 мес.). Затем принимается экспертное решение, какую историю считать приемлемой, т.е. является ли клиент "хорошим" или "плохим". Чаще всего "плохим" считается клиент, не выплативший по кредиту 3 месяца подряд. Всегда оказывается некоторое число клиентов, которых нельзя отнести ни к "хорошим", ни к "плохим", поскольку
они либо недостаточно давно получили кредит (прошло слишком мало времени), либо их кредитная история "неясна" (например, были задержки по 3 месяца, но не подряд). Как правило, такие "промежуточные" клиенты исключаются из выборки.
Эмпирические требования к базе данных, используемых для построения скоринговой модели:
размер выборки - не менее 1500 всего, не менее 500 плохих;
четкое определение критерия "плохой"/"хороший". Далеко не всегда ясно, на каком этапе кредитной истории, по какому признаку и на каком уровне разделять "плохих" и "хороших";
четкое определение временного отрезка - периода жизни продукта (зависит от самого продукта и может меняться от месяца - мобильный телефон до десятилетий - ипотека);
стабильность состава клиентской группы - демография, миграции, сохранение привычек потребления;
неявное, но обязательное требование: стабильность экономических, политических, социальных и прочих условий.
При построении кредитных моделей существенным является выбор временного горизонта - отрезка времени между подачей заявления (выдачей кредита) и классификацией "плохой"/"хороший". Анализ показывает, что процент дефолта как функция длительности нахождения клиента с организацией поначалу растет и только через 12 месяцев (кредитные карты) и даже более (разовые займы) начинает стабилизироваться. Таким образом, меньший временной горизонт приводит к недооценке и не учитывает полностью всех характеристик, предсказывающих дефолт. С другой стороны, временной горизонт более двух лет оставляет модель подверженной к сдвигам в составе клиентской группы в течение этого времени, т.к. как состав клиентов в выборке в начале временного горизонта может оказаться существенно отличным от состава клиентов, приходящих в настоящее время. Фактически используются два единовременных среза (в начале и в конце временного горизонта) для создания модели, которая стабильна по времени (за пределами начального временного отрезка). Это и диктует выбор длины временного отрезка - временного горизонта при моделировании.
Другим чрезвычайно важным и дискутируемым вопросом остается соотношение "хороших" и "плохих" в выборке. Должно ли оно отражать реальное соотношение их в составе населения или их должно быть равное число (такое соотношение резко облегчает построение модели с математической точки зрения)?
Далее построение скоринговой модели превращается в классификационную проблему, где входными характеристиками (или параметрами) являются ответы на вопросы анкеты-заявления и параметры (или данные), получаемые в результате проверок из различных организаций (например, полиции, судов, местных советов, кредитных бюро и т.д.), а выходными характеристиками (ответом) - искомым результатом - является разделение клиентов на "хороших" и плохих" согласно имеющимся кредитным историям, сопоставленным по этим входным характеристикам.
Собственно рейтинговая таблица (scorecard) - это система придания численных баллов (счета) характеристикам (или параметрам) заемщика для получения искомого числового значения, которое отражает, с какой вероятностью у заемщика по отношению к другим заемщикам произойдет некое событие или он совершит определенное действие (аспект "по отношению" в определении очень важен).
Кредитная рейтинговая таблица, например, не показывает, какой уровень риска следует ожидать (скажем, какой процент кредитов данного типа, вероятно, не будет возвращен); вместо этого она показывает, как данный заем, скорее всего, будет вести себя по отношению к другим займам. Например, ожидается ли, что процент невозвратов или дефолтов для кредитов с данным набором атрибутов будет больше или меньше, чем у кредитов с другим набором.
Большинство рейтинговых таблиц построены с помощью расчета регрессионной модели - статистической модели, которая проверяет, как отдельный параметр (характеристика) влияет на другой параметр или (чаще всего) на целый набор других параметров.
Регрессионная модель дает в результате своего применения набор коэффициентов (factors), называемых регрессионными, которые можно интерпретировать как корреляцию между искомыми параметрами (которые необходимо определить) и объясняющими параметрами, сохраняя неизменными все остальные воздействия на искомые параметры. Эти коэффициенты превращаются в веса баллов (point weights) в рейтинговой таблице.
Самый часто используемый метод построения рейтинговых таблиц
Чаще всего для построения рейтинговых таблиц используется статистический метод логистической регрессии. Однако для объяснения этого подхода стоит начать с простой линейной регрессии, а потом перейти к логистической - как особого случая линейной.
В простейшем случае линейная регрессия пытается найти линейную связь между двумя переменными: X и К Переменная Y, которую пытаются спрогнозировать, определяется как зависимая (поскольку она зависит от X). Переменная X является объясняющей, поскольку она "объясняет", почему У меняется от одного индивидуума к другому.
С помощью линейной регрессии пытаются выяснить следующее: если меняется X, то насколько

вероятно, что в результате этого также изменится и К Для того чтобы это сделать, необходим набор данных, в котором можно наблюдать множество пар X и соответствующих ему К Когда они будут отложены на плоскости XY и будет получено некое множество, может оказаться, что оно ложится на некую прямую, т.е. есть определенная связь между X и Y, которую можно попытаться аппроксимировать с помощью уравнения:
Y = B_0 + B_1 x X_1
где
B0 - это величина Y, когда X = 0;
B1 - наклон прямой линии.
Эти В. являются коэффициентами регрессии. На практике, скорее всего, окажется несколько объясняющих переменных:
Y = B_0 + B_1 x X_1 + B_2 x X_2 + ... + B_n x X_n.
Логистическая регрессия в сравнении с линейной регрессией
При использовании скоринга, как правило, зависимая переменная принимает значения в очень небольшом диапазоне. Чаще всего работают с бинарной переменной, т.е. такой, которая принимает только два целых значения: так, например, по кредиту дефолт или произошел, или нет; клиент, получивший каталог по почте или ответил, или нет. Как правило, в таком случае дефолту приписывают значение "1", а выплаченному кредиту - значение "0".
Модель в итоге должна оценить вероятность дефолта по кредиту (или ответа клиента на каталог).
И хотя линейная модель иногда используется для расчета рейтинговой таблицы, логистическая регрессия оказывается много удобнее, поскольку она специально построена для случаев, когда зависимая переменная - бинарная (т.е. принимает, как мы уже говорили, только два значения).
Линейная регрессия может давать значения вероятности и меньше нуля, и больше единицы, что лишено смысла. Логистическая модель избегает этого, поскольку работает не с самим бинарным значением зависимой переменной, а с вероятностью или шансами (odds), что это значение действительно реализуется. Логарифм отношения вероятности реализации к вероятности нереализации называют логитом (logit), который может принимать любые значения, как отрицательные, так и положительные. Поэтому для логитов вполне можно использовать модель линейной регрессии (отсюда и название "логистическая").
В модели логистической регрессии объясняющие переменные, умноженные на свои коэффициенты, предполагаются линейными по отношению не к Y, как в линейной регрессии, а к логиту - натуральному логарифму отношения шансов:
ln (p/(1 - p)) = B_0 + B_1 x X_1 + B_2 x B_2 + X_2 + ... + B_n x X_n, где
р - вероятность того, что V произойдет;
р/(1 - р) - отношение шансов.
Шансы и соотношение шансов
Соотношение шансов позволяет сравнивать уровни рисков для разных кредитов. Так, если для одного р1/(1 - p_1) = 0,11, а для другого р2/(1 - р2) = 0,052, то их отношение составит 0,46, т.е. риск невозврата по одному кредиту составляет чуть меньше половины риска невозврата по второму кредиту.
Самые важные выводы из этого следующие: необходимо получать сами шансы и их отношения для разных кредитов из логистических регрессий, т.к. только так удается прямо сопоставить и учесть как влияние отдельных характеристик на уровень риска, так и относительный риск одного кредита по отношению к другому. Попытки обойтись одной рейтинговой таблицей не позволяют оценить рисковость одного кредита относительно другого в силу возможного влияния характеристик, которые были учтены для одного и не учтены для другого.
Вычисление относительных весов отдельных характеристик рейтинговой таблицы
Построив и оценив логистическую модель, можно подставить величины X для любого заявителя или кредита и вычислить счет (score), используя уравнение:

Однако этот счет представлен в шкале натуральных логарифмов, что неудобно для интерпретации. Поэтому счет переводится в линейную шкалу, где определенное число баллов выбирается так, чтобы это число обеспечивало удвоение шансов того, что определенное событие произойдет. Для этого необходимо умножить счет на множитель, равный числу баллов, которое должно представлять удвоение шансов, а затем поделить на 1n(2):
счет по линейной шкале = (В 1 х Х 1 + ... + Вп х Хп) х (20/1п(2)),
если желаемое число баллов, необходимое для удвоения шансов, равно 20.
Иначе, если надо узнать, сколько именно баллов дает каждая характеристика, можно умножить каждое В_1 на (20/(1n(2)), а затем умножить на значение параметра X_1.
Использование КС-статистики для оценки полученной рейтинговой таблицы
Скоринговая таблица конструируется так, чтобы ранжировать различные кредиты в терминах шансов по отношению к определенному событию. Необходимо, чтобы такая скоринговая таблица приписывала кредитам, с которыми происходит некое событие, и кредитам, с которыми оно не происходит, различные счета.
Например, кредитная скоринговая таблица (скоринговая карта) приписывает меньший счет тем кредитам, которые впоследствии испытают серьезные трудности с возвратом или перейдут в дефолт, так что в целом группа плохих кредитов должна иметь меньшие счета, чем группа хороших кредитов.
Для определения качества полученной таблицы строятся графики - кривые распределения процентов хороших и процентов плохих кредитов (от соответствующего общего числа хороших и плохих) в зависимости от величины счета, и качество скоринговой таблицы (карты) характеризуется тем, насколько эти две кривые разделяются.
Именно для численного определения качества разделения и используется статистика Колмогорова-Смирнова (K-S statistics), которая дает числовую меру этого разделения. Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" и кумулятивным процентом распределения "плохих". Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75.
Примерная градация выглядит так:
меньше 20 - наверное, скоринговая таблица непригодна к применению;
20-40 - неплохая таблица;
41-50 - хорошая таблица;
51-60 - очень хорошая таблица; />61-75 - поразительно хорошая таблица;
больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно* (128).
Следует отметить, что качество скоринговых моделей следует постоянно проверять и мониторинг является обязательной процедурой в процессе эксплуатации. Со временем могут меняться как экономические условия, так и поведенческие особенности заемщиков, и только своевременная подстройка или даже замена скоринговых моделей обеспечат эффективное управление кредитными рисками.

Дубовицкий В. С.
аналитик крупного российского банка
(г. Москва)
Управление корпоративными финансами
05 (65) 2014

В данной статье описано исследование по разработке скоринговой модели для оценки кредитоспособности крупных торговых предприятий, позволяющей на основе значений отдельных показателей судить о состоятельности заемщика, оценивается ее эффективность. Наиболее объемными блоками в разработке скоринговой модели являются выбор системы оценочных показателей и определение весовых коэффициентов для этих показателей, что будет подробно освещено в данной статье

ВВЕДЕНИЕ

Одно из ключевых направлений бизнеса в банковской сфере - кредитование. Именно кредиты являются основой банковских активов, обеспечивая банку процентный доход. В последнее время в нашей стране происходит бурное развитие банковской сферы, прежде всего кредитных отношений банков с населением, предпринимателями и крупным бизнесом. Кредиты подразумевают не только процентные доходы, но и кредитные риски, связанные с несостоятельностью заемщика и потерей ссуды. Оценка величины кредитного риска является ключевым направлением анализа при принятии решения о кредитовании того или иного заемщика, и от нее во многом зависит благосостояние финансового учреждения.

В наши дни банки используют различные методы анализа, оценивая уровень возможных потерь и вероятность дефолта заемщика. Исходя из этого анализа заемщику присуждается рейтинг качества - «хороший», «средний» или «плохой», согласно Положению ЦБ РФ №254-п «О порядке формирования кредитными организациями резервов на возможные потери по ссудам, по ссудной и приравненной к ней задолженности» от 26 марта 2004 г.

Центральный банк выступает главным регулятором кредитной системы и дает рекомендации по оценке кредитоспособности заемщиков. В соответствии с ними банки выстраивают свои модели оценки - их многообразие и изобретательность их авторов поражают. Такие модели включают комплексную оценку финансового состояния заемщика как главного показателя будущей платежеспособности. Однако все модели нацелены на кредитный рейтинг заемщика, описывающий уровень риска финансовых потерь. Согласно общепринятой классификации, хороший уровень кредитоспособности соответствует хорошему финансовому состоянию компании и низкому риску возможных потерь, средний - среднему финансовому состоянию и средним рискам, плохой - высокой вероятности дефолта заемщика. По хорошему состоянию, вероятнее всего, будет вынесено положительное решение о выдаче ссуды, среднее потребует дополнительных исследований, а плохому заемщику будет отказано.

Оценка кредитного риска в банках всегда занимала весомое положение. Так, согласно исследованиям Bailey и Gately , существующие методы оценки непрестанно совершенствуются, время от времени появляются новейшие методики, такие как оценка при помощи нейронных сетей, что вызвано высоким спросом со стороны кредитных организаций на оптимизацию и улучшение прогнозной способности инструментов для оценки вероятности дефолта потенциальных заемщиков.

Итак, оценка кредитоспособности является ключевой задачей при выдаче кредита. Цель данной работы - создание собственной скоринговой модели для оценки кредитного качества юридических лиц. Она будет разработана для крупных предприятий розничной торговли и позволит оперативно принимать решение о целесообразности финансирования различных заемщиков.

Вначале будет произведен краткий сравнительный анализ существующих подходов к оценке кредитоспособности. На его основании будут приведены аргументы в пользу разработки скоринговой модели, затем будет непосредственно разработана скоринговая модель с использованием различных теоретических методов. Одни из главных задач при разработке - определение сбалансированной системы оценочных показателей с учетом выбранной отрасли и определение весовых коэффициентов для этих показателей.

Далее будет проведено статистическое исследование на основе выборки из 41 торгового предприятия (для 16-ти из них был зафиксирован дефолт) с целью сопоставить результаты по весам показателей с результатами, полученными первоначально. По итогам сравнения будет дано заключение о корректности составленной скоринговой модели. В заключение данной статьи будет представлена оценка эффективности разработанной модели, определена прогнозная способность разработанной модели и сделан вывод о ее состоятельности.

РАЗЛИЧНЫЕ ПОДХОДЫ К ОЦЕНКЕ КРЕДИТОСПОСОБНОСТИ

Все существующие модели оценки кредитоспособности заемщиков можно представить в виде следующей классификации (рис. 1).

Итак, многообразие подходов к анализу кредитоспособности можно систематизировать, разделив все методы на три больших блока:

  • количественные модели;
  • прогнозные модели;
  • качественные модели.

Количественные модели используют соответствующие показатели и позволяют присвоить заемщику на их основе определенный рейтинг, прогнозные опираются на статистику прошлых лет и нацелены на моделирование дальнейшего развития событий и вероятности дефолта заемщика, а качественные модели используют систему разносторонних качественных показателей.

Для определения наиболее эффективного подхода к оценке кредитоспособности сопоставим описанные методы оценки. В табл. 1 приведены сравнительные характеристики рассмотренных ранее моделей оценки кредитов.

Таблица 1. Сводная таблица моделей оценки кредитоспособности

Наименование модели Достоинства модели Недостатки модели
Метод коэффициентов Позволяет комплексно оценить финансовое состояние заемщика Не учитывает качественные показатели, статистику прошлых лет. Неавтоматизированная система требует постоянной интерпретации значений отдельных показателей
Рейтинговые модели Позволяют автоматизировать оценку методом коэффициентов путем вычисления интегрального показателя. Отличаются удобством и простотой использования Учитывают только финансовые показатели, не используют статистику прошлых лет. Требуют перестройки для различных типов компаний
Скоринговые модели Позволяют получить оценку кредитоспособности в балльном эквиваленте и отнести заемщика к одной из трех групп. Просты и удобны в использовании, помогают оценивать нефинансовые качественные показатели. При оценке весовых коэффициентов статистическими методами позволяют учесть данные по уже выданным кредитам, являются экономически обоснованными Не универсальны, требуют перестройки под определенные типы компаний. Требуют большого объема данных для исследования весовых коэффициентов
Модели Cash Flow Позволяют оценить будущие денежные потоки компании и сопоставить их с долговой нагрузкой Не учитывают рыночную конъюнктуру и качественные показатели компании-заемщика. Могут давать несовместимые с реальностью результаты
Модели дискриминантного анализа Позволяют определить вероятность дефолта компании-заемщика на основе статистики за прошлые годы
Модели регрессионного анализа Позволяют определить вероятность дефолта компании-заемщика на основе статистики прошлых лет. При использовании модели на корректных данных можно получить результаты высокой степени достоверности Сугубо эмпирические, результаты сильно зависят от обучающей выборки и при исследовании модели на других данных зачастую не соответствуют реальности. Требуют большого объема данных для исследования весовых коэффициентов
Модели качественного анализа Позволяют провести комплексный анализ компании Отсутствие математических методов, приводящее к субъективной оценке отдельных показателей и к ошибкам, связанным с человеческим фактором. Не учитывают статистику прошлых лет. Нет четких регламентов оценки кредитоспособности для качественных блоков анализа

Опираясь на приведенный сравнительный анализ, можно сделать вывод, что скоринговая модель находится на вершине эволюции количественных Наименование модели Достоинства модели Недостатки модели

Метод коэффициентов Позволяет комплексно оценить финансовое состояние заемщика Не учитывает качественные показатели, статистику прошлых лет. Неавтоматизированная система требует постоянной интерпретации значений отдельных показателей

Рейтинговые модели Позволяют автоматизировать оценку методом коэффициентов путем вычисления интегрального показателя. Отличаются удобством и простотой использования Учитывают только финансовые показатели, не используют статистику прошлых лет. Требуют перестройки для различных типов компаний

Скоринговые модели Позволяют получить оценку кредитоспособности в балльном эквиваленте и отнести заемщика к одной из трех групп. Просты и удобны в использовании, помогают оценивать нефинансовые качественные показатели. При оценке весовых коэффициентов статистическими методами позволяют учесть данные по уже выданным кредитам, являются экономически обоснованными Не универсальны, требуют перестройки под определенные типы компаний. Требуют большого объема данных для исследования весовых коэффициентов

Модели Cash Flow Позволяют оценить будущие денежные потоки компании и сопоставить их с долговой нагрузкой Не учитывают рыночную конъюнктуру и качественные показатели компании-заемщика. Могут давать несовместимые с реальностью результаты

Модели дискриминантного анализа Позволяют определить вероятность дефолта компании-заемщика на основе статистики за прошлые годы Сугубо эмпирические, результаты сильно зависят от обучающей выборки и при исследовании модели на других данных зачастую не соответствуют реальности. Требуют большого объема данных для исследования весовых коэффициентов

Модели регрессионного анализа Позволяют определить вероятность дефолта компании-заемщика на основе статистики прошлых лет. При использовании модели на корректных данных можно получить результаты высокой степени достоверности Сугубо эмпирические, результаты сильно зависят от обучающей выборки и при исследовании модели на других данных зачастую не соответствуют реальности. Требуют большого объема данных для исследования весовых коэффициентов

Модели качественного анализа Позволяют провести комплексный анализ компании Отсутствие математических методов, приводящее к субъективной оценке отдельных показателей и к ошибкам, связанным с человеческим фактором. Не учитывают статистику прошлых лет. Нет четких регламентов оценки кредитоспособности для качественных блоков анализа разное количество баллов. Значения коэффициентов в дальнейшем будут разбиты на диапазоны. Для каждого диапазона (столбец «Диапазон коэффициента» в табл. 2) будет установлена процентная доля (25%, 50%, 75% или 100%) от весового коэффициента в табл. 2. Весовой коэффициент в данном случае является максимальным баллом. В дальнейшем речь пойдет именно о поиске весовых коэффициентов. Таким образом, разбивка коэффициентов на диапазоны является условной (основана на логических соображениях исходя из значений данных показателей для различных компаний отрасли; интервалы взяты таким образом, чтобы во второй интервал после максимального попало порядка 60% ведущих компаний отрасли («Магнит», «Дикси», Х5 Retail Group, «ОК», «Л"Этуаль»), выбранных для определения среднерыночных коэффициентов и ориентиров). Чем выше долговая нагрузка, тем выше вероятность дефолта и тем меньшее количество баллов должен получить показатель. Эмпирические же методы сконцентрированы на поиске весовых коэффициентов и будут представлены двумя подходами - аналитическим (метод Т. Саати) и статистическим (регрессионное исследование) (максимальное количество баллов в данном случае совпадает с весовым коэффициентом). Сами же весовые коэффициенты будут определены позже.

Финансовые показатели скоринговой модели представлены в табл. 2.

Таблица 2. Финансовые показатели скоринговой модели

Группа показателей Показатель Диапазон коэффициента
Ликвидность > 0,75 1
0,5-0,75 0,75
0,25-0,5 0,25
0-0,25 0
Платежеспособность 0-1 1
1-1,5 0,75
1,5-2 0,5
2-2,5 0,25
> 2,5 0
< 1,5 1
1,5-2 0,5
> 2 0
Коэффициент покрытия процентов, EBIT/Interest > 1,5 1
1,3-1,5 0,75
1-13 0,5
< 1 0
Деловая активность Рентабельность продаж, ROS > 0,025 1
0,02-0,025 0,75
0,015-0,02 0,5
< 0,015 0
Убыток компании за три последние отчетных периода Нет 1
За один отчетный период 0,5
0

Допустимые значения коэффициентов определялись на основе средних значений для пяти ведущих торговых предприятий России на основе отчетности МСФО за три года: «Магнит», Х5 Retail Group, «Дикси», «ОК», «М.Видео». Мы рассмотрели важнейшие финансовые показатели для определения финансового состояния заемщика. Однако большое влияние на кредитоспособность компании оказывают также факторы, провоцирующие возникновение рисков в бизнес-процессах заемщика. Прежде всего необходимо учесть качество менеджмента. Это весьма трудный показатель для количественного анализа, т.к. проблематично объективно оценить уровень управления компанией.

Постараемся перейти от качественной к количественной оценке и зададим максимальную оценку этого показателя при выполнении следующих условий:

  • имеется четкая стратегия развития компании на ближайшие годы;
  • неизменен состав топ-менеджмента (генеральный директор и главный бухгалтер занимают должности более двух лет), т.к. о наличии сильной команды менеджеров говорит в числе прочего и ее постоянство;
  • профессиональные компетенции соответствуют высоким требованиям (наличие профильного высшего образования у генерального директора и главного бухгалтера, опыт работы - более пяти лет).

Следующий важный фактор, который будет включен в скоринговую модель, - это срок функционирования компании. Кроме того, необходимо ввести стоп-фактор: при сроке ведения бизнеса меньше одного года данная модель будет неприменима ввиду отсутствия отчетности и возможности понять бизнес компании.

Еще один необходимый показатель - положительная кредитная история. Это один из важнейших нефинансовых показателей, характеризующий, по сути, качество обслуживания будущей ссуды. Было бы необоснованно рассчитывать на своевременный возврат кредитных средств от предприятия, имеющего просрочки другим кредиторам. Представим рассмотренные нефинансовые показатели и распределение баллов по ним в табл. 3.

Таблица 3. Нефинансовые показатели скоринговой модели

Группа Показатели показателей Доля от максимального количества баллов для диапазона
Бизнесс-процессы Качество менеджмента 1
0,5
0
> 5 лет 1
3-5 лет 0,75
1-3 года 0,25
< 1 года Стоп-фактор
1
0,5
0
Наличие систематической просрочки по кредитам и займам за последний финансовый год; существенный объем просрочки по кредиторской задолженности (> 25%) Стоп-фактор

Мы составили систему оценочных показателей, которая, по нашему мнению, должна комплексно и разносторонне оценивать качество заемщика и его способность выполнять свои обязательства. Следующая часть работы при создании любой скоринговой модели наиболее трудоемкая - это определение веса различных оценочных показателей. Оттого, насколько объективно мы оценим важность тех или иных факторов, зависит прогнозная ценность нашей модели. В данной статье будет проведен анализ весов на основе нескольких методов для исключения возможных ошибок.

Весовые коэффициенты вначале будут определены с помощью аналитических процедур, а затем сопоставлены с результатами регрессионного анализа.

АНАЛИТИЧЕСКАЯ ОЦЕНКА ВЕСОВЫХ КОЭФФИЦИЕНТОВ МОДЕЛИ

В качестве инструмента оценки возьмем методику, подробно описанную в книге ТЛ. Саати «Математические модели конфликтных ситуаций» [б]. Данный метод позволяет уйти от многообразия факторов и сравнить на предмет значимости в конкретный момент времени только два из них, в конечном счете определив значимость влияния каждого из факторов на какой-либо общий показатель. Методика основана на составлении матриц парных сравнений, которые строятся для факторов, влияющих на какой-либо общий показатель. Такие матрицы могут быть построены, например, для показателя платежеспособности в разрезе факторов, представленных коэффициентами финансового рычага, долговой нагрузки и покрытия процентов. Задача состоит в том, чтобы построить такие матрицы для всех групп факторов, влияющих на какие-либо общие показатели. В итоге будут созданы две матрицы для табл. 2 - для групп показателей «Платежеспособность» и «Деловая активность», одна матрица для табл. 3 - для показателей бизнес-процессов, а также две матрицы для агрегированных уровней - одна матрица для группы финансовых показателей, состоящей из групп показателей «Ликвидность», «Платежеспособность» и «Деловая активность», и одна для двух агрегированных блоков - финансовых и нефинансовых показателей в целом.

Итого пять попарных матриц сравнения, каждая из которых даст свой коэффициент для входящего в нее показателя. Таким образом, чтобы получить весовой коэффициент для показателя на нижней ступени иерархии, например для коэффициента покрытия процентов, необходимо умножить весовой коэффициент финансовых показателей на весовой коэффициент показателей платежеспособности внутри финансовых показателей и на коэффициент показателя покрытия процентов внутри финансовых показателей.

В заголовках самих матриц для групп показателей в вертикальных и горизонтальных столбцах помещаются наименования факторов. Затем матрицы заполняются значениями, представляющими собой трансформацию субъективных предпочтений одного фактора другому в эмпирический вид согласно методике, представленной в табл. 4 (с использованием данных рис. 2).

Таблица 4. Метод Т. Саати. Классификация предпочтений (на основе рис.2)

В основном применяются нечетные числа, однако при затруднении в выборе можно воспользоваться четными как средним уровнем между двумя нечетными. Пример такой матрицы для четырех факторов показан на рис. 2. Соответственно, когда мы сравниваем один и тот же фактор, элемент принимает значение 1, поэтому такие матрицы являются единичными. Нетрудно заметить, что они также обратно симметричны, что позволяет нам заполнить такую матрицу только для значений, лежащих либо выше, либо ниже главной диагонали.

Учитывая, что матрицы попарных сравнений являются обратно симметричными, следует произвести сравнение только в одну сторону и внести соответствующие значения в матрицу над главной диагональю, а значения под главной диагональю будут обратными.

После получения пяти таких матриц производится расчет весовых коэффициентов: будет измерен вес каждого значения в матрицах относительно общей суммы в столбце, а затем из этих значений в каждой строчке будет взято среднее арифметическое по этим значениям. Среднеарифметические значения и будут представлять собой весовые коэффициенты. Пример матрицы для группы показателей платежеспособности представлен на рис. 3.

Произведя описанные расчеты, получим удельный вес каждого показателя. Для удобства дальнейших расчетов определим максимально возможный балл как произведение удельного веса показателя на 50 1 с последующим округлением до целого числа (табл. 5,6).

1 Данная операция произведена исключительно для удобства, число 50 позволяет минимальному коэффициенту перейти к целочисленному значению (в данном случае значению 2). Поскольку все коэффициенты умножаются на одно и то же число, мы не искажаем результатов аналитического подхода. - Прим. авт.

ОПРЕДЕЛЕНИЕ ЗНАЧИМОСТИ ПОКАЗАТЕЛЕЙ С ПОМОЩЬЮ РЕГРЕССИОННОГО АНАЛИЗА

Для проведения статистического исследования мы использовали данные по 41 крупной компании из сектора розничной торговли. Эти компании выпускали корпоративные облигации, и по 16 облигациям был зафиксирован дефолт. По каждой компании были рассчитаны восемь выбранных показателей скоринговой модели на основе годовой отчетности в год выпуска корпоративных облигаций. Выборка представлена в Приложении 1. В нем задан объясняемый показатель у- вероятность дефолта, принимающий значение 1, если компания не исполнила свои обязательства. Выделенные три показателя справа были заданы дамми-переменными (могут принимать только значения 0 или 1) ввиду их качественной природы. Они принимают значения 1, если за последние три года у компании чистая прибыль > О (Nl > 0), стабильный и качественный руководящий состав (manager) и положительная кредитная история (histor). Финансовые показатели (первые пять показателей) рассчитывались на основе годовой отчетности по стандартам МСФО в год выпуска дефолтных облигаций.

В качестве модели для исследования выберем построение линейной многофакторной регрессии:

p = w 0 + w 1 x 1 + w 2 x 2 + ... + w n x n ,

где р - зависимая переменная, описывающая вероятность дефолта;
w - весовые коэффициенты; х - показатели.

Итак, введем исходные данные в Excel и воспользуемся функцией Data analysis - Regression. При анализе исходных данных по восьми показателям скоринговой модели без корректировок получаем результат, представленный в Приложении 2. Adjusted R^2 равняется 0,55 - невысокое, но приемлемое значение, говорящее о практической значимости построенной регрессии. Можно выдвинуть предположение о причине невысокой значимости наличия выбросов в данных, например, отсутствие значений для некоторых компаний по показателю EBIT / Interest ввиду отсутствия долговой нагрузки (упрощенно в целях исследования в таком случае принималось значение коэффициента, равное 0) или отрицательное значение показателя Debt / EBITDA ввиду отрицательного денежного потока. В данном случае некорректно воспринимается влияние отрицательного показателя, т.к., по логике исследования, чем выше Debt / EBITDA, тем выше вероятность дефолта; отрицательный показатель, в свою очередь, не является показателем низкой долговой нагрузки. Также на прогнозную способность влияют компании с ярко выраженными экстремальными значениями отдельных показателей. Так, у компании «Банана-Мама» собственный капитал составляет 10 000 руб., что приводит к искажению соответствующих показателей - финансовый рычаг равен 181 957 (при среднеотраслевых значениях в диапазоне 0,7-1,5).

Таблица 5. Финансовые показатели с учетом веса

Показатель Вес в системе показателей Максимальный балл Диапазон коэффициента
>1 5
Коэффициент текущей ликвидности 0,1072 5 > 1 5
0,75-0,1 4
0,5-0,75 1
0-0,5 0
Коэффициент текущей ликвидности 0,1581 8 < 1 8
1-1,5 6
1,5-2 4
2-2,5 2
> 2,5 0
Коэффициент долговой нагрузки, Net Debt / EBITDA 0,1581 8 < 1.5 8
1,5-2 4
> 2 0
0,0790 4 > 1,5 4
1,3-1,5 3
1-1,3 2
< 1 0
Рентабельность продаж, ROS 0,1256 6 > 0,025 6
0,02-0,025 5
0,015-0,02 3
< 0,015 0
0,0418 2 Нет 2
За один отчетный период 1
За два отчетных периода и более 0
Итого 0,6698 33 - 68

Исключим следующие шесть компаний из исследования: супермаркет «Город», «Интертрейд», М.Видео» (2013 г.), «Связной», «Банана-Мама», «Провиант». Также отметим невозможность одновременного использования показателей ROS и отсутствия убытков (Nl > 0) ввиду их высокой корреляции. Дело в том, что при наличии убытков у компании рентабельность продаж автоматически принимает отрицательное значение.

Таблица 6. Нефинансовые показатели с учетом веса

Показатель Вес в системе показателей Максимальный балл Диапазон коэффициента / методика оценки Количество баллов для диапазона с учетом веса
Качество менеджмента 0,099 5 Выполнение всех описанных условий 5
Невыполнение одного из условий 2,5
Невыполнение более чем одного условия 0
Срок функционирования компании 0,0528 3 > 5 лет 3
3-5 лет 2
1-3 года 1
< 1 года Стоп-фактор
Положительная кредитная история 0,1782 9 Отсутствие просрочек по кредитам и займам, просроченной кредиторской задолженности 9
Наличие информации о реструктуризации задолженности; незначимые просрочки по кредиторской задолженности (до 10%) 4,5
Единичный случай просрочки по займам и кредитам с последующим погашением; значимые просрочки по кредиторской задолженности (10-25% от общего объема задолженности) 0
Наличие систематической просрочки по кредитам и займам за последний финансовый год; существенный объем просрочки по кредиторской задолженности (>25%) Стоп-фактор
Итого 17

Опираясь на данные рассуждения, удалим показатель Nl > 0 из нашей модели. Для новой семифакторной регрессии на обновленной выборке из 35 компаний получим следующий результат (Приложение 3). Мы видим, что значимы шесть из семи исследуемых показателей. Знаки при коэффициентах верно отражают предположения, высказанные выше: чем выше рентабельность продаж и качество менеджмента, тем ниже вероятность дефолта (у = 1), и наоборот: чем выше долговая нагрузка, тем выше вероятность дефолта. На первый взгляд знак неправилен только у коэффициента текущей ликвидности. Однако большие значения ликвидности так же плохи, как и малые, - они говорят о низкой эффективности бизнеса и недополученной прибыли. Компании с большими коэффициентами ликвидности склонны к недополучению прибыли, низкой рентабельности и доходности бизнеса, что делает их менее привлекательными в глазах потенциальных инвесторов, а следовательно, и более уязвимыми к изменениям финансовых условий. Наиболее значимыми являются коэффициенты D (или Debt - объем процентного долга) / EBITDA, положительная кредитная история и финансовый рычаг; коэффициент покрытия процентов незначим.

Выше при моделировании коэффициентов по методу Т. Саати мы также предполагали, что наиболее значимыми показателями окажутся коэффициенты при долговой нагрузке и финансовом рычаге. Сравнительный анализ итоговых значимостей коэффициентов приведен в табл. 7.

Таблица 7. Сравнительный анализ значимости коэффициентов

Показатель на основе экспертных оценок по методу Т. Саати Коэффициент Показатель на основе регрессионного анализа P-value
Положительная кредитная история 0,1782 Коэффициент долговой нагрузки, Net Debt / EBITDA 0,014
Коэффициент финансового рычага 0,1581 Положительная кредитная история 0,020
Коэффициент долговой нагрузки, Net Debt /EBITDA 0,1581 Коэффициент финансового рычага 0,022
Рентабельность продаж, ROS 0,1256 Качество менеджмента 0,037
Коэффициент текущей ликвидности 0,1072 Рентабельность продаж, ROS 0,039
Качество менеджмента 0,099 Коэффициент текущей ликвидности 0,047
Коэффициент покрытия процентов, EBIT / Interest 0,0790 Коэффициент покрытия процентов, EBIT / Interest Незначим
Убыток компании за последние три отчетных периода 0,0418 Убыток компании за последние три отчетных периода Исследовался как нефинансовый показатель, незначим

Данные результаты говорят о согласованности метода Т. Саати и статистических данных. Три наиболее значимых показателя по аналитическому подходу подтверждают свою высокую значимость и в практическом исследовании, изменилось только распределение очередности самих показателей. Также два наименее значимых по первой части работы показателя - качество менеджмента и EBIT/ Interest - оказались незначимы в статистическом исследовании.

Таким образом, регрессионный анализ подтверждает принципы классификации значимости весовых коэффициентов в аналитической части работы и позволяет говорить о статистической значимости построенной скоринговой модели.

ОПРЕДЕЛЕНИЕ РЕЗУЛЬТАТОВ РАЗРАБОТАННОЙ СКОРИНГОВОЙ МОДЕЛИ

Общее максимальное количество баллов скоринговой модели - 50. Для каждого показателя в процессе определения диапазонов значений мы выявляли следующий после максимального количества баллов уровень, также приемлемый, хоть и с относительно высоким уровнем риска, основываясь на рыночных значениях показателей. Для одних показателей следующий за максимальным уровень составлял 75% от общего количества баллов, для других - 50%. Все последующие уровни будем считать уровнями с высоким кредитным риском и относить соответствующих заемщиков к категории плохих. К наиболее предпочтительной группе отнесем заемщиков, выполняющих максимальные требования по самым значимым (по весовым коэффициентам) показателям: кредитная история, финансовый рычаг и долговая нагрузка, а также рентабельность продаж в сумме 31 балл и выполнение как минимум следующего за максимальным уровня требований по остальным показателям - 12,5 в сумме. Итого 43,5 балла за нижний уровень высокой кредитоспособности.

Для определения пограничного интервала, характеризующего высокую степень кредитоспособности, рассчитаем количество баллов по финансовым и нефинансовым показателям в следующем после максимального диапазоне значений из табл. 5 и б. Показатели разделены по принимаемым значениям коэффициентов на другие диапазоны. Мы получим следующую классификацию (табл. 8).

Таблица 8. Классификация результатов

Таблица 9. Прогнозная способность скоринговой модели, %

Основываясь на табл. 8, произведем оценку прогнозной способности нашей модели, подставляя данные компаний в ее условия. В Приложении 4 приведены рассчитанные скоринговые баллы для исследуемых компаний. В зависимости от значения показателя в таблице проставлялась его балльная оценка согласно разработанной модели, а затем все баллы суммировались в интегральный показатель (столбец «Сумма»). На основании суммы баллов производилось распределение компаний по трем классам, затем данные сравнивались с фактическим наличием или отсутствием дефолта у компании. В столбце «Верно или нет», 1 означает верный результат скоринговой модели, 0 - ошибку. Таким образом, мы получили следующий результат (табл. 9).

Мы получили средний (относительно описанных в различных источниках) результат для прогнозной способности скоринговых моделей. Однако стоит отметить низкий процент ошибок второго рода, что повышает прогнозную ценность нашей модели. Данный результат можно считать положительным и подтверждающим эффективность проведенного исследования.

ЗАКЛЮЧЕНИЕ

В данной работе была предложена скоринговая модель для оценки кредитоспособности крупных розничных торговых предприятий. Модель основывается на комплексе оценочных показателей, позволяющих разносторонне оценить финансовое и нефинансовое состояние заемщика.

По результатам оценки заемщику присуждается один из трех классов кредитоспособности, характеризующий степень кредитного риска и целесообразность кредитования.

Мы смоделировали систему оценочных показателей, позволяющих наиболее точно оценить состояние заемщика из сектора розничной торговли. Произведя анализ лидеров рынка розницы и рассчитав для них используемые показатели, мы определили для них границы приемлемых значений и ранжировали по разным группам с разным процентом от максимально возможного балла.

Наиболее трудоемкой задачей было определение весовых коэффициентов при исследуемых показателях. Был сделан вывод о необходимости комплексного подхода ввиду отсутствия какого-то одного идеального метода. Комплексный подход был реализован следующим образом: в первой части работы весовые коэффициенты определялись с помощью аналитических процедур, а во второй - с помощью статистического исследования.

Разработанная модель показала высокие результаты в прогнозной способности, при этом она не требует больших ресурсных затрат на проведение анализа. Введение в эксплуатацию разработанной скоринговой системы позволит увеличить эффективность принятия кредитных решений в сфере крупных предприятий розничной торговли и оптимизировать кредитный процесс.

Литература

1. Айвазян С.А., Мхитарян B.C. Прикладная статистика и основы эконометрики. - М.: ГУ ВШЭ, 1998.

2. Гаврилова A.H. Финансы организаций. - М.: Кнорус, 2007.

3. Коробова Г.Г., Петров М.А. Состоятельность банковского заемщика и ее оценка в условиях конкуренции // Банковские услуги. -2005. -№7/8. -C. 22-24.

4. Куликов Н.И., Чайникова Л.И. Оценка кредитоспособности предприятия-заемщика. - Тамбов: Университет ТГТУ, 2007.

5. Положение ЦБ РФ №254-П «О порядке формирования кредитными организациями резервов на возможные потери по ссудам, по ссудной и приравненной к ней задолженности» от 26 марта 2004 г. - http://base.garant.ru/584458/.

6. Саати Т.Л. Математические модели конфликтных ситуаций / Под ред. И.А. Ушакова. - М.: Советское радио, 1977.

7. Шеремет А.Д., Сайфулин P.C., Негашев H.B. Методика финансового анализа. - М.: Инфра-М, 2001.

8. Abdou Н.А., Pointon J. (2011). «Credit scoring, statistical techniques and evaluation criteria: a review of the literature». Intelligent Systems in Accounting, Finance & Management, Vol. 18, No. 2-3, pp. 59-88.

9. Bailey M. (2004). Consumer Credit Quality: Underwriting, Scoring, Fraud Prevention and Collections. White Box Publishing, Kingswood, Bristol.

10. Crook J., Edelman D., Thomas L. (2007). «Recent developments in consumer credit risk assessment». European Journal of Operational Research, Vol. 183, No. 3, pp. 1447-1465.

11. Gately E. (1996). Neural Networks for Financial Forecasting: Top Techniques for Designing and Applying the Latest Trading Systems. New York: John Wiley & Sons, Inc.

12. Guillen М., Artis M. (1992). Count Data Models for a Credit Scoring System: the European Conference Series in Quantitative Economics and Econometrics on Econometrics of Duration, Count and Transition Models. Paris.

13. Heffernan S. (2004). Modern Banking. John Wiley & Sons, Inc., Chichester, West Sussex.

14. Liang Q. (2003). «Corporate financial distress diagnosis in China: empirical analysis using credit scoring models». Hitotsubashi Journal of Commerce and Management, Vol. 38, No. 1, pp. 13-28.

ПРИЛОЖЕНИЕ 1.

Выборка для исследования

Компания y / Признак дефолта Коэффициент текущей ликвидности EBIT / Interest/ Отношение EBIT к процентным платежам NI > 0/ Наличие чистой прибыли
1 Аптека 36,6 0 0,82 1,32 2,41 1,83 0,0496 1 1 1
2 Л"Этуаль 0 5,04 2,75 10,98 1,64 0,007 1 1 1
3 Кора 0 0,795 0,77 3,13 1,89 0 0 1 1
4 Лента 0 0,75 9,7 2,91 3,1 0,049 1 1 1
5 ОК 0 0,67 0,78 1,59 7,01 0,0357 1 1 1
6 Автомир 0 1,2 0,65 3,09 1,35 0,04 1 1 1
7 Х5 Retail Group 0 0,55 0,53 3,32 2,82 0,027 1 1 1
8 Город 0 0,99 18,97 10,25 1,29 0,01 1 1 0
9 Детский мир 0 0,93 0,83 2,14 3,99 0,032 1 1 1
10 Дикси 0 0,77 1,19 6,1 1,78 0,01 1 1 1
11 ИнтерТрейд 0 1,24 20,65 4,92 2,1 0,015 1 1 0
12 Карусель 0 0,73 0,68 3,175 1,71 0,059 1 1 1
13 Копейка 0 0,68 2,93 7,03 1,82 0 0 1 1
14 Kosmos Group 0 1,64 1,11 2,88 2,65 0,043 1 1 1
15 Магнит 0 и 0,54 1,11 10,2 0,061 1 1 1
16 Магнолия 0 0,27 2,35 3,55 1,02 0,064 1 1 1
17 М.Видео (2007 г.) 0 1,31 0,73 1,9 2,58 0,013 1 1 1
18 М.Видео (2013 г.) 0 0,95 0 0 0 0,039 1 1 1
19 ОАО «НТС» 0 1,18 3,09 5,44 1,05 0,21 1 0 1
20 Обувь России 0 0,87 2,34 1,87 5,65 0,1 1 1 1
21 Перекресток (2005 г.) 0 0,54 1,09 3,16 3,92 0,026 1 1 1
22 Пивдом 0 1,99 3 8 1,1 0,0006 1 0 1
23 Семья 0 10 0,28 1,66 6 0,58 1 1 1
24 Связной 0 1,07 0 0 0 0,001 1 1 1
25 Элекам 0 1,44 1,82 4,25 1,3 0,01 1 1 1
26 Макро 1 1 15 11 1,52 0,01 1 0 1
27 Престиж-экспресс 1 8 0,98 12,43 1,02 0,002 1 0 1
28 Арбат-Престиж 1 0,49 1,81 7,6 1,45 0,017 1 1 0
29 Орхидея 1 3 1,164 13 0 0,01 1 0 1
30 Банана-Мама 1 0,94 181957 -35 -0,6 -0,033 0 1 0
31 Белый фрегат 1 7 932 8,76 0,88 -0,4 0 1 1
32 Марта 1 3,96 20 11 1/17 0,003 1 1 1
33 Матрица 1 2,38 21 6,82 1 0,001 1 0 0
34 Меркурий
(Самохвал)
1 1,12 9,98 7,32 1,27 0,003 1 1 1
35 Миннеско 1 0,79 4,39 12 0,12 -0,047 0 1 1
36 Мосмарт 1 12 5 8 1,5 0 0 0 0
37 Полесье 1 7,93 15 14 1,03 0,003 1 0 1
38 Провиант 1 0,12 35557 0 0 -0,819 0 0 1
39 Седьмой континент 1 1,93 0,41 1,52 1,35 0,07 1 0 1
40 Техносила 1 14 18 10,36 1 0,002 1 1 1
41 ТОАП 1 7 22 10,83 1,04 0,009 0 0 1

Примечание: если у компании был зафиксирован дефолт, то коэффициенту принимает значение 1, и 0, если дефолта не было.

ПРИЛОЖЕНИЕ 2.

Регрессия по восьми факторам для 41 компании

Регрессия и остаток DF / Число степеней свободы SS / Сумма квадратов MS = SS / DF F-статистика Significance F / Значимость
Regression / Регрессия 8 6,250849408 0,781356176 7,133131961 2,17209Е-05
Residual / Остаток 32 3,505248153 0,109539005 - -
Total / Итого 40 9,756097561 - - -
Используемые параметры tStat/ t-статистика P-vaiue / Значимость
Intercept / Константа 0,354797355 0,281481615 1,260463691 0,216616062
Коэффициент текущей ликвидности 0,034652978 0,01876389 1,846790732 0,074043212
Leverage / Финансовый рычаг 1,31819Е-05 4,77939Е-06 2,758072506 0,009529947
D / EBITDA / Отношение процентного долга к EBITDA 0,044980795 0,018152923 2,477881708 0,018682248
-0,012377044 0,030936193 -0,40008296 0,691753745
ROS / Рентабельность продаж -0,530759612 0,375019201 -1,415286499 0,166643428
NI > 0 / Наличие чистой прибыли -0,02891433 0,164713359 -0,175543319 0,861758855
Manager / Качество менеджмента -0,266367tl2 0,134861932 -1,975109717 0,056935374
Histor/ Качество кредитной истории -0,109402928 0,159841844 -0,684444857 0,498621797

ПРИЛОЖЕНИЕ 3.

Регрессия по семи факторам для 35 компаний

Регрессия и остаток DFI Число степеней свободы SS / Сумма квадратов MS = SS / DF F-статистика Significance F / Значимость F
Regression / Регрессия 7 5,898901667 0,842700238 9,097165886 9,56Е-06
Residual / Остаток 27 2,501098333 0,092633272 - -
Total / Итого 34 8,4 - - -
Используемые параметры Coefficients / Коэффициенты Standard Error / Стандартная ошибка t Stat/ t-статистика P-value / Значимость
Intercept / Константа 0,473712463 0,25308461 1,871755309 0,072111654
Коэффициент текущей ликвидности 0,018420061 0,017803477 1,034632774 0,047018946
Leverage / Финансовый рычаг 0,017110959 0,009674238 1,768713818 0,022823937
D / EBITDA / Отношение процентного долга к EBITDA 0,046019604 0,021802198 2,110778177 0,014194286
EBIT / Interest / Отношение EBIT к процентным платежам -0,004583381 0,032996403 -0,13890548 0,89055573
ROS / Рентабельность продаж -0,582081686 0,483677061 -1,203451088 0,039247801
Manager / Качество менеджмента -0,174077167 0,138900851 -1,253247659 0,03786026
Histor / Качество кредитной истории -0,378981463 0,194742843 -1,946061058 0,020243892

ПРИЛОЖЕНИЕ 4.

Оценка компаний из выборки по скоринговой модели

Компания У Коэффициент текущей ликвидности Leverage / Финансовый рычаг D / EBITDA / Отношение процентного долга к EBITDA EBIT / Interest / Отношение EBIT к процентным платежам ROS / Рентабельность продаж Manager / Качество менеджмента Histor / Положительная кредитная история Срок функционирования компании Сумма Класс Верно или нет*
Аптека 36,6 0 4 6 4 4 6 5 9 3 41 2 1
Л"Этуаль 0 5 0 0 4 0 5 9 3 26 3 0
Кора 0 4 8 0 4 0 5 9 3 33 2 1
Лента 0 1 0 0 4 6 5 9 3 28 3 0
ОК 0 1 8 4 4 6 5 9 3 40 2 1
Автомир 0 5 8 0 3 6 5 9 3 39 2 1
Х5 Retail Group 0 1 8 0 4 5 5 9 3 35 2 1
Детский мир 0 4 8 4 4 6 5 9 3 43 2 1
Дикси 0 4 6 0 4 0 5 9 3 31 2 1
Карусель 0 1 8 0 4 6 5 9 3 36 2 1
Копейка 0 1 0 0 4 0 5 9 3 22 3 0
Kosmos Group 0 5 6 0 4 6 5 9 3 38 2 1
Магнит 0 5 8 8 4 6 5 9 3 48 1 1
Магнолия 0 0 2 0 2 6 5 9 3 27 3 0
М.Видео (2007 г.) 0 5 8 4 4 0 5 9 3 38 2 1
ОАО «НТС» 0 5 0 0 2 6 0 9 3 25 3 0
Обувь России 0 4 2 4 4 6 5 9 3 37 2 1
Перекресток (2005 г.) 0 1 6 0 4 5 5 9 3 33 2 1
Пивдом 0 5 0 0 2 0 0 9 3 19 3 0
Семья 0 5 8 4 4 6 5 9 3 44 1 1
Элекам 0 5 4 0 2 0 5 9 3 28 3 0
Макро 1 4 0 0 4 0 0 9 3 20 3 1
Престиж-экспресс 1 5 8 0 2 0 0 9 3 27 3 1
Арбат-Престиж 1 0 4 0 3 0 5 0 3 15 3 1
Орхидея 1 5 6 0 0 0 0 9 3 23 3 1
Белый фрегат 1 5 0 0 0 0 5 9 3 22 3 1
Марта 1 5 0 0 2 0 5 9 3 24 3 1
Матрица 1 5 0 0 0 0 0 0 3 8 3 1
Меркурий (Самохвал) 1 5 0 0 2 0 5 9 3 24 3 1
Миннеско 1 4 0 0 0 0 5 9 3 21 3 1
Мосмарт 1 5 0 0 3 0 0 0 3 11 3 1
Полесье 1 5 0 0 2 0 0 9 3 19 3 1
Седьмой континент 1 5 8 4 3 6 0 9 3 38 2 0
Техносила 1 5 0 0 0 0 5 9 3 22 3 1
ТОАП 1 5 0 0 2 0 0 9 3 19 3 1

* Столбец показывает, верное ли решение мы получили по кредитованию компании согласно скоринговой модели.