Такая замена групп коррелированных признаков факторами должна проводиться с наименьшими потерями информации, заключенной в исходном множестве признаков. Теоретически полное отражение информации, содержащейся в некотором множестве признаков, достигается лишь в том случае, когда число факторов равно числу признаков.
В настоящее время в управленческой практике используется множество социально-экономических показателей, всесторонним образом характеризующих происходящие процессы.
Однако для текущего управления экономикой области многие из этих показателей не являются необходимыми. Многократное описание одного и того же явления большим числом различных показателей не только не проясняет, а, наоборот, часто даже затемняет картину действительности.
Все более широкое введение автоматической обработки данных создает опасность «переинформирования» руководителей путем предоставления им очень большого количества отчетов, содержащих подробные фактические данные с низкой степенью аналитичности.
Вполне целесообразно поэтому разработать метод получения как можно меньшего набора социально-экономических показателей, с помощью которых руководители будут получать необходимую информацию о наиболее важных особенностях социально-экономических процессов, происходящих в области. Наличие такого рода сведений, например, необходимо для проведения быстрой оценки уровня социально-экономического развития районов области, что, в свою очередь, делает возможным своевременное принятие решений на будущий период. Ведь в этом случае внимание руководителя не поглощено изучением обширного перечня аналитических данных с небольшим количеством обобщенной информации, содержащейся в существующих сводных показателях.
К настоящему времени опубликовано большое количество работ, авторы которых применяют корреляционный и регрессионный анализы в экономических исследованиях. Однако следует отметить, что в некоторых из них авторы не принимают во внимание то обстоятельство, что корреляционный и регрессионный анализы базируются на ряде предпосылок вероятностного характера, что, приступая к изучению экономических явлений, исследователь выдвигает определенную гипотезу о существовании, характере и форме связи и на заключительном этапе исследования может с определенным уровнем вероятности принять ее или отвергнуть. Поэтому весьма часто исследователи делают неправильные и необоснованные выводы, заменяя конкретный причинный анализ изучаемых явлений чисто формальным. При моделировании конкретного экономического явления необходимо прежде всего четко и полно сформулировать те условия допущения и ограничения, в рамках которых можно применять построенную модель. Использование математической теории бывает оправдано в той степени, в какой выполняются предпосылки ее применения. В то же самое время формальный математический аппарат не должен заменять экономический анализ и интуицию исследователя, потому что целью анализа является сущность экономических закономерностей, а не математические формулы.
То есть количественный и качественный виды анализа на всех этапах построения модели должны быть в диалектическом единстве.
Используя корреляционный и регрессионный методы анализа экономических явлений, необходимо учитывать их особенности:
многомерность, немногочисленность (по сравнению с естественными микроявлениями), быструю изменчивость, дискретность, наличие случайной компоненты. Использование этих методов может быть только тогда эффективным, когда достаточно последовательно и правильно будут выполнены их теоретико-вероятностные предпосылки.
Корреляционным анализом называют анализ зависимостей случайной величины от случайных аргументов в отличие от регрессионного анализа, под которым понимают анализ зависимости случайной величины от .неслучайных аргументов.
Как всякий статистический метод, классический корреляционный анализ применим при определенных предпосылках:
1) случайные величины У и Х (в многомерном случае X1, Х2, ..., Хр) представляют собой выборку из двумерной (многомерной) генеральной совокупности с нормальным законом распределения;
2) отдельные наблюдения стохастически независимы, т.е. значения данного наблюдения не должны зависеть от значения предыдущего и последующего наблюдений (проверка наличия автокорреляции);
3) аналитическое выражение, аппроксимирующее эмпирическую кривую У=1 (X) (в многомерном случае V=f (X1, X2, ..., Хр), должно быть линейным относительно своих параметров;
4) дисперсия случайной величины У остается постоянной при изменении величины Х (или Xi) или пропорциональной некоторой известной функции от Х(Хi).
Применение регрессионного анализа предполагает обязательное выполнение предпосылок 2—4 корреляционного анализа. Он тесно связан с корреляционным анализом. Но регрессионный анализ предъявляет менее жесткие требования к исходной информации. Например, проведение регрессионного анализа возможно даже в случае некоторого отличия распределения случайных величин от нормального, что существенно, так как часто распределение экономических величин асимметрично. При многомерном регрессионном анализе часто возникает проблема мультиколлинеарности, т.е. между несколькими аргументами существует линейная связь или коллинеарность — линейная взаимосвязь между двумя показателями.
В классическом регрессионном анализе предполагается, что между независимыми переменными отсутствует линейная связь (это в экономической практике встречается довольно редко).
Мультиколлинеарность затрудняет проведение анализа. Во-первых, усложняется процесс выделения наиболее существенных факторов; во-вторых, искажается смысл коэффициентов регрессии. В-третьих, при решении системы нормальных уравнений для получения коэффициентов регрессии определитель близок к нулю, что влечет за собой появление множества оценок коэффициентов регрессии. На практике считается, что два аргумента коллинеарны, если парный коэффициент корреляции между ними по абсолютной величине равен 0,8.
Более точный метод — следующий: аргумент можно отнести к числу мультиколлинеарных, если коэффициент множественной корреляции этой переменной от всех остальных аргументов больше коэффициента множественной корреляции между зависимой переменной и множеством всех независимых переменных.
К одной из эффективных мер по устранению мультиколлинеарности, как показывает опыт, относится исключение из рассмотрения одного или нескольких линейно связанных аргументов либо привлечение дополнительной информации. Другой метод устранения влияния мультиколлинеарности состоит во введении искусственной ортогональности.
Следует отметить также, что матрица парных коэффициентов корреляции позволяет в некоторой степени сократить информацию путем перехода от системы первоначально зарегистрированных параметров к системе меньшей размерности при повышении адекватности отражения изучаемых процессов.
До последнего времени для построения экономико-статистических моделей в основном применялись методы группировок и методы корреляционного и регрессионного анализов. Необходимость расширения формального аппарата экономико-статистического моделирования связана с объективными трудностями, которые продиктованы невыполнением предпосылок использования корреляционного и регрессионного анализов, так как классическая теория вероятностей и математическая статистика создавались применительно к анализу явлений природы. Социально-экономические же явления многомерны, разнообразны, дискретны, имеют случайную компоненту. Вышеперечисленные особенности экономических процессов требуют применения в дополнение к аппарату классической статистики более универсальных методов математического описания. Од ним из путей решения этой проблемы является использование методов распознавания образов, как правило, на ЭВМ.
Аппарат теории распознавания образов позволяет выделить однородные группы по большому числу признаков, находить зависимости одновременно от количественных и качественных факторов. Методы теории распознавания образов можно применять почти на всех этапах экономико-статистического исследования: при анализе структуры выборочной совокупности, для выбора представителей групп, при обработке экспертных оценок.
Однако в теории распознавания образов много нерешенных проблем. В распоряжении исследователя пока нет надежных формальных критериев для оценки и сравнения разных алгоритмов и программ распознавания образов.
В то же время комплексное применение методов корреляционного и регрессионного анализов и теории распознавания образов способствует идентификации эконометрических моделей больших размерностей; позволяет учитывать факторы, не имеющие количественного измерения.
Содержание моделирования с помощью комплексного применения трех вышеуказанных методов состоит в том, чтобы интересующую нас зависимость выразить как совокупность моделей двух типов: дискретной модели, описывающей типологическую структуру совокупности, и системы непрерывных моделей объектов внутри классов. Построение дискретно-непрерывной модели включает две основные стадии: разбиение общей совокупности объектов на однородные части с помощью методов теории распознавания образов и построение для каждой части самостоятельной регрессионной модели.
С целью получения обобщенных показателей можно пользоваться среди прочих таксономическими методами или методами факторного анализа, причем можно также предложить такой подход, при котором одновременно находят применение и те и другие методы.