Понятия «корреляция» и «регрессия» тесно связаны между собой. В корреляционном анализе оценивается сила связи, а в регресс ионном анализе исследуется ее форма. Корреляция в широком смысле объединяет корреляцию в узком смысле и регрессию. [15, с. 245-247].
Корреляция, как и регрессия, имеет различные виды, так различают:
1) относительно характера – положительную и отрицательную
2) относительно числа переменных - простую, множественную, частную;
3) относительно формы связи – линейную, нелинейную;
4) относительно типа соединения – непосредственную, косвенную, ложную.
Любое причинное влияние может выражаться либо функциональной, либо корреляционной связью. Но не каждая функция или корреляция соответствует причинной зависимости между явлениями. Поэтому требуется обязательное исследование причинно-следственных связей.
Исследование корреляционных связей мы называем корреляционным анализом, а исследование односторонних стохастических зависимостей - регрессионным анализом.
Корреляционный анализ проводится между величинами, не имеющими причинно-следственного характера отклонений. Цель корреляционного анализа - количественное определение тесноты связи между признаками. Если исследуются только 2 признака, то говорят о простой (парной) корреляции. Если исследуется связь между тремя и более признаками, то имеет место множественная корреляция. [25, с. 95-96].
При оценке корреляционной связи не ставится вопрос о характере причинно-следственных соотношений между признаками. Оценивается только степень тесноты между ними. Оценку связи делают с помощью коэффициента корреляции г, который изменяется в пределах -1 > r > + 1.
Коэффициент корреляции - мера тесноты связи между признаками. Положительное значение коэффициента корреляции означает, что с увеличением одного показателя возрастает и другой, и наоборот, отрицательное значение определяет уменьшение величины одного показателя при возрастании другого.
Коэффициент корреляции свыше 0,8 означает тесную причинно- следственную связь.
Коэффициент множественной корреляции определяют по усложненной формуле, которая используется в статистике. В научных исследованиях и практической деятельности пользуются готовыми компьютерными программами для персонального компьютера.
Чтобы составить объективное представление о том, сильна или слаба связь между показателями, используют так называемый коэффициент детерминации, на основании которого можно сделать вывод о количестве случаев изменения одного показателя (признака) под влиянием другого. Коэффициент детерминации представляет собой квадрат коэффициента корреляции г, или то же, но выраженное в процентах ( r2 * 100)
Итак, коэффициент корреляции, возведенный в квадрат и умноженный на 100 %, называется коэффициентом детерминации, который показывает, насколько результативный признак зависит от анализируемых одно- и двухфакторных признаков.
Корреляционный анализ позволяет установить связь между признаками и показывает форму этой связи, но он не дает представления об изменении одного показателя ряда в зависимости от изменения другого. Для исследования же нередко необходимо знать, насколько (в среднем) изменяется один признак при изменении другого на единицу. Эти важные и более глубокие свойства связи раскрывает регрессионный анализ, который для исследований различных вопросов экономики представляет большой интерес.
Применяя регрессионный анализ, можно, например, установить по некоторым показателям значения показателей совсем других размерностей, зная лишь о связи между ними и не затрачивая времени и средств на их непосредственное экспериментальное измерение или определение.
Регрессионный анализ - метод статистической обработки наблюдений, в результате которой оказывается возможным составить уравнение регрессии и получить количественную оценку влияния факторных признаков х на результативный у.[5, с. 130-132].
Уравнение у i =b10 x1j +b20 x20 + .... +b mn x mj ,
где b10, b20,…,bmn- средняя квадратическая оценка случайных факторов;
x1i, x20,…, xmn - значения непрерывных переменных х1, х2; называют уравнением регрессии.
Регрессионные зависимости могут быть самыми различными, важно лишь установить их экспериментально и сделать правильное математическое описание соответствующими формулами.
Регрессионный анализ проводят для установления связи между величинами, которые можно рассматривать как функции и аргументы, т. е. когда четко выражен характер причинно-следственных отношений между исследуемыми признаками.
Коэффициент регрессии показывает, на сколько изменится в среднем значение результативного признака у при увеличении факторного х.
Характеристикой относительного изменения прироста функции у=J{х) при малых относительных изменениях прироста аргумента х является эластичность функции.
Корреляционный и регрессионный анализ имеют свои задачи . [13, с. 295-299].
Задачи корреляционного анализа
1. Измерение степени связности (тесноты, силы) двух и более явлений. Здесь речь идет в основном о подтверждении уже известных связей.
2. Отбор факторов, оказывающих наиболее существенное влияние на результативный признак на основе измерения тесноты связи между явлениями.
3. Обнаружение неизвестных причинных связей. Корреляция непосредственно не выявляет причинных связей между явлениями, но устанавливает степень необходимости этих связей и достоверность суждений об их наличии. Причинный характер связей выясняется с помощью логически-профессиональных рассуждений, раскрывающих механизм связей.
Задачи регpeccионного анализа
1. Установление формы зависимости (линейная или нелинейная; положительная или отрицательная и т. д.).
2. Определение функции регрессии и установление влияния факторов на зависимую переменную. Важно не только определить форму регрессии, указать общую тенденцию изменения зависимой переменной, но и выяснить, каково было бы действие на зависимую переменную главных факторов, если бы прочие не изменялись и если бы были исключены случайные элементы. для этого определяют функцию регрессии в виде математического уравнения того или иного типа.
3. Оценка неизвестных значений зависимой переменной, т. е. решение задач экстраполяции и интерполяции. В ходе экстраполяции распространяются тенденции, установленные в прошлом, на будущий период. Экстраполяция широко используется в прогнозировании. В ходе интерполяции определяют недостающие значения, соответствующие моментам времени между известными моментами, т. е. определяют значения зaвисимой переменной внутри интервала заданных значений факторов.
Однако экономические исследования многоаспектны, и, как правило, здесь применяют в комплексе все методы анализа. Так, например, цель регрессионного анализа - определение формы связи (уравнение регрессии), количественное определение коэффициентов уравнения (оценка коэффициентов регрессии) и определение изменения тесноты связи между признаками. Так же как и корреляционный, регрессионный анализ может проводиться по двум признакам у =f(x) (х - аргумент, у - функция), и тогда имеет место простой регрессионный анализ. Если же одновременно рассматривать несколько аргументов, т.е. y=f(xu x2,… ,х,,), то имеет место множественная регрессия.
В реальных условиях исследования прикладных задач, рассматриваемые признаки, как правило, взаимосвязаны, поэтому всегда приходится выявлять тесноту связи между ними и изучать формы связи.
Таким образом, более правильно говорить о комплексном корреляционно-регрессионном анализе.
1.2. Этапы проведения корреляционно-регрессионного анализа
Области его применения.
Корреляционно-регрессионный анализ проводят поэтапно в определенной логической последовательности: [14, 194-195].
1 ) анализ существа происходящих в исследуемой системе процессов и выявление причин возникновения взаимосвязей между признаками, характеризующими эти процессы;
2)выбор наиболее существенных признаков для исследования их на предмет включения в корреляционно-регрессионные модели, дифференциация признаков на факторные и результативные;
3)предварительный расчет и анализ парных коэффициентов корреляции, построение матрицы коэффициентов парной корреляции и оценка возможных вариантов группировки признаков для построения корреляционно регрессионных моделей;
4)выявление причинно-следственных соотношений между признаками и логическая оценка возможных вариантов формы связи, т.е. предварительная оценка формы уравнения регрессии;
5)решение уравнения регрессии - вычисление коэффициентов регрессии по уравнениям связи и их смысловая интерпретация с учетом прикладных задач исследуемой предметной области;
6)расчет теоретически ожидаемых (воспроизведенных по уравнению регрессии) значений результативного признака (функции);
7)определение и сравнительный анализ дисперсий: общей факторной (воспроизводственной) и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель;
8)общая оценка качества модели, отсев несущественных (или включение дополнительных) факторов, построение и решение новой модели (т. е. повторение п.п. 1-7, получение достаточно хорошей модели нередко требует ряда таких интерпретаций);
9)статистическая оценка достоверности параметров уравнения регрессии, построение доверительных границ для теоретически ожидаемых значений функции;
10) практические выводы из анализа.
В области экономико-математического моделирования и анализа экономических объектов и систем требуется переход от исследования отдельных процессов к изучению взаимодействия их совокупностей.