Для того чтобы результаты корреляционного анализа нашли практическое применение и дали желаемый результат, должны выполняться определенные требования в отношении отбора объекта исследования и признаков-факторов. Одним из важнейших условий правильного применения методов корреляционного анализа является требование однородности тех единиц, которые подвергаются изучению методами корреляционного анализа. Например, при корреляционном анализе зависимостей тех или иных технико-экономических показателей работы предприятий от определенных факторов должны быть отобраны предприятия, выпускающие однотипную продукцию, имеющие одинаковый характер технологического процесса и тип используемого оборудования, для предприятий добывающей промышленности определенную роль играет и географическое размещение предприятий.
При выполнении указанных общих требований далее необходима количественная оценка однородности исследуемой совокупности по комплексу признаков. Одним из возможных вариантов такой оценки является расчет относительных показателей вариации. Традиционно широкое распространение для этих целей получил коэффициент вариации (усли коэффициент вариации менее 33%, то исследуемую совокупность можно считать однородной и пригодной для исследования). Если совокупность неоднородна, то следует откинуть аномальные значения, то есть значения с максимальными и минимальными значениями признака.
Другим важным требованием, обеспечивающим надежность выводов корреляционного анализа, является требование достаточного числа наблюдений. Как уже указывалось, влияние существенных причин может быть затушевано действием случайных факторов, "взаимопогашение" влияния которых на результативный показатель в известной мере происходит при выведении средней результативного показателя для массы случаев.
Определенные требования существуют и в отношении факторов, вводимых в исследование. Все множество факторов, оказывающих влияние на величину результативного показателя, к действительности не может быть введено в рассмотрение, да практически в этом и нет необходимости, так как их роль и значение в формировании величины результативного показателя могут иметь существенные различия. Поэтому при ограничении числа факторов, включаемых в изучение, наряду с качественным анализом целесообразно использовать и определенные количественные оценки, позволяющие конкретно охарактеризовать влияние факторов на результативный показатель (к оценкам можно отнести парные коэффициенты корреляции, ранговые коэффициенты при экспертной оценке влияния факторов и др.). Включаемые в исследование факторы должны быть независимыми друг от друга, так как наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и в значительной мере дублируют друг друга.
Выбор формы связи
Определяющая роль в выборе формы связи между явлениями принадлежит теоретическому анализу. Так, например, чем больше размер основного капитала предприятия (факторный признак), тем больше при прочих равных условиях оно выпускает продукции (результативный признак).
С ростом факторного признака здесь, как правило, равномерно растет и результативный, поэтому зависимость между ними может быть выражена уравнением прямой Y=a+b*x, которое называется линейным уравнением регрессии.
Параметр b называется коэффициентом регрессии и показывает, насколько в среднем отклоняется величина результативного признака у при отклонении величины факторного признаках на одну единицу. При x = 0 a = Y. Увеличение количества внесенных удобрений приводит, при прочих равных условиях, к росту урожайности, но чрезмерное внесение их без изменения других элементов к дальнейшему повышению урожайности не приводит, а, наоборот, снижает ее.
Такая зависимость может быть выражена уравнением параболы Y=a+b*x+c*x2.
Параметр c характеризует степень ускорения или замедления кривизны параболы, и при c>0 парабола имеет минимум, а при c<0 - максимум. Параметр b, характеризует угол наклона кривой, а параметр a - начало кривой.
Однако с помощью теоретического анализа не всегда удается установить форму связи. В таких случаях приходится только предполагать о наличии определенной формы связи. Проверить эти предположения можно при помощи графического анализа, который используется для выбора формы связи между явлениями, хотя графический метод изучения связи применяется и самостоятельно.
Применение методов корреляционного анализа дает возможность выражать связь между признаками аналитически - в виде уравнения - и придавать ей количественное выражение. Чтобы измерить тесноту прямолинейной связи между двумя признаками, пользуются парным коэффициентом корреляции, который обозначается r.
Коэффициент корреляции r применяется только в тех случаях, когда между явлениями существует прямолинейная связь. Если же связь криволинейная, то пользуются индексом корреляции, который рассчитывается по формуле:
Коэффициент корреляции является мерой тесноты связи только для линейной формы связи, а индекс корреляции - и для линейной, и для криволинейной. При прямолинейной связи коэффициент корреляции по своей абсолютной величине равен индексу корреляции:
|r|=R.
Если индекс корреляции возвести в квадрат, то получим коэффициент детерминации. Коэффициент детерминации является наиболее конкретным показателем, так как он отвечает на вопрос о том, какая доля в общем результате зависит от фактора, положенного в основание группировки.
Индекс корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – средняя; при |r| > 0,70 – сильная, или тесная. Когда |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии связи между У и X.
В аналитической части курсовой работы с помощью компьютерной программы
для данных 30 предприятий построим различные модели зависимости уровня заработной платы от производительности труда.3. Непараметрические методы оценки связи
Методы корреляционного и дисперсионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметрических методов.
Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических.
Если изучается взаимосвязь двух качественных признаков, то используют комбинационное распределение единиц совокупности в форме так называемых таблиц взаимной сопряженности.
В социально-экономических исследованиях нередко встречаются ситуации, когда признак не выражается количественно, однако единицы совокупности можно упорядочить. Такое упорядочение единиц совокупности по значению признака называется ранжированием. Примерами могут быть ранжирование студентов (учеников) по способностям, любой совокупности людей по уровню образования, профессии, по способности к творчеству и т.д.
При ранжировании каждой единице совокупности присваивается ранг, т.е. порядковый номер. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер. Например, если у 5-й и 6-й единиц совокупности значения признаков одинаковы, обе получат ранг, равный (5 + 6) / 2 = 5,5.
Измерение связи между ранжированными признаками производится с помощью ранговых коэффициентов корреляции Спирмена (r) и Кендэлла (t). Эти методы применимы не только для качественных, но и для количественных показателей, особенно при малом объеме совокупности, так как непараметрические методы ранговой корреляции не связаны ни с какими ограничениями относительно характера распределения признака.
4. Расчетная часть.
Построим ряд распределения по признаку – среднегодовая заработная плата. Вычислим среднегодовую заработную плату как отношение фонда заработной платы к среднесписочной численности работников (данные задачи приложение 2).
Образуем 5 групп с равными интервалами.
Найдём максимальный и минимальный элементы ряда (среднегодовая заработная плата), определим величину интервала.
12036 тыс. руб.
Таблица 2
Границы интервалов.
№ | Нижняя граница | Верхняя граница |
1 | 36 | 52,8 |
2 | 52,8 | 69,6 |
3 | 69,6 | 86,4 |
4 | 86,4 | 103,2 |
5 | 103,2 | 120 |
Для построения интервального статистического ряда распределения вычислим сколько предприятий попадает в каждый из интервалов.
Таблица 3
Интервальный ряд распределения предприятий
по среднегодовой заработной плате.
№ группы | Группы предприятий по заработной плате, тыс. руб. | Середина интервала | Локальная частота (число предприятий) | Накопленная частота |
1 | 36 – 52,8 | 44,4 | 3 | 3 |
2 | 52,8 – 69,6 | 61,2 | 6 | 9 |
3 | 69,6 – 86,4 | 78 | 12 | 21 |
4 | 86,4 – 103,2 | 94,8 | 5 | 26 |
5 | 103,2 - 120 | 111,6 | 4 | 30 |
всего | 30 |
Изобразим данный ряд графически.