Смекни!
smekni.com

Функциональная зависимость и регрессия (стр. 9 из 10)

Факторный анализ. Основной задачей факторного анализа является переход от первоначальной системы большого числа взаимосвязанных факторов

к относительно малому числу скрытых (латентных) факторов
. Скажем, производительность труда на предприятиях зависит от множества факторов из которых многие связаны между собой. Используя факторный анализ, можно установить влияние на рост производительности труда лишь нескольких обобщенных факторов непосредственно не наблюдавшихся.

Модель факторного анализа записывается в виде:

, i=1,2,…,m, k
,

где

= M(
) — математическое ожидание первоначального фактора

— общие (скрытые или латентные) факторы (J = 1,2,...,k);

— нагрузки первоначальных факторов на общие факторы;

— характерные факторы (i = 1,2,...,/я);

— нагрузки первоначальных факторов на характерные факторы.

Первое слагаемое в модели — неслучайная составляющая, другие два слагаемых случайные составляющие. Особенностью факторного анализа является неоднозначность определения общих факторов.

Метод главных компонент (компонентный анализ). В отличие от рассматриваемых в факторном анализе общих факторов, которые обусловливают большую (но не всю) часть вариации первоначальных факторов, главные компоненты объясняют всю вариацию и определяются однозначно. Модель главных компонент имеет вид:

, i=1,2,…m.

Как видим, в модели отсутствуют характерные факторы, так как главные компоненты

полностью обусловливают всю вариацию первоначальных факторов. Для углубления анализа изучаемого явления после выявления главных компонент рассматривают регрессию на главных компонентах, в которых последние выступают в качестве обобщенных объясняющих переменных. Среди других методов многомерного статистического анализа отметим методы, позволяющие осуществить классификацию экономических объектов, т.е. отнесение их к определенным классам. Это методы дискриминантного и кластерного анализа.

Дискриминантный анализ позволяет отнести объект, характеризующийся значениями m признаков, к одной из l совокупностей (классов, групп), заданных своими распределениями. Предполагается, что l совокупностей заданы выборками (называемыми обучаемыми), которые содержат информацию о статистических распределениях совокупностей в m-мерном пространстве признаков.

При отсутствии обучающих выборок могут быть использованы методы кластерного анализа, позволяющие разбить исследуемую совокупность объектов на группы «схожих» объектов, называемых кластерами, таким образом, чтобы объекты одного класса находились на «близких» расстояниях между собой, а объекты разных классов — на относительно «отдаленных» расстояниях друг от друга. При этом каждый объект

(j = l,2,...,m) рассматривается как точка в m-мерном пространстве, и выбор способа вычисления расстояний или близости между объектами и признаками является узловым моментом исследования, от которого в основном зависит окончательный вариант разбиения объектов на классы.

Заключение

В 1 главе данной работы были введены понятия функциональной, статистической и корреляционной зависимости. Разобраны методы определения линейной парной регрессии, коэффициента корреляции. Установлены основные свойства коэффициента корреляции, также сформулирована основная задача корреляционного анализа и основные свойства корреляционных отношений.

Во 2 главе настоящей работы приводятся основные положения регрессионного анализа. Указываются методы нахождения интервальной оценки функции регрессии и характеров парной модели.

Методы корреляционного и регрессионного анализа не действуют изолированно. При решении практических задач используют их совместно. В приложении 1 эти методы применяются для установления линейной зависимости между ценообразованием однотипных продуктов в магазинах юго-западных районов Брянщины. В результате исследования между ценами на продукты (яблоки, апельсины) линейной зависимости установлено не было (коэффициент r=-0.03).

Список используемых источников

1. Кремер, Н.Ш. Теория вероятностей и математическая статистика [Текст] / Н.Ш.Кремер. – 3-е изд., перераб. и. доп. – М.:ЮНИТИ-ДАНА, 2009. – 551 с. – (Серия «золотой фонд российских учебников»). ISBN 978–5–238–01270–4

2. Шамолин, М.В. Высшая математика [Текст] / М.В.Шамолин –М.: Издательство «Экзамен», 2008. – 909,[3] с. (Серия «Учебник для вузов») ISBN 978–5–377–01452–2

3. Бочаров,П.П. Теория вероятности. Математическая статистика. [Текст] / П.П.Бочаров, А.В.Печинкин – М.:Гардарика, 1998. – 328 с. ISBN 5–7762–0035–0

4. Гмурман, В.Е. Теория вероятностей и математическая статистика [Текст]: учеб. пособие для вузов / В.Е. Гмурман. – изд. 6-е, стер. – М.: Высшая школа, 1998–479 с. ISBN 5–06–003464–X

5. Солодовников, А.С. Теория вероятностей [Текст]: учеб. пособие для студ. пед. ин-тов по матемюспец. / А.С.Солодовников. – М.: Просвещение, 1983. – 207 с.

Приложение 1

В данном приложении выявлялась существования линейной зависимости между ценами на фрукты (апельсины яблоки) в магазинах г. Новозыбков, г. Клинцы, г. Злынка. В результате были собраны сведения о ценах на указанные продукты в 30 магазинах.

Собранные сведения содержатся в таблице1

555 557 59 61 63
40 1 3 4
42 2 5 2 9
44 2 3 2 7
46 4 3 1 8
48 1 1 2
1 8 12 8 1

В которой:

x(руб.) – цена за 1 кг яблок,

y(руб.) – цена за 1 кг апельсин,

,
– частота.

Для каждого значения, т.е. для каждой строки корреляционной таблицы вычислим групповые средние по формуле:

, где
- частоты пар (
) и
; m – число интервалов по переменной Y

Вычисленные групповые средние

поместим в последнем столбце корреляционной таблицы и изобразим графически в виде ломаной, называемой эмпирической линией регрессии Y по X (рис.1)

Аналогично для каждого значения

по формуле:
вычислим групповые средние
, где
, l – число интервалов по переменной X. Вычисленные групповые средние
и поместим в последнюю строку корреляционной таблицы и изобразим графически в виде ломаной. По виду ломанной можно определить наличие линейной корреляционной зависимости Y по X между двумя рассматриваемыми переменными. Поэтому уравнение регрессии будем искать в виде:

Строим кривые по точкам

(
,
) и
(
,
)