Связь по трехкомнатным квартирам в ПМР между общим состоянием и ценой квартиры слабая прямая, значение 0,3, что похоже на аналогичную ситуацию в СМР,ГМР,ЧМР.
Связь по трехкомнатным квартирам в СМР между общим состоянием и ценой квартиры слабая прямая, значение -0,3, что похоже на аналогичную ситуацию в ПМР,ГМР,ЧМР.
Качественный анализ сгруппированных признаков
Ранговые признаки имеют, как правило, несколько градаций, поэтому изучение их при помощи коэффициента ассоциации и контингенции может быть затруднено.
Для изучения связи таких признаков используется методика расчета коэффициента Пирсона.
После расчета полученное значение
Если
Если
Коэффициент Пирсона (
Размер | Хорошие | Плохие | Всего |
Меньше среднего | 23 | 27 | 50 |
Больше среднего | 12 | 15 | 27 |
Коэффициент ассоциации
Q=0,03139
Коэффициент контингенции
Ф=0,0149
Размер квартиры слабо влияет на её состояние, коэффициент ассоциации 0,03139.
Взаимовлияние размера квартиры и её состояния очень слабое, коэффициент контингенции=0,0149.
Коэффициент ассоциации больше коэффициента контингенции, следовательно, размер квартиры вероятно определяет её состояние.
Изучение связи качественных ранговых признаков
Район | < | > | ∑ |
ГМР | 23 | 20 | 43 |
ПМР | 8 | 7 | 15 |
СМР | 5 | 14 | 19 |
∑ | 36 | 41 | 77 |
3 | ∑ | ||
Хорошие | Плохие | ||
ГМР | 20 | 23 | 43 |
ПМР | 3 | 12 | 15 |
СМР | 12 | 7 | 19 |
∑ | 35 | 42 | 77 |
Значит, связь между районом и классом квартиры отсутствует.
Изучение взаимовлияния качественных признаков района расположения квартиры и её состояния с помощью коэффициента Чупрова показало, что связь между этими показателями слабая.
Составление уравнения регрессии
Уравнение регрессии позволяет установить количественную связь между факторными и результативными признаками, то есть найти количественное соотношение изменения признака Y на одну единицу признака X.
Простейшее уравнение регрессии:
y = a+bx
a – обеспечение смещения кривой по вертикали, относительно оси X, то есть по прямой Y.
B – Обуславливает наклон прямой.
Параметры уравнения регрессии находятся методом наименьших квадратов путем решения системы уравнений.
|
Уравнение регрессии может представлять из себя различную функцию, которая подбирается исходя из формы построенной графически.
Уравнение может иметь формы:
линейная
гиперболическая
степенная
логарифмическая
полиноминальная. В уравнении факторные признаки возводятся в различные друг от друга признаки.
Для вычисления коэффициентов уравнения регрессии воспользуемся программой Matrixer, и составим уравнения для нашего исследования:
Расчет с без учетом выбраковки, количество объектов = 120:
Обычный метод наименьших квадратов
(линейная регрессия)
Зависимая переменная: р[#цена]
Количество наблюдений: 120
(Регрессия без константы!)
Переменная Коэффициент Станд. ошибка t-статистика Знач.
1 р[#состо_ние_] -0.1984106267 0.0620385908 -3.1981807468 [0.0018]
2 р[#дельта] 0.0734815664 0.0361660169 2.0317848835 [0.0445]
3 р[#площадь] 0.0414718842 0.0020534895 20.195810194 [0.0000]
4 р[район] -0.0440588145 0.0624974596 -0.7049696871 [0.4822]
R^2adj. = 52.865142743% DW = 1.8859
R^2 = 54.053416456% S.E. = 0.5986933182
Сумма квадратов остатков: 41.5783079544793
Максимум логарифмической функции правдоподобия: -106.677834689621
AIC = 1.8612972448 BIC = 1.9774427341
F(3,116) = 45.48903 [0.0000]
Нормальность: Chi^2(2) = 2242.898 [0.0000]
Гетероскедастичность: Chi^2(1) = 29.44408 [0.0000]
Функциональная форма: Chi^2(1) = 3.200829 [0.0736]
AR(1) в ошибке: Chi^2(1) = 0.33828 [0.5608]
ARCH(1) в ошибке: Chi^2(1) = 0.063824 [0.8006]
Расчет с учетом выбраковки, количество объектов = 77:
Обычный метод наименьших квадратов
(линейная регрессия)
Зависимая переменная: р2[цена_млн]
Количество наблюдений: 77
(Регрессия без константы!)
Переменная Коэффициент Станд. ошибка t-статистика Знач.
1 р2[сост] -0.0606650934 0.0488994195 -1.2406096847 [0.2187]
2 р2[дельта] 0.1070148051 0.0324382214 3.299034302 [0.0015]
3 2р[район] 0.0300604966 0.0537958531 0.5587883614 [0.5780]
4 р2 [площадь] 0.0358621999 0.0018103588 19.80944326 [0.0000]
R^2adj. = 40.692983262% DW = 1.9979
R^2 = 43.003646252% S.E. = 0.4021602065
Сумма квадратов остатков: 11.9682295437227
Максимум логарифмической функции правдоподобия: -37.5735297817469
AIC = 1.0916289688 BIC = 1.2427000474
F(3,74) = 18.61096 [0.0000]
Нормальность: Chi^2(2) = 2.090194 [0.3517]
Гетероскедастичность: Chi^2(1) = 2.396194 [0.1216]
Функциональная форма: Chi^2(1) = 13.5042 [0.0002]
AR(1) в ошибке: Chi^2(1) = 5.62E-04 [0.9811]
ARCH(1) в ошибке: Chi^2(1) = 0.001647 [0.9676]
Проверка точности и адекватности модели.
Точность и адекватность модели можно проверить следующими способами:
Проверка точности модели
n – количество элементов в исследуемой группе
y – фактическое значение
Проверка адекватности модели производится путем расчета коэффициента
В результате расчета получаем:
По первичным данным:
|
Точность модели: ,
|
значит точность исследования:
|
Адекватность модели:
С учетом выбраковки данных:
|
Точность модели: ,
|
значит точность исследования:
|
Адекватность модели:
Заключение.
В работе был проведен анализ рынка трёх- и четырехкомнатных квартир для микрорайонов: СМР, ГМР и ПМР. Была произведена первичная выборка данных, расчет основных характеристик выборки и выбраковка данных.
В ходе работы был проведен корреляционно-регрессионный анализ данных. С помощью программы Matrixer были вычислены коэффициенты уравнений регрессии и составлены уравнения регрессии по первичным данным и с учетом выбраковки.
По коэффициентам уравнений регрессии была проведена проверка точности и адекватности полученной модели:
— по первичным данным точность полученной модели 85,19%, адекватность полученной модели 61,59%.
— с учетом выбраковки точность полученной модели 89,07%, адекватность полученной модели 61,05%.