Якщо

(1.9.4)
то відношення є значущим (лінійна модель неадекватна), при цьому, чим обумовлена неадекватність можна вивчити, дослідивши залишки; в супротивному випадку:

(1.9.5)
відношення є незначущим (лінійна модель адекватна), при цьому як

, так і

можна використовувати як оцінки для

.
Об’єднана оцінка для

може бути знайдена з суми квадратів “чистої помилки” і суми квадратів “неадекватністі” шляхом їх об’єднання у суму квадратів залишків і поділу її на число ступенів вільності

.
Якщо виявлено неадекватність моделі, то необхідно будувати іншу модель (нелінійну).
1.10 Деякі відомості з математичної статистики
1.10.1 Критерій
(гіпотетичний розподіл визначений) Постановка задачі. Нехай

– реалізація вибірки з невідомого розподілу

, відносно якого висувається гіпотеза

, де

належить заданому класу розподілів (зокрема,

може бути повністю визначеним розподілом). Гіпотезу

можна сформулювати і так:

є вибіркою з розподілу

із заданими властивостями.
Необхідно за реалізацією вибірки

дійти висновку: відхиляти гіпотезу

чи ні.
Відхилення емпіричного розподілу від гіпотетичного. Незалежно від того, справджується гіпотеза

чи ні, емпіричний розподіл

, побудований за вибіркою

з

, а саме, для кожного фіксованого

значення емпіричної функції розподілу

є незміщеною і спроможною оцінкою

. Тому, якщо ввести відхилення

емпіричного

розподілу від гіпотетичного

, причому так, щоб воно набирало малих значень, коли гіпотеза

справджується, і великих, коли гіпотеза

не справджується (а це видається цілком можливим, оскільки

мало відрізняється від

), то гіпотезу

природно відхиляти або не відхиляти залежно від того, якого значення набрало відхилення

- великого чи малого.
Відхилення Пірсона емпіричного розподілу

від гіпотетичного

. Відхилення між двома розподілами:

- емпіричним, побудованим за вибіркою

, і

–гіпотетичним, заданими на множині

вибіркових значень

(на вибірковому просторі), можна будувати різними способами. Далі описано відхилення

від

, запропоноване Пірсоном. Воно будується так. Ділимо

на скінчене число

неперетинних множин

:

.
І як відхилення

від

розглядаємо

(1.10.1.1)
де

- імовірність того, що вибіркове значення

потрапить до множини

, обчислена за гіпотетичним розподілом

(тобто

));

– імовірність вибірковому значенню потрапити до множини

, обчислена за емпіричним розподілом

; чисельно ця ймовірність дорівнює частоті вибірковому значенню потрапити до множини

, знайденій за вибіркою

(

– кількість вибіркових значень з

, що потрапили до

).
Далі, якщо

, то

є ймовірність вибірковому значенню потрапити до

, обчислена за розподілом

, з якого добуто вибірку

, а тому для кожного

частоти

вибіркового значення потрапити до

є незміщеними і спроможними оцінками ймовірностей

. І отже, відхилення

є малим порівняно з відхиленням

від

, обчисленими за розподілом

, відмінним від

. А разом із ними малим є відхилення

порівняно з відхиленням

, коли розподіл

відмінний від

(більш того,

– мінімально можливе відхилення).