Нехай прогнозоване значення
(2.1)
В силу того, що
Використавши теорему про дисперсії суми залежних величин, одержимо:
Перепишемо у вигляді:
де
Оскільки значення
Таким чином, середнє значення
Розділ ІІІ. Лінійний регресійний аналіз інтервальних даних
Перейдемо до багатомірного статистичного аналізу. Спочатку з позиції асимптотичної математичної статистики інтервальних даних розглянемо оцінки методу найменших квадратів (МНК).
Статистичне дослідження залежностей - одне з найбільш важливих задач, які виникають у різних галузях науки й техніки. Під словами "дослідження залежностей" мається на увазі виявлення і опис існуючого зв'язку між досліджуваними змінами на підставі результатів статистичних спостережень.
Якщо яка-небудь група об'єктів характеризується змінними
Але процес виміру не дає однозначний результат. Реально результатом виміру якої-небудь величини Х є два числа:
3.1 Метод найменших квадратів для інтервальних даних
Нехай математична модель задана:
(3.1.1)
де х = (х1, х2,..., хm) - вектор впливаючих змінних, що піддаються виміру;
Нехай проведено n досвідів, причому в кожному досвіді обмірювані (один раз) значення відгуку (у) і вектора факторів (х). Результати вимірів можуть бути представлені в наступному виді:
де Х - матриця значень обмірюваного вектора (х) в n досвідах; Y - вектор значень обмірюваного відгуку в n досвідах; Е - вектор випадкових помилок. Тоді виконується матричне співвідношення:
, (3.1.2)
де
Введемо міру близькості
тобто
де
У загальному випадку рішення цього екстремального завдання може бути не єдиним. Тому надалі будемо мати на увазі одне із цих рішень. Воно може бути виражене у вигляді:
причому
Перевага методу найменших квадратів полягає в порівняльній простоті й універсальності обчислювальних процедур. Однак не завжди оцінка МНК є самостійною, що обмежує його застосування на практиці.
Важливим частковим випадком є лінійний МНК, коли Q(x, ) є лінійна функція від
,
де = 1, а
Якщо матриця
Нехай виконуються наступні припущення щодо розподілу похибок
- помилки
- результати спостережень мають однакову дисперсію D {
- помилки спостережень некорельовані, тобто