Несмещенной и состоятельной оценкой корреляционного момента служит эмпирический корреляционный момент (ковариация)
По этим оценкам определяют эмпирический коэффициент корреляции:
который дает состоятельную, но смещенную оценку теоретического коэффициента корреляции r (смещение
, при n>50 составляет менее 1%).Значимость r проверяется путем сравнения величины |r| ×
с его критическими значениями Н при заданной надежности r . При |r| × > H гипотеза о корреляционной связи подтверждается с надежностью r . Доверительные оценки r сложны и разработаны для случая нормального совместного распределения вероятностей величин X и У. Для приближенных доверительных оценок истинного значения коэффициента корреляции имеются номограммы[322]. Эмпирический коэффициент r может быть оценен оперативно графическим способом [44]. Доверительные интервалы для эмпирического коэффициента корреляции r, при малом количестве наблюдений n позволяет определить следующее преобразование, предложенное Р. Фишером:Величина Z при небольших n с хорошим приближением следует нормальному закону cо средним
и дисперсиейЭто позволяет построить доверительный интервал [ Z1, Z2] для MZ по формуле:
откуда следует, что истинное значение r с той же доверительной вероятностью ( 1-a ) заключено в пределах:
th Z1 < r< th Z2
где th - гиперболический тангенс аргумента, определяемый по таблицам. Использование Z-преобразованной величины r-оказывается более предпочтительным [76]. Параметры эмпирической прямой регрессии у на х оцениваются по формулам:
где ву/х - эмпирический коэффициент регрессии у на х.
Параметры линейной функции удовлетворяют принципу наименьших квадратов
по у: сумма квадратов отклонений наблюденных значений уi от
рассчитанных по уравнению прямой регрессии меньше, чем сумма квадратов отклонений их от любой другой прямой, т.е. имеет место не
равенство:
Наименьшая сумма квадратов отклонений наблюденных значений уi от линейной функции Ахi + B, т.е. сумма квадратов отклонений их от значений
может быть выражена через эмпирический коэффициент регрессий по формуле:Аналогичен подход по оценке параметров прямой регрессии x на у. Доверительные оценки параметров прямой регрессии у на х (аналогично х на у) выполняются с использованием суммы квадратов отклонений измеренных значений yi от рассчитанных по уравнению прямой регрессии. Принято, что все ошибки измерения независимы и следуют нормальному закону распределения около нуля с дисперсией s 2. Для теоретической прямой регрессии y =` y – ву/х (х-` х) доверительными границами для ` у служат:
а доверительными границами для ву/х служат
где t - значение коэффициента надежности из таблиц распределения Стьюдента при числе степеней свободы R =n-2 [134].
Доверительные оценки отклонения теоретической прямой регрессии от эмпирической для фиксированных значений аргумента x-x0 определяются как:
Необходимо отметить, что эта оценка значительно ухудшается при удалении от среднего значения Мх-` x, это указывает на опасность экстраполяции прямой регрессии за пределы интервала значений аргумента.
Для проверки гипотезы о том, что значения ` у /х подсчитанные по уравнению для каждого х, лежат на прямой, проводят поинтервальную оценку. Для каждого интервала (их количество l>8-10) подсчитывают условное среднее значение ` у /хj и условную дисперсию по формулам:
где mj - число точек ( xij, yij,) в j -том интервале, а затем вычисляют параметр:
Если F превосходит критическое табличное значение при числах степеней свобода K1=l-2; K2=n-l надежностью P гипотезу о линейном характере усредненной зависимости y от x следует поставить под сомнение [70, 76, 80].
В случае нелинейной корреляции в качестве меры тесноты связи, т.е. меры концентрации экспериментальных точек около усредненных кривых регрессии, применяется корреляционное отношение h y/x для зависимости у от x или h y/x для зависимости x от y.
Корреляционные отношения вычисляются по формулам:
где обозначения, те же, что в приведенных выше выражениях, причем mj’ и l’ имеют тот же смысл для x, какой mJ и l - для у. Корреляционные отношения удовлетворяют неравенствам:
0 £ ç rç £ h y/x £ 1; 0 £ ç rç £ h x/y £ 1;
При отсутствии корреляционной связи r, в, h равны нулю. Поэтому проверка гипотезы о наличии корреляционной связи заключается в
расчете выборочных эмпирических оценок этих характеристик и значимости их отличия от нуля, причем из h у/х = 0 еще не следует, что h x/y =0 [2, 76]. Для криволинейных зависимостей по строение кривых регрессии проводится также методом наименьших квадратов, при расчетах ограничиваются полиномами до третьей степени [76,80].
Уравнение кривой регрессии удобно записывать в виде разложения по ортогональным полиномам П.Л. Чебышева [76]:
y = во× ро(х) + в1× р1(х) +…вvрv(x), где ро(х)=1, р1(х)=(х-` х),
Параметры вj не зависят от степени искомого полинома и определяются по формуле:
(j=0,1….n)Истинные значения параметров вj с надежностью P лежат в доверительных интервалах:
где tj =t(P,R) из таблиц распределения при числе степеней свободы R=n-j-1, есть сумма квадратов отклонений опытных точек от расчетных, .Все измерения предполагаются равноточными и независимыми с нормально распределенными ошибками. При оценке геохимических систем с парагенетическими корреляционными связями применяется метод множественной линейной корреляции для трех-шести компонент, уравнение множественной регрессии которого представляет линеаризированную функцию:
, где xi - значения i -ого признака.Найденное уравнение наилучшим образом, в смысле метода наименьших квадратов, соответствует имеющимся эмпирическим данным. Задача сводится к вычислению коэффициентов регрессии ao,a1,…aR по совокупности N наблюдений переменных x1,x2,…xm и зависимой переменной y. При вычислениях на ЭВМ определяются следующие показатели [44]:
Вычисление сумм взаимных произведений отклонений всех переменных
где j = 1, 2, 3,… m;
R=1, 2, 3,… m;2. Вычисление средних для всех переменных
3. Вычисление парных эмпирических коэффициентов корреляции
где j = 1, 2, 3,… m; R=1, 2, 3,… m;
4. Вычисление стандартных отклонений для всех переменных
5. Подбор обратной матрицы парных эмпирических корреляционных коэффициентов, которая при умножении на данную матрицу дает единичную матрицу.
R . R-1 = R-1 .R = E
6. Вычисление коэффициентов регрессии
где Sy - стандартное отклонение зависимой переменной;
Sj - стандартное отклонение J -ой независимой переменной;
rij - парная корреляция i -ой независимой переменной с зависимой
переменной;
rij-1 - обратная корреляция независимых переменных.
7. Вычисление свободного члена