Таким образом из технологического опыта может следовать, что связь между аргументом и функцией имеет криволинейный характер. Возможно, что аппроксимация производственных данных в виде кривой точнее отражала бы существующую взаимосвязь.
КРИВОЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ
Аппроксимация кривой выполняется тем же путем с использованием метода наименьших квадратов, что и выравнивание по прямой линии. Линия регрессии должна удовлетворять условию минимума суммы квадратов расстояний до каждой точки корреляционного поля. В данном случае в уравнении (1)упредставляет собой расчетное значение функции, определенное при помощи уравнения выбранной криволинейной связи по фактическим значениям х j. Например, если для аппроксимации связи выбрана парабола второго порядка, то
y=а+b x + cx2, ( 14 )
.а разность между точкой, лежащей на кривой, и данной точкой корреляционного поля при соответствующем аргументе можно записать аналогично уравнению (3) в виде
Dyj = yj-(a + bx +cx2) ( 15 )
При этом сумма квадратов расстояний от каждой точки корреляционного поля до новой линии регрессии в случае параболы второго порядка будет иметь вид:
S2 = SDyj 2= S [yj-(a + bx +cx2)]2 ( 16 )
Исходя из условия минимума этой суммы, частные производные S2 по а, bи сприравниваются к нулю. Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными для определенияa, b и с.
,Sy = m a + bSx + cSx2
Syx = aSx + bSx2 + cSx2.
Syx2 = aSx2 + bSx3 + cSx4 . ( 17 ).
Решая систему уравнений относительно a,bис, находим численные значения коэффициентов регрессии. ВеличиныSy,Sx, Sx2,Syx,Syx2, Sx3, Sx4.находятся непосредственно по данным производственных измерений.
Оценкой тесноты связи при криволинейной зависимости служит теоретическое корреляционное отношение hxу, представляющее собой корень квадратный из соотношения двух дисперсий: среднего квадрата sр2отклонений расчетных значений y' jфункции по найденному уравнению регрессии от среднеарифметического значения Yвеличины y к среднему квадрату отклонений sy2 фактических значений функции y jот ее среднеарифметического значения :
hxу = {sр2/sy2}1/2 = {S (y' j - Y)2 /S (y j - Y)2 } 1/2( 18 )
Квадрат корреляционного отношения hxу2 показывает долю полной изменчивости зависимой переменной у, обусловленную изменчивостью аргумента х. Этот показатель называется коэффициентом детерминации. В отлично от коэффициента корреляции величина корреляционного отношения может принимать только положительные значения от 0 до 1. При полном отсутствии связи корреляционное отношение равно нулю, при наличии функциональной связи оно равно единице, а при наличии регрессионной связи различной тесноты корреляционное отношение принимает значения между нулем и единицей. Выбор типа кривой имеет большое значение в регрессионном анализе, поскольку от вида выбранной взаимосвязи зависит точность аппроксимации и статистические оценки тесноты связи. Наиболее простой метод выбора типа кривой состоит в построении корреляционных полей и в подборе соответствующих типов регрессионных уравнений по расположению точек на этих полях. Методы регрессионного анализа позволяют отыскивать численные значения коэффициентов регрессии для сложных видов взаимосвязи параметров, описываемых, например, полиномами высоких степеней. Часто вид кривой может быть определен на основе физической сущности рассматриваемого процесса или явления. Полиномы высоких степеней имеет смысл применять для описания быстро меняющихся процессов в том случае, если пределы колебания параметров этих процессов значительные.
Применительно к исследованиям металлургического процесса достаточно использовать кривые низших порядков, например параболу второго порядка.
Эта кривая может иметь один экстремум, что, как показала практика, вполне достаточно для описания различных характеристик металлургического процесса.
Результаты расчетов параметров парной корреляционной взаимосвязи были бы достоверны н представляли бы практическую ценность в том случае, если бы используемая информация была получена для условий широких пределов колебаний аргумента при постоянстве всех прочих параметров процесса. Следовательно, методы исследования парной корреляционной взаимосвязи параметров могут быть использованы для решения практических задач лишь тогда, когда существует уверенность в отсутствии других серьезных влияний на функцию, кроме анализируемого аргумента. В производственных условиях вести процесс таким образом продолжительное время невозможно. Однако если иметь информацию об основных параметрах процесса, влияющих на его результаты, то математическим путем можно исключить влияние этих параметров и выделить в “чистом виде” взаимосвязь интересующей нас функции и аргумента. Такая связь называется частной, или индивидуальной. Для ее определения используется метод множественной регрессии.
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Множественной регрессией называется взаимосвязь трех и более переменных, или влияние двух и более аргументов на функцию
y =f ( x1 , x2, .... xn). ( 19 )
Для простоты рассмотрим случай, когда функция усопоставляется с двумя аргументами x1 и x2 . Такую зависимость графически можно представить в трехмерном пространстве {у, x 1 , x 2} Совокупность всех т точек представляет собой корреляционное пространство. Задача определения связи у отx1 и x2состоит в том, чтобы подобрать такую плоскость, например плоскость Р, которая наилучшим образом вписалась бы в данное корреляционное пространство:
При этом под словами “наилучшим образом” понимается удовлетворение требованию наименьших квадратов, т. е. сумма квадратов расстояний каждой точки корреляционного поля от искомой плоскости [уравнениеy = a + b1x 1 + b2 x2] должна быть минимальной. Это расстояние определяется выражением
Dyj = yj-(a + b1 x1 + b 2x 2) ( 21 )
Требуется найти значения коэффициентовa, b1 и b2.
Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными:
,Sy = m a + b1Sx1 + b2Sx2
Syx1 = aSx1 + b1Sx 12 + b2Sx1 x 2.
Syx 2 = aSx2 + b1Sx1 x2 + b2Sx22. ( 22 )
Решение системы уравнений относительно коэффициентов a, b1 и b2, позволяет определить их численные значения. ВеличиныSy,Sx1, Sx12,Syx1,Syx2, Sx2, Sx22,Sx1 x2 .находятся непосредственно по данным производственных измерений.
Таким образом, найденное уравнение регрессии описывает совместное влияниеx1 и x2 на функцию у. Коэффициентыa, b1 и b2при этом имеют математический смысл.
Коэффициентаравен функции упри нулевых значениях аргументовx1 и x2. В геометрической интерпретации коэффициент а соответствует ординате точки пересечения плоскости регрессии Р с осьюy.
Коэффициентb1 равен изменению функции упри изменении первого аргумента х1 на единицу при неизменном втором аргументе x2. Аналогично коэффициент регрессии b2 равен изменению функцииупри изменении второго аргументаx2 на единицу при неизменном первом аргументеx 1.