где D - определитель матрицы парных коэффициентов;
D11 -определитель той же матрицы с вычеркнутыми первой строкой и первым столбцом, т.е. определитель матрицы парных коэффициентов корреляции между факторами.
Для проверки значимости найденных коэффициентов регрессии определяют критерий Стьюдента по формуле:
(1.12)где Р - число коэффициентов регрессии.
Оценка коэффициентов регрессии при помощи критерия Стьюдента применяется только для линейных связей.
Для оценки надежности уравнения применяют F-критерий Фишера, который определяется по формуле:
(1.13)где
-дисперсия фактических значений зависимого переменного: (1.14)где
остаточная дисперсия уравнения: (1.15)Если значение F³Fтабл., то уравнение считается значимым. Если F < Fтабл., то гипотеза о значимости уравнения не подтверждается, но это не значит, что подтверждается гипотеза о незначимости уравнения.
При увеличении числа независимых переменных требуется производить дополнительные исследования, чтобы выполнялось условие толерантности.
Таким образом, регрессионный анализ, на наш взгляд, является наиболее подходящим методом математической статистики для построения модели учета влияния марочного состава и качества угля, поступающего на переработку на выход продуктов обогащения, а критерии регрессионного анализа доступны в применении для оценки адекватности модели.
STATISTICA является наиболее динамично развивающимся статистическим пакетом и по многочисленным рейтингам является мировым лидером на рынке статистического программного обеспечения.
Она включает в себя мощные возможности по работе с данными, богатые графические возможности и большое количество методов и процедур статистического анализа. STATISTICA 5.0 полностью удовлетворяет основным стандартам среды Windows. Это прежде всего стандарты пользовательского интерфейса — MDf, использование технологий DDE — Динамического обмена данными из других приложений, OLE — Связывания и внедрения объектов, поддержка основных операций с буфером обмена и др.
Пользователями системы являются крупнейшие университеты, исследовательские центры, компании, банки всего мира, государственные учреждения.
Статистический анализ данных в системе STATISTICA может быть разбит на следующие основные этапы [29]:
• ввод данных в электронную таблицу с исходными данными и их предварительное преобразование перед анализом (структурирование, построение необходимых выборок, ранжирование и т. д.);
• визуализация данных при помощи того или иного типа графиков;
• применение конкретной процедуры статистической обработки;
• вывод результатов анализа в виде графиков и электронных таблиц с численной и текстовой информацией;
• подготовка и печать отчета;
• автоматизация рутинных процессов обработки при помощи макрокоманд, языка SCL или STATISTICA BASIC.
STATISTICA представляет собой интегрированную систему статистического анализа и обработки данных. Система состоит из следующих основных компонент:
• многофункциональной системы для работы с данными, которая включает в себя электронные таблицы для ввода и задания исходных данных, а также специальных таблиц (Scroolsheet) для вывода численных результатов анализа. Для сложной (специализированной) обработки данных в STATISTICA имеется модуль Управления данными. Для статистической обработки чрезвычайно больших массивов данных имеется специальный инструмент Менеджер мегафайлов, который может быть использован и для предварительной обработки данных перед вводом их непосредственно в электронную таблицу STATISTICA;
• мощной графической системы для визуализации данных и результатов статистического анализа;
• набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур. В любом конкретном модуле можно выполнить определенный способ статистической обработки, не обращаясь к процедурам из других модулей. Каждый модуль является полноценным Windows приложением.
• специального инструментария для подготовки отчетов. При помощи текстового редактора, встроенного в систему, можно готовить полноценные отчеты. В STATISTICA также имеется возможность автоматического создания отчетов;
• встроенных языков SCL и STATISTICA BASIC, которые позволяют автоматизировать рутинные процессы обработки данных в системе.
STATISTICA работает с четырьмя различными типами документов, которые соответствуют основным структурным компонентам системы. Это:
• электронная таблица Spreadsheet, которая предназначена для ввода исходных данных и их преобразования;
• электронная таблица Scrollsheet для вывода численных и текстовых результатов анализа;
• график — документ в специальном графическом формате для визуализации и графического представления численной информации;
• отчет — документ в формате RTF (Расширенный текстовой формат) для вывода текстовой и графической информации.
В соответствии со стандартами среды Windows каждый тип документа выводится в своем собственном окне в рабочей области системы STATISTICA. Как только это окно становится активным, изменяется панель инструментов и меню. В них появляются команды и кнопки, доступные для активного документа. Имеется несколько различных способов работы с системой STATISTICA.
Данные в STATISTICA организованы в виде электронной таблицы — Spreadsheet. Они могут содержать как численную, так и текстовую информацию. Данные в электронной таблице могут иметь различные форматы, например, даты, времени, денежный и научный форматы и др. Электронные таблицы в STATISTICA поддерживают различные типы операций с данными, такие, как: операции с использованием буфера обмена Windows', операции с выделенными блоками значений (аналогично MS® Excel®), в том числе и с использованием метода Drag-and-Drop — "Перетащить и опустить автозаполнение блоков и т. д. Ввести данные в электронную таблицу можно одним из следующих способов.
• Непосредственно ввести их в электронную таблицу с клавиатуры. В STATISTICA имеются развитые инструментальные средства для автоматизации ручного ввода данных.
• Вычислить новые данные на основе уже введенных данных при помощи формул, которые можно задать в электронной таблице. При этом имеется возможность быстрого доступа к большому количеству специализированных математических и статистических функций, допускается использование логических операторов. Для задания сложных процедур преобразования данных можно воспользоваться встроенным языком SТА TIS TICA BASIC.
• Воспользоваться данными, подготовленными в другом приложении.
Численные результаты статистического анализа в системе STATISTICA выводятся ввиде специальных электронных таблиц, которые называются таблицами вывода результатов __ Scrollsheets. Таблицы Scrollsheet могут содержать любую информацию (как численную, так и текстовую), от короткой строчки до мегабайтов результатов. Обычнодаже в результате простейшего статистического анализа мы получаем на выходе большое количество численной и графической информации. В системе STATISTICA эта информация выводится в виде последовательности (очереди), которая состоит из наборатаблиц Scrollsheet и графиков.
STATISTICA содержит большое количество инструментов для удобного просмотрарезультатов статистического анализа и их визуализации. Они включают в себя стандартные операции по редактированию таблицы (включая операции над блоками значений Drag-and-Drop "Перетащить и опустить", автозаполнение блоков и др.), операции удобного просмотра (подвижные границы столбцов, разделение прокрутки в таблице и др.), доступ к основным статистикам и графическим возможностям системы; STATISTICA. При выводе целого ряда результатов (например, корреляционной матрицы) STATISTICA отмечает значимые коэффициенты корреляции цветом. Пользователь так же имеет возможность выделить при помощи цвета необходимые значения в таблице Scrollsheet.
Если пользователю необходимо провести детальный статистический анализ промежуточных результатов, то можно сохранить таблицу Scrollsheet в формате файла данных STATISTICA и далее работать с ним, как с обычными данными.Кроме вывода результатов анализа в виде отдельных окон с графиками и таблицами Scrollsheet на рабочем пространстве системы STATISTICA, в системе имеется возможность создания отчета, в окно которого может быть выведена вся эта информация.
Система STATISTICA обладает широкими графическими возможностями [29]. STATISTICA включает в себя большое количество разнообразных категорий и типов графиков (включая научные, деловые, трехмерные и двухмерные графики в различных системах координат, специализированные статистические графики — гистограммы, матричные, категоризованные графики и др.).
В систему STATISTICA включено большое количество инструментов настройки всех компонент графиков. Имеется возможность выбора различных типов линий, форматов разметки осей, цветов, легенд, названий и других атрибутов графика. Настроенные атрибуты могут быть сохранены в специальном файле и потом применяться к другим графикам. Доступ ко всем основным командам настройки реализован при помощи контекстных меню, которые появляются при нажатии на правую кнопку мыши, общего меню и из панели инструментов графика.