Графические средства системы STATISTICA доступны в любом статистическом модуле и на любом шаге статистического анализа. Они могут быть использованы в целях:
• визуализации численных и текстовых значений непосредственно из электронной таблицы с исходными данными STATISTICA или таблицы Scrolfsheet с результатами анализа;
• вывод результатов статистического анализа в виде последовательности (очереди) графиков. Для этого в диалоговых окнах всех статистических процедур имеется возможность построения различных, предназначенных именно для этого вида анализа типов графиков.
STATISTICA содержит удобные инструменты для размещения нескольких графиков и тих документов в одном окне. При помощи этих средств можно легко компоновать сложную графическую, текстовую и численную информацию.
Графический документ в STATISTICA может быть сохранен как:
- графический документ в специальном графическом формате системы STATISTICA, который может быть открыт позже и использован в процессе анализа
- в графическом растровом формате (расширение файла *.bтр, *.рсх),
- в графическом формате Windowsметафайла (*. wmf).
Графики могут быть выведены на принтер, слайды и другие носители с высокой разрешительной способностью.
Статистические процедуры системы STATISTICA сгруппированы в нескольких специализированных статистических модулях [30]. В каждом модуле можно выполнить определенный способ обработки, не обращаясь к процедурам из других модулей.
Численная реализация (большая часть статистических процедур написана на ассемблере) статистических методов в системе STATISTICA такова, что они позволяют решать задачи предельной сложности, так и по точности и скорости вычислений.
1 Модуль основы статистики и таблицы
Необходим для предварительной обработки данных, осуществления разведочного анализа, определения зависимости между ними, разбиения их различными способами на группы, просмотра этих группы визуально и определение взаимосвязи между данными. Обычно с этого модуля начинается работа в системе.
Этот статистический модуль включает в себя приведенные ниже группы статистических процедур.
- Описательные статистики, группировки, разведочный анализ
STATISTICA предлагает широкий выбор методов разведочного статистического анализа. Система может вычислить практически все описательные статистики, включая медиану, моду, квартили, определенные пользователем процентили, средние и стандартные отклонения, доверительные интервалы для среднего, коэффициенты асимметрии, эксцесса (с их стандартными ошибками), гармоническое и геометрическое среднее, а также многие другие описательные статистики.
-Корреляции
Этот раздел включает большое количество средств, позволяющих исследовать зависимости между переменными. Возможно вычисление практически всех общих мер зависимости, включая коэффициент корреляции Пирсона, коэффициент ранговой корреляции Спирмена, Тау Кендалла, Гамма, коэффициент сопряженности признаков С и многие другие.
- t - критерии (и другие критерии для групповых различии)
t-критерии для зависимых и независимых выборок, а также статистика Хоттелинга.
2 Модуль Множественная регрессия
Модуль Множественной регрессии включает в себя исчерпывающий набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессии, включая пошаговые, иерархические и другие методы.
Система STATISTICA позволяет вычислить всесторонний набор статистик и расширенной диагностики, включая полную регрессионную таблицу, частные и частичные корреляции и ковариации для регрессионных весов, матрицы прогонки, статистику Дурбина-Ватсона, расстояния Махаланобиса и Кука, удаленные остатки и многие другие. Анализ остатков и выбросов может быть проведен при помощи широкого набора графиков, включая разнообразные точечные графики, графики частичных корреляций и многие другие. Система прогноза позволяет пользователю выполнять анализ "что - если". Допускаются чрезвычайно большие регрессионные задачи (до 300 переменных в процедуре разведочной регрессии).
Кроме данных модулей в программе имеется широкий набор других модулей: Модуль Дискриминантного анализа; Модуль непараметрической статистики; Модуль факторный анализ; Модуль многомерное шкалирование; Модуль анализ надежности;. Модуль кластерный анализ; Модуль анализ временных рядов и т.д.
1.3 Анализ многофакторной связи выходов продуктов обогащения, качества и марочного состава угля, поступающего на переработку
Задачу оптимального управления развитием горных работ и качеством угля на шахтах необходимо рассматривать с учетом технологических требований обогатительной фабрики на которую поставляется уголь для дальнейшей переработки.
Для центральной обогатительной фабрики "Карагандинская" весьма актуальным является вопрос о том, как зависит выход концентрата от качества исходного угля, его марочного состава и при каком соотношении марок достигается максимальный выход концентрата. Поэтому, наряду с разработкой методов рационального развития горных работ на шахтах, связанных поставками углей на обогатительную фабрику, было проведено исследование зависимости выхода концентрата от участия марок К и КЖ в шихте и их качественных показателей. Исследования проводились на базе статистического материала, представленного в таблице 1.1 .
Многофакторное влияние на величину зависимой переменной в общем виде можно выразить зависимостью:
Y = f(x1 , x2 ,…………,xn) (1.16)
где Y зависимая переменная ( в нашем случае - выход концентрата)
хi, - независимые переменные ( горно-технические и технико-
экономические показатели модели).
Отбор информативных факторов, оказывающих наибольшее влияние на уровень формирования У и построение множественных регрессионных моделей проводилось в следующей последовательности.
Вначале проверялись на однородность исследуемые факторы, вычислялись и изучались основные одномерные статистические характеристики принятых к анализу факторов: их средние значения, среднеквадратические отклонения , коэффициенты вариации. Затем исследовались парные связи между факторами. Используя возможности современного компьютерного обеспечения вычислительных процессов на базе статистических данных представленных в таблице 2.1, было установлено наличие корреляции между выходом концентрата и технологическими показателями обогащаемого угля. Были определены параметры корреляционных формул для каждого независимого переменного и определены коэффициенты парной корреляции которые представлены на рисунках 1- 8 приложения А. Гистограммы по каждому независимому переменному с наложенной плотностью нормального распределения приведены на рисунках 9 – 17 приложения А. Рисунки 9 – 17 свидетельствуют о нормальном распределении исследуемых параметров. Наиболее тесная связь наблюдается между выходом концентрата и процентным участием марок угля в обогащаемой шихте. Коэффициент парной корреляции г = 0.568.
Для более наглядного отображения связей исследуемых параметров, путем аппроксимации в трехмерном пространстве построены графики зависимости выхода концентрата от технологических параметров обогащаемого угля, которые представлены на рисунках 1.1– 1.12. Изображение в трехмерном пространстве связи исследуемых факторов позволяет визуально определять области, представляющие наибольший интерес для дальнейшего, более глубокого исследования. Рассекая квадратичную поверхность через равные интервалы, мы получаем линии равного уровня значений выхода концентрата, которые при проекции на плоскость, образуемую осями независимых переменных, определяют области значений, при которых наблюдается наибольший выход концентрата.
На рисунке 1.1 изображена зависимость выхода концентрата (У) от зольности угля марки К (х2 ) и зольности угля марки КЖ(х6 ) в обогащаемой шихте. Анализ рисунка позволяет сделать вывод, что максимальный выход концентрата достигается при зольности угля марки К не более 31.0 % и зольности угля марки КЖ не более 26.3 %.
Рисунок 1.2 отражает изображенную в трехмерном пространстве зависимость выхода концентрата от зольности угля марки К (x2) и процентного содержания угля марки КЖ (х5) в исходной шихте. Можно предположить, что наибольший выход концентрата достигается при содержании в шихте угля марки КЖ не более 42.0 %.
Рисунки 1.3, 1.4 и 1.5 иллюстрируют поверхности зависимости выхода концентрата(Y) , зольности и влажности (х2-4), зольности и сернистости (х2-3 ) угля марки К, участия угля марки К в шихте (х1) и зольности угля мари К (х2). Максимальный выход концентрата наблюдается при влажности угля марки К ниже чем 6.60 %, содержании серы ниже , чем 0.57 %.
На рисунке 1.6 изображена в трехмерном пространстве зависимость выхода концентрата Y , от процентного содержания угля марки КЖ (x5) , влажности угля марки КЖ (х8). Можно предположить, что наибольший выход концентрата будет при значениях содержания угля марки КЖ не менее 42,0 % и влажности угля марки КЖ не более 6,60 %.