Группировкой называется процесс расчленения, а затем образования однородных групп с целью выделения типов, изучения структуры и взаимосвязи общественных явлений. В других источниках встречается несколько иная интерпретация группировки. Группировка- распределение единиц по группам в соответствии со следующим принципом: различия между единицами, отнесенными к одной группе, должны быть меньше, чем между единицами, отнесенными к разным группам,[9].
При применении метода группировок необходимо решать следующие методологические проблемы:
1. выбор группировочного признака или их комбинации;
2. определение числа групп и величины интервалов группировки;
3. установление применительно к конкретной группировке состава тех показателей, которыми должны характеризоваться выделенные группы;
4. составление макета таблицы, в которой должны быть представлены результаты группировки
Статистические группировки делятся на типологические, структурные и аналитические.
Типологическая группировка - это разделение исследуемой совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с изучаемыми признаками. Методология типологических группировок определяется тем, на сколько ясно выступают качественные отличия в изучаемых явлениях. При проведении этой группировки основное внимание должно быть уделено идентификации типов социально-экономических явлений. Типологическая группировка может быть построена:
1. по качественному признаку
2. по количественному признаку.
Типологическая группировка как правило производится по результативному признаку, к которому относится: урожайность сельскохозяйственных культур, продуктивность сельскохозяйственных животных и уровень производительности труда.
Структурная группировка - это группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. Изучение структуры общественных явлений возможно в динамике, что позволяет выявить структурные сдвиги закономерности с развитыми общественными явлениями. Структурные группировки позволяют подробно изучить население по полу и возрасту, явления в пределах отдельных территорий или на различных территориях.
С помощью аналитических группировок выявляются взаимосвязи между признаками общественных явлений. Эти группировки включают взаимосвязанные признаки, которые делятся на:
1. факторные, т.е. вызывающие изменения другого признака;
2. результативные, изменяющиеся под влиянием факторного признака.
Если с изменением факторного признака изменяется результативный, то между ними имеется зависимость.
Метод группировок - один из важнейших методов статистики, без которого немыслимо изучение массовых явлений.
Для решения поставленной нами задачи необходимо использовать аналитическую группировку.
Для исследования зависимости между явлениями используют аналитические группировки. При их построении можно установить взаимосвязь между двумя признаками и более. При этом один признак будет результативным, а другой факторным. Если с изменением факторного признака изменяется результативный, то между ними имеется зависимость.
Для оценки существенности зависимости, обнаруженной методом группировки исходя из предыдущей главы, можно провести однофакторный дисперсионный анализ.
По данным экономико –математического словаря [21], дисперсионный анализ [variance analysis] — раздел математической статистики, посвященный методам выявления влияния отдельных факторов на результат эксперимента (физического, производственного, экономического эксперимента). Дисперсионный анализ возник как средство обработки результатов агрономических опытов, с помощью которых выявлялись наиболее благоприятные условия для сортов сельскохозяйственных культур.
При этом исходят из положения о том, что существенность фактора в определенных условиях характеризуется его вкладом в дисперсию результата. Английский статистик Р. Фишер, разработавший этот метод, определил его как “отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам”
Анализ производится следующим образом. Сначала группируют совокупность наблюдений по факторному признаку, находят среднее значение результата и дисперсию по каждой группе. Затем определяют общую дисперсию и вычисляют, какая доля ее зависит от условий, общих для всех групп, какая — от исследуемого фактора, а какая — от случайных причин. И наконец, с помощью специального критерия определяют, насколько существенны различия между группами наблюдений и, следовательно, можно ли считать ощутимым влияние тех или иных факторов.
Ефимова М.П выделяет следующее определение [1], дисперсионный анализ представляет собой метод статистической оценки надежности проявления зависимости результативного признака от одного или нескольких факторов.
Он включает в себя:
1. установление основных источников варьирования результативного показателя и объем вариации по источникам образования.
2. вычисление дисперсии.
3. анализ, на основе которого формируется вывод.
Общественные явления находятся под воздействием различных факторов. Однако влияние факторов различно. Влияние одних существенно, а других несущественно. Основной характеристикой существенности влияния фактора на результат является критерий Фишера (F).
Корреляционно-регрессионный анализ.
Исследование объективно существующих связей между явлениями - это важнейшая задача общей теории статистики. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы, которые оказывают основное влияние на вариацию изучаемых явлений и процессов.
Корреляционно-регрессионный анализ - это установление формы связи, количественное измерение влияния фактора на результат, измерение тесноты связи и меры воздействия каждого фактора на результат.
Признаки по их назначению для изучения взаимосвязи делятся на два класса:
1. факторные - это признаки, обуславливающие изменение других, связанных с ними признаков.
2. результативные - это признаки, изменяющиеся под действием факторных признаков.
В природе и обществе явления и процессы связаны друг с другом и зависят друг от друга. Связи и зависимости могут быть функциональными и корреляционными.
Корреляционной называется связь, при которой каждому значению признака (факторному) соответствует несколько значений другого признака (результативного) и между изменением факторного и результативного признака нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных. Как отмечает О.Э. Башина [8], корреляционной связью называют важнейший частный случай статистической связи, состоящей в том, что разным значениям одной переменной соответствуют различные средние значения другой
Функциональной называется связь, при которой определенному значению признака (факторного) всегда соответствует один или несколько определенных значений другого признака (результативного). Она характеризуется полным соответствием между изменением факторного признака и изменениями результативной величины, [1].
Связи можно классифицировать на следующие группы:
1. по направлению связи бывают прямыми или обратными. При прямой связи с увеличением или уменьшением значения факторного признака происходит увеличение или уменьшение значения результативного. В случае обратной связи значение результативного признака изменяется под воздействием факторного, но в противоположном направлении по сравнению с изменением последнего.
2. по аналитическому выражению связи делятся на прямолинейные (линейные) и криволинейные (нелинейные). Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называют линейной связью. Если она выражается уравнением какой-либо кривой линии (парабола, гипербола, степенная и др.), то такую связь называют нелинейной.
Для выявления наличия связи, ее характера и направления в статистике используются следующие методы:
1. анализ параллельных рядов;
2. аналитические группировки;
3. графический метод;
4. метод корреляции.
Корреляция - это статистическая зависимость между случайными величинами, не имеющими строгого функционального характера, при которой изменение одной из них приводит к изменению математического ожидания другой.
В статистике принято различать следующие варианты зависимостей:
1. парная корреляция - это связь между двумя признаками результативным и факторным;
2. частная корреляция - это зависимость между результативным и одним из факторных признаков при фиксированном значении других факторных признаков;
3. множественная корреляция - это зависимость результативного и двух или более факторных признаков, включаемых в исследования.
Корреляционный анализ - это количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).
Для того чтобы результаты корреляционного анализа нашли практическое применение и дали желаемый результат, должны выполняться определенные требования в отношении отбора объекта исследования и признаков-факторов. Одним из важнейших условий правильного применения методов корреляционного анализа является требование однородности тех единиц, которые подвергаются изучению методами корреляционного анализа, количественная оценка однородности и достаточное число наблюдений, [1].
1.2 Необходимость производства сахарной свеклы в народном хозяйстве. Анализ урожая и урожайности сахарной свеклы в РФ и по Воронежской области