Смекни!
smekni.com

Сортировка данных в массиве (стр. 2 из 2)

while (scanUp <= scanDown && A[scanUp] <= pivot)scanUp++;

После позиционирования scanUp индекс scanDown продвигается вниз по списку, пока не встретится элемент, меньший или равный центральному.

while (pivot < A[scanDown]) scanDown--;

По окончании этого цикла (и при условии что scanUp < scanDown) оба индекса адресуют два элемента, находящихся не в тех подсписках. Эти элементы меняются местами.

Swap(A[scanUp], A[scanDown]);

Обмен элементов прекращается, когда scanDown становится меньше, чем scanUp. В этот момент scanDown указывает начало левого подсписка, который содержит меньшие или равные центральному элементы. Индекс scanDown становится центральным. Взять центральный элемент из A[low]:

Swap(A[low], A[scanDown]);

Для обработки подсписков используется рекурсия. После обнаружения точки разбиения мы рекурсивно вызываем QuickSort с параметрами low, mid-1 и mid+1, high. Условие останова возникает, когда в подсписке остается менее двух элементов, так как одноэлементный или пустой массив упорядочивать не нужно.

// Swap меняет местами элементы массива. Соответствующий тип данных // должен поддерживать операцию «=».template <class T>void Swap(T & el1, T & el2){ T tmp = el1; el1 = el2;el2 = tmp;}// QuickSort принимает в качестве параметров массив// и предельные значения его индексовtemplate <class T>void QuickSort(T A[], int low, int high){ // локальные переменные, содержащие индекс середины - mid, // центральный элемент и индексы сканирования T pivot;int scanUp, scanDown; int mid;// если диапазон индексов не включает в себя // как минимум два элемента, завершить работуif(high - low <= 0) return; else if(high - low == 1){ // если в подсписке два элемента, сравнить их между собой // и поменять местами при необходимости if(A[high] < A[low])Swap(A[low], A[high]);return; } // Рассчитать индекс середины и поместить значение соответствующего // элемента массива в переменную pivot.mid = (low + high)/2; pivot = A[mid];// Поменять местами центральный и начальный элементы списка.Swap(A[mid], A[low]);// Инициализировать индексы scanUp и scanDown. scanUp = low + 1; scanDown = high; // Искать элементы, расположенные не в тех подсписках. // Остановиться при scanDown < scanUp. do { // Продвигаться вверх по первому подсписку. Остановиться, // когда scanUp укажет на второй подсписок или если // указываемый этим индексом элемент > центрального.while(scanUp <= scanDown && A[scanUp] <= pivot)scanUp++; // Продвигаться вниз по второму подсписку. Остановиться, // когда scanDown указжет на элемент >= центральному.while(A[scanDown] > pivot) scanDown--;// Если индексы все еще в своих подсписках, то они указывают // на два элемента, находящихся не в тех подсписках. if(scanUp < scanDown) { // Поменять их местамиSwap(A[scanUp], A[scanDown]);} } while(scanUp < scanDown); // Скопировать элемент на который указывает точка разбиения // в первый элемент первого подсписка, ... A[low] = A[scanDown]; // а центральный элемент в точку разбиения A[scanDown] = pivot; // если первый подсписок (low...scanDown-1) имеет 2 или более // элемента, выполнить для него рекурсивный вызов QuickSortif(low < scanDown-1) QuickSort(A, low, scanDown-1);// если второй подсписок (scanDown+1...high) имеет 2 или более // элемента, выполнить для него рекурсивный вызов QuickSortif(scanDown+1 < high) QuickSort(A, scanDown+1, high);}

Вычислительная сложность «быстрой» сортировки

Общий анализ эффективности «быстрой» сортировки достаточно труден. Будет лучше показать ее вычислительную сложность, подсчитав число сравнений при некоторых идеальных допущениях. Допустим, что n – степень двойки, n = 2k (k = log2n), а центральный элемент располагается точно посередине каждого списка и разбивает его на два подсписка примерно одинаковой длины.

При первом сканировании производится n-1 сравнений. В результате создаются два подсписка размером n/2. На следующей фазе обработка каждого подсписка требует примерно n/2 сравнений. Общее число сравнений на этой фазе равно 2(n/2) = n. На следующей фазе обрабатываются четыре подсписка, что требует 4(n/4) сравнений, и т.д. В конце концов процесс разбиения прекращается после k проходов, когда получившиеся подсписки содержат по одному элементу. Общее число сравнений приблизительно равно

n + 2(n/2) + 4(n/4) + ... + n(n/n) = n + n + ... + n = n * k = n * log2n

Для списка общего вида вычислительная сложность «быстрой» сортировки равна O(n log2 n). Идеальный случай, который мы только что рассмотрели, фактически возникает тогда, когда массив уже отсортирован по возрастанию. Тогда центральный элемент попадает точно в середину каждого подсписка.

Если массив отсортирован по убыванию, то на первом проходе центральный элемент обнаруживается на середине списка и меняется местами с каждым элементом как в первом, так и во втором подсписке. Результирующий список почти отсортирован, алгоритм имеет сложность порядка O(n log2n).

Рис.6

Наихудшим сценарием для «быстрой» сортировки будет тот, при котором центральный элемент все время попадает в одноэлементный подсписок, а все прочие элементы остаются во втором подсписке. Это происходит тогда, когда центральным всегда является наименьший элемент. Рассмотрим последовательность 3, 8, 1, 5, 9.

На первом проходе производится n сравнений, а больший подсписок содержит n-1 элементов. На следующем проходе этот подсписок требует n-1 сравнений и дает подсписок из n-2 элементов и т.д. Общее число сравнений равно:

n + n-1 + n-2 + ... + 2 = n(n+1)/2 - 1

Сложность худшего случая равна O(n2), т.е. не лучше, чем для сортировок вставками и выбором. Однако этот случай является патологическим и маловероятен на практике. В общем, средняя производительность «быстрой» сортировки выше, чем у всех рассмотренных нами сортировок.

Алгоритм QuickSort выбирается за основу в большинстве универсальных сортирующих утилит. Если вы не можете смириться с производительностью наихудшего случая, используйте пирамидальную сортировку – более устойчивый алгоритм, сложность которого равна O(n log2n) и зависит только от размера списка.

Сравнение алгоритмов сортировки массивов

Мы сравнили алгоритмы сортировки, испытав их на массивах, содержащих 4000, 8000, 10000, 15000 и 20000 целых чисел, соответственно. Время выполнения измерено в тиках (1/60 доля секунды). Среди всех алгоритмов порядка O(n2) время сортировки вставками отражает тот факт, что на i-ом проходе требуется лишь i/2 сравнений. Этот алгоритм явно превосходит все прочие сортировки порядка O(n2). Заметьте, что самую худшую общую производительность демонстрирует сортировка методом пузырька. Результаты испытаний показаны в таблице 1 и на рисунке 7.

Для иллюстрации эффективности алгоритмов сортировки в экстремальных случаях используются массивы из 20000 элементов, отсортированных по возрастанию и по убыванию. При сортировке методом пузырька и сортировке вставками выполняется только один проход массива, упорядоченного по возрастанию, в то время как сортировка посредством выбора зависит только от размера списка и производит 19999 проходов. Упорядоченность данных по убыванию является наихудшим случаем для пузырьковой, обменной и сортировки вставками, зато сортировка выбором выполняется, как обычно.

n Обменная сортировка Сортировка выбором Пузырьковая сортировка Сортировка вставками
4 000 12.23 17.30 15.78 5.67
8 000 49.95 29.43 64.03 23.15
10 000 77.47 46.02 99.10 35.43
15 000 173.97 103.00 223.28 80.23
20 000 313.33 185.05 399.47 143.67

Рис.7 Сравнение сортировок порядка O(n2)

n Обменная сортировка Сортировка выбором Пузырьковая сортировка Сортировка вставками
8 000 (упорядочен по возрастанию) 185.27 185.78 0.03 0.05
8 000 (упорядочен по убыванию) 526.17 199.00 584.67 286.92

В общем случае QuickSort является самым быстрым алгоритмом. Благодаря своей эффективности, равной O(n log2n), он явно превосходит любой алгоритм порядка O(n2). Судя по результатам испытаний, приведенных в следующей таблице, он также быстрее любой из сортировок порядка O(n log2n), рассмотренных нами в прошлом номере. Обратите внимание, что эффективность «быстрой» сортировки составляет O(n log2n) даже в экстремальных случаях. Зато сортировка посредством поискового дерева становится в этих случаях O(n2) сложной, так как формируемое дерево является вырожденным.

n Турнирная сортировка Сортировка посредством дерева Пирамидальная сортировка "Быстрая" сортировка
4 000 0.28 0.32 0.13 0.07
8 000 0.63 0.68 0.28 0.17
10 000 0.90 0.92 0.35 0.22
15 000 1.30 1.40 0.58 0.33
20 000 1.95 1.88 0.77 0.47
8 000 (упорядочен по возрастанию) 1.77 262.27 0.75 0.23
8 000 (упорядочен по убыванию) 1.65 275.70 0.80 0.28

Рис.8 Сравнение сортировок порядка O(n log2n)

Сравнение сортировок

Эта программа осуществляет сравнение алгоритмов сортировки данных, представленных на рисунках 7 и 8. Здесь мы приводим только базовую структуру программы. Хронометраж производится с помощью функции TickCount, возвращающей число 1/60 долей секунды, прошедших с момента старта программы.

#include <iostream.h>#include "arrsort.h"// Перечислимый тип, описывающий начальное состояние массива данных.enum Ordering {randomorder, ascending, descending};// Перечислимый тип, идентифицирующий алгоритм сортировки.enum SortType{ SortTypeBegin, exchange = SortTypeBegin, selection, bubble, insertion, tournament, tree, heap, quick, SortTypeEnd = quick};// копировать n-элементныймассив y вмассив xvoid Copy(int *x, int *y, int n){ for (int i=0; i<n; i++)*x++ = *y++;}// Общая сортирующая функция, которая принимает исходный массив// с заданной упорядоченностью элементов и применяет указанный// алгоритмсортировки.void Sort(int a[], int n, SortType type, Ordering order){ long time; cout << "Сортировка " << n;// Вывести тип упорядоченности. switch(order){ case random: cout << " элементов. "; break;case ascending: cout << " элементов, упорядоченных по возрастанию. "; break; case descending: cout << " элементов, упорядоченных по убыванию. "; break; } // засечьвремя time = TickCount();// Выполнить сортировку и вывести ее тип...switch(type) { case exchange: ExchangeSort(a, n); cout << "Сортировкаобменом: "; break; case selection: SelectionSort(a, n); cout << "Сортировкавыбором: "; break; case bubble: . . . . . . . case insertion: . . . . . . . case tournament: . . . . . . . case tree: . . . . . . . case heap: . . . . . . .case quick: . . . . . . . } // Подсчитать время выполнения в секундах.time = TickCount() - time; cout << time/60.0 << endl;}// Выполняет сортировку массива с n элементами,// расположенных в порядке, определяемом параметром order.void RunTest(int n, Ordering order){ int i; int *a, *b; SortType stype;RandomNumber rnd; // Выделить память для двух n-элементных массивов a и b.a = new int [n]; b = new int [n];// Определить тип упорядоченности данных. if(order == randomorder) { // Заполнить массив b случайными числами.for(i=0; i<n; i++) b[i] = rnd.Random(n);} else { // Данные, отсортированные по возрастанию.for(i=0; i<n; i++) b[i] = i;} else { // данные, отсортированные по убыванию.for(i=0; i<n; i++) b[i] = n - 1 - i;} else { // Копировать данные в массив a. Поочередно выполнить сортировку для // каждоготипа. for(stype = SortTypeBegin; stype <= SortTypeEnd; stype = SortType(stype+1)) { Copy(a, b, n); Sort(a, n, stype, order);} } // Удалить оба динамических массива. delete [] a; delete [] b;}// Отсортировать 4 000-, 8 000-, 10 000-, 15 000- и 20 000-элементный массивы,// заполненные случайными числами. // Затем сначала отсортировать 20 000-элементный массив, упорядоченный // по возрастанию, а потом по убыванию.void main(void){ int nelts[5] = {4000, 8000, 10000, 15000, 20000}; int = i; cout.precision(3); cout.setf(ios::fixed | ios::showpoint); for(i= 0; i<5; i++) RunTest(nelts[i], randomorder);RunTest(20000, ascending); RunTest(20000, descending);