본문 바로가기
-----ETC-----/C++ 심화 알고리즘과 자료구조 시리즈

[C++로 배우는 알고리즘과 자료구조 심화] Day 22: 고급 정렬 알고리즘 (TimSort, IntroSort)

by cogito21_cpp 2024. 8. 1.
반응형

고급 정렬 알고리즘

정렬 알고리즘은 데이터 처리와 분석에서 매우 중요한 역할을 합니다. 오늘은 두 가지 고급 정렬 알고리즘인 TimSortIntroSort에 대해 학습하겠습니다. 이 두 알고리즘은 효율성과 안정성 측면에서 매우 강력하며, 실세계에서 널리 사용됩니다.

TimSort

TimSort는 삽입 정렬과 병합 정렬을 혼합한 하이브리드 정렬 알고리즘입니다. 이 알고리즘은 실제 데이터가 부분적으로 정렬되어 있는 경우 매우 효율적입니다. Python의 sort() 함수와 Java의 Arrays.sort()에서 사용되는 기본 정렬 알고리즘이기도 합니다.

TimSort의 주요 단계

  1. Runs 분할: 주어진 배열을 일정 크기(기본적으로 32 또는 64)로 분할하여 각각을 정렬합니다.
  2. Runs 병합: 병합 정렬을 사용하여 분할된 부분 배열들을 병합합니다.

TimSort 구현

다음은 C++로 TimSort를 구현한 예제입니다.

#include <iostream>
#include <vector>
#include <algorithm>

// 최소 런 크기
const int RUN = 32;

// 삽입 정렬 함수
void insertionSort(std::vector<int>& arr, int left, int right) {
    for (int i = left + 1; i <= right; i++) {
        int temp = arr[i];
        int j = i - 1;
        while (j >= left && arr[j] > temp) {
            arr[j + 1] = arr[j];
            j--;
        }
        arr[j + 1] = temp;
    }
}

// 병합 함수
void merge(std::vector<int>& arr, int left, int mid, int right) {
    int len1 = mid - left + 1, len2 = right - mid;
    std::vector<int> leftArr(len1), rightArr(len2);

    for (int i = 0; i < len1; i++)
        leftArr[i] = arr[left + i];
    for (int i = 0; i < len2; i++)
        rightArr[i] = arr[mid + 1 + i];

    int i = 0, j = 0, k = left;
    while (i < len1 && j < len2) {
        if (leftArr[i] <= rightArr[j]) {
            arr[k] = leftArr[i];
            i++;
        } else {
            arr[k] = rightArr[j];
            j++;
        }
        k++;
    }

    while (i < len1) {
        arr[k] = leftArr[i];
        i++;
        k++;
    }

    while (j < len2) {
        arr[k] = rightArr[j];
        j++;
        k++;
    }
}

// TimSort 함수
void timSort(std::vector<int>& arr, int n) {
    for (int i = 0; i < n; i += RUN)
        insertionSort(arr, i, std::min(i + RUN - 1, n - 1));

    for (int size = RUN; size < n; size = 2 * size) {
        for (int left = 0; left < n; left += 2 * size) {
            int mid = left + size - 1;
            int right = std::min((left + 2 * size - 1), (n - 1));
            if (mid < right)
                merge(arr, left, mid, right);
        }
    }
}

int main() {
    std::vector<int> arr = {5, 21, 7, 23, 19, 4, 13, 8, 2, 6, 11, 16, 10, 12};
    int n = arr.size();

    timSort(arr, n);

    std::cout << "정렬된 배열: ";
    for (int x : arr) {
        std::cout << x << " ";
    }
    std::cout << std::endl;

    return 0;
}

 

IntroSort

IntroSort는 퀵 정렬, 힙 정렬, 삽입 정렬을 결합한 하이브리드 정렬 알고리즘입니다. 퀵 정렬의 성능이 저하될 때 힙 정렬로 전환하여 최악의 시간 복잡도를 보장합니다. C++의 std::sort()에서 기본적으로 사용됩니다.

IntroSort의 주요 단계

  1. 퀵 정렬: 배열을 정렬합니다.
  2. 히프 정렬로 전환: 재귀 깊이가 일정 수준을 초과하면 힙 정렬로 전환합니다.
  3. 삽입 정렬: 작은 배열에 대해 삽입 정렬을 사용합니다.

IntroSort 구현

다음은 C++로 IntroSort를 구현한 예제입니다.

#include <iostream>
#include <vector>
#include <algorithm>
#include <cmath>

// 삽입 정렬 함수
void insertionSort(std::vector<int>& arr, int left, int right) {
    for (int i = left + 1; i <= right; i++) {
        int key = arr[i];
        int j = i - 1;
        while (j >= left && arr[j] > key) {
            arr[j + 1] = arr[j];
            j--;
        }
        arr[j + 1] = key;
    }
}

// 힙 정렬 함수
void heapify(std::vector<int>& arr, int n, int i) {
    int largest = i;
    int left = 2 * i + 1;
    int right = 2 * i + 2;

    if (left < n && arr[left] > arr[largest])
        largest = left;

    if (right < n && arr[right] > arr[largest])
        largest = right;

    if (largest != i) {
        std::swap(arr[i], arr[largest]);
        heapify(arr, n, largest);
    }
}

void heapSort(std::vector<int>& arr, int n) {
    for (int i = n / 2 - 1; i >= 0; i--)
        heapify(arr, n, i);

    for (int i = n - 1; i >= 0; i--) {
        std::swap(arr[0], arr[i]);
        heapify(arr, i, 0);
    }
}

// 퀵 정렬 함수
int partition(std::vector<int>& arr, int low, int high) {
    int pivot = arr[high];
    int i = low - 1;

    for (int j = low; j < high; j++) {
        if (arr[j] < pivot) {
            i++;
            std::swap(arr[i], arr[j]);
        }
    }
    std::swap(arr[i + 1], arr[high]);
    return i + 1;
}

void quickSort(std::vector<int>& arr, int low, int high, int depthLimit) {
    if (low < high) {
        if (depthLimit == 0) {
            heapSort(arr, high - low + 1);
            return;
        }

        int pivot = partition(arr, low, high);
        quickSort(arr, low, pivot - 1, depthLimit - 1);
        quickSort(arr, pivot + 1, high, depthLimit - 1);
    }
}

// IntroSort 함수
void introSort(std::vector<int>& arr, int n) {
    int depthLimit = 2 * log(n);
    quickSort(arr, 0, n - 1, depthLimit);
    insertionSort(arr, 0, n - 1);
}

int main() {
    std::vector<int> arr = {5, 21, 7, 23, 19, 4, 13, 8, 2, 6, 11, 16, 10, 12};
    int n = arr.size();

    introSort(arr, n);

    std::cout << "정렬된 배열: ";
    for (int x : arr) {
        std::cout << x << " ";
    }
    std::cout << std::endl;

    return 0;
}

 

설명

  1. TimSort:
    • insertionSort: 작은 런을 정렬합니다.
    • merge: 정렬된 런을 병합합니다.
    • timSort: 배열을 작은 런으로 나누고, 각 런을 정렬한 후 병합합니다.
  2. IntroSort:
    • insertionSort: 작은 배열을 정렬합니다.
    • heapSort: 퀵 정렬의 재귀 깊이가 깊어지면 힙 정렬로 전환합니다.
    • quickSort: 퀵 정렬을 수행하고, 깊이 제한이 초과되면 힙 정렬로 전환합니다.
    • introSort: 정렬 알고리즘을 결합하여 효율적으로 정렬합니다.

고급 정렬 알고리즘인 TimSort와 IntroSort의 개념과 구현방법을 이해했습니다. 질문이나 피드백이 있으면 언제든지 댓글로 남겨 주세요. 내일은 "Day 23: 분할 상환 분석(Amortized Analysis)"에 대해 학습하겠습니다.

반응형