반응형
고급 정렬 알고리즘
정렬 알고리즘은 데이터 처리와 분석에서 매우 중요한 역할을 합니다. 오늘은 두 가지 고급 정렬 알고리즘인 TimSort와 IntroSort에 대해 학습하겠습니다. 이 두 알고리즘은 효율성과 안정성 측면에서 매우 강력하며, 실세계에서 널리 사용됩니다.
TimSort
TimSort는 삽입 정렬과 병합 정렬을 혼합한 하이브리드 정렬 알고리즘입니다. 이 알고리즘은 실제 데이터가 부분적으로 정렬되어 있는 경우 매우 효율적입니다. Python의 sort()
함수와 Java의 Arrays.sort()
에서 사용되는 기본 정렬 알고리즘이기도 합니다.
TimSort의 주요 단계
- Runs 분할: 주어진 배열을 일정 크기(기본적으로 32 또는 64)로 분할하여 각각을 정렬합니다.
- Runs 병합: 병합 정렬을 사용하여 분할된 부분 배열들을 병합합니다.
TimSort 구현
다음은 C++로 TimSort를 구현한 예제입니다.
#include <iostream>
#include <vector>
#include <algorithm>
// 최소 런 크기
const int RUN = 32;
// 삽입 정렬 함수
void insertionSort(std::vector<int>& arr, int left, int right) {
for (int i = left + 1; i <= right; i++) {
int temp = arr[i];
int j = i - 1;
while (j >= left && arr[j] > temp) {
arr[j + 1] = arr[j];
j--;
}
arr[j + 1] = temp;
}
}
// 병합 함수
void merge(std::vector<int>& arr, int left, int mid, int right) {
int len1 = mid - left + 1, len2 = right - mid;
std::vector<int> leftArr(len1), rightArr(len2);
for (int i = 0; i < len1; i++)
leftArr[i] = arr[left + i];
for (int i = 0; i < len2; i++)
rightArr[i] = arr[mid + 1 + i];
int i = 0, j = 0, k = left;
while (i < len1 && j < len2) {
if (leftArr[i] <= rightArr[j]) {
arr[k] = leftArr[i];
i++;
} else {
arr[k] = rightArr[j];
j++;
}
k++;
}
while (i < len1) {
arr[k] = leftArr[i];
i++;
k++;
}
while (j < len2) {
arr[k] = rightArr[j];
j++;
k++;
}
}
// TimSort 함수
void timSort(std::vector<int>& arr, int n) {
for (int i = 0; i < n; i += RUN)
insertionSort(arr, i, std::min(i + RUN - 1, n - 1));
for (int size = RUN; size < n; size = 2 * size) {
for (int left = 0; left < n; left += 2 * size) {
int mid = left + size - 1;
int right = std::min((left + 2 * size - 1), (n - 1));
if (mid < right)
merge(arr, left, mid, right);
}
}
}
int main() {
std::vector<int> arr = {5, 21, 7, 23, 19, 4, 13, 8, 2, 6, 11, 16, 10, 12};
int n = arr.size();
timSort(arr, n);
std::cout << "정렬된 배열: ";
for (int x : arr) {
std::cout << x << " ";
}
std::cout << std::endl;
return 0;
}
IntroSort
IntroSort는 퀵 정렬, 힙 정렬, 삽입 정렬을 결합한 하이브리드 정렬 알고리즘입니다. 퀵 정렬의 성능이 저하될 때 힙 정렬로 전환하여 최악의 시간 복잡도를 보장합니다. C++의 std::sort()
에서 기본적으로 사용됩니다.
IntroSort의 주요 단계
- 퀵 정렬: 배열을 정렬합니다.
- 히프 정렬로 전환: 재귀 깊이가 일정 수준을 초과하면 힙 정렬로 전환합니다.
- 삽입 정렬: 작은 배열에 대해 삽입 정렬을 사용합니다.
IntroSort 구현
다음은 C++로 IntroSort를 구현한 예제입니다.
#include <iostream>
#include <vector>
#include <algorithm>
#include <cmath>
// 삽입 정렬 함수
void insertionSort(std::vector<int>& arr, int left, int right) {
for (int i = left + 1; i <= right; i++) {
int key = arr[i];
int j = i - 1;
while (j >= left && arr[j] > key) {
arr[j + 1] = arr[j];
j--;
}
arr[j + 1] = key;
}
}
// 힙 정렬 함수
void heapify(std::vector<int>& arr, int n, int i) {
int largest = i;
int left = 2 * i + 1;
int right = 2 * i + 2;
if (left < n && arr[left] > arr[largest])
largest = left;
if (right < n && arr[right] > arr[largest])
largest = right;
if (largest != i) {
std::swap(arr[i], arr[largest]);
heapify(arr, n, largest);
}
}
void heapSort(std::vector<int>& arr, int n) {
for (int i = n / 2 - 1; i >= 0; i--)
heapify(arr, n, i);
for (int i = n - 1; i >= 0; i--) {
std::swap(arr[0], arr[i]);
heapify(arr, i, 0);
}
}
// 퀵 정렬 함수
int partition(std::vector<int>& arr, int low, int high) {
int pivot = arr[high];
int i = low - 1;
for (int j = low; j < high; j++) {
if (arr[j] < pivot) {
i++;
std::swap(arr[i], arr[j]);
}
}
std::swap(arr[i + 1], arr[high]);
return i + 1;
}
void quickSort(std::vector<int>& arr, int low, int high, int depthLimit) {
if (low < high) {
if (depthLimit == 0) {
heapSort(arr, high - low + 1);
return;
}
int pivot = partition(arr, low, high);
quickSort(arr, low, pivot - 1, depthLimit - 1);
quickSort(arr, pivot + 1, high, depthLimit - 1);
}
}
// IntroSort 함수
void introSort(std::vector<int>& arr, int n) {
int depthLimit = 2 * log(n);
quickSort(arr, 0, n - 1, depthLimit);
insertionSort(arr, 0, n - 1);
}
int main() {
std::vector<int> arr = {5, 21, 7, 23, 19, 4, 13, 8, 2, 6, 11, 16, 10, 12};
int n = arr.size();
introSort(arr, n);
std::cout << "정렬된 배열: ";
for (int x : arr) {
std::cout << x << " ";
}
std::cout << std::endl;
return 0;
}
설명
- TimSort:
insertionSort
: 작은 런을 정렬합니다.merge
: 정렬된 런을 병합합니다.timSort
: 배열을 작은 런으로 나누고, 각 런을 정렬한 후 병합합니다.
- IntroSort:
insertionSort
: 작은 배열을 정렬합니다.heapSort
: 퀵 정렬의 재귀 깊이가 깊어지면 힙 정렬로 전환합니다.quickSort
: 퀵 정렬을 수행하고, 깊이 제한이 초과되면 힙 정렬로 전환합니다.introSort
: 정렬 알고리즘을 결합하여 효율적으로 정렬합니다.
고급 정렬 알고리즘인 TimSort와 IntroSort의 개념과 구현방법을 이해했습니다. 질문이나 피드백이 있으면 언제든지 댓글로 남겨 주세요. 내일은 "Day 23: 분할 상환 분석(Amortized Analysis)"에 대해 학습하겠습니다.
반응형