일상/IT

힙(Heap) 데이터 구조 소개

얇은생각 2024. 7. 11. 07:30
반응형

데이터 구조는 컴퓨터 과학에서 데이터를 효율적으로 조직하고 저장하는 방법을 제공합니다. 그 중 힙(Heap) 데이터 구조는 효율성과 다재다능함으로 널리 사용되는 트리 기반 데이터 구조입니다. 이 글에서는 힙 데이터 구조의 특성, 종류, 구현 방법 및 활용 분야에 대해 자세히 살펴보겠습니다.

 

힙(Heap) 데이터 구조 소개

 

힙 데이터 구조의 특성

힙 데이터 구조는 힙 속성을 만족하는 완전 이진 트리입니다. 힙 속성은 힙의 모든 노드에 대해 부모 노드의 키가 자식 노드의 키보다 크거나 같아야 한다(최대 힙) 또는 작거나 같아야 한다(최소 힙)는 것입니다. 이 속성 덕분에 최대 힙에서는 최대 요소가, 최소 힙에서는 최소 요소가 항상 트리의 루트에 위치하게 됩니다.

완전 이진 트리는 마지막 레벨을 제외한 모든 레벨이 완전히 채워져 있고, 모든 노드가 가능한 한 왼쪽에 위치한 이진 트리입니다. 이진 트리는 각 노드가 최대 두 개의 자식을 가지는 트리 데이터 구조로, 왼쪽 자식과 오른쪽 자식으로 나뉩니다.

힙 데이터 구조는 배열로 구현할 수 있습니다. 배열에서 인덱스 i에 있는 노드의 왼쪽 자식은 인덱스 2i+1, 오른쪽 자식은 인덱스 2i+2에 위치합니다. 마찬가지로 인덱스 j에 있는 노드의 부모는 인덱스 (j-1)/2에 위치합니다.

 

힙 데이터 구조의 종류

힙 데이터 구조에는 두 가지 주요 유형이 있습니다: 최대 힙과 최소 힙.

 

최대 힙

최대 힙에서는 루트 노드가 가장 큰 키를 가집니다. 힙의 모든 노드의 키는 루트 노드의 키보다 작거나 같습니다. , 힙의 최대 요소는 항상 루트에 위치합니다. 최대 힙에서는 부모 노드의 키가 자식 노드의 키보다 항상 큽니다.

 

최소 힙

최소 힙에서는 루트 노드가 가장 작은 키를 가집니다. 힙의 모든 노드의 키는 루트 노드의 키보다 크거나 같습니다. , 힙의 최소 요소는 항상 루트에 위치합니다. 최소 힙에서는 부모 노드의 키가 자식 노드의 키보다 항상 작습니다.

 

힙 데이터 구조의 응용

힙 데이터 구조는 컴퓨터 과학에서 여러 응용 분야에서 사용됩니다. 그 중 일부는 정렬 알고리즘, 우선순위 큐, 그래프 알고리즘입니다.

 

정렬 알고리즘

힙 데이터 구조는 힙 정렬(Heapsort)과 같은 정렬 알고리즘에서 사용됩니다. 힙 정렬에서 입력 배열은 먼저 최대 힙으로 변환됩니다. 그런 다음 최대 요소는 힙의 마지막 요소와 교환되어 힙에서 제거됩니다. 남은 요소에 대해 힙 속성을 복원하는 힙화(Heapify) 작업이 수행됩니다. 이 과정은 모든 요소가 제거될 때까지 반복됩니다. 결과는 정렬된 배열입니다.

 

우선순위 큐

힙 데이터 구조는 우선순위 큐에서 사용됩니다. 우선순위 큐는 우선순위가 있는 요소 집합을 관리하는 데 사용됩니다. 우선순위 큐는 스케줄링, 작업 관리, 기타 우선순위에 따라 요소를 처리해야 하는 응용 프로그램에서 흔히 사용됩니다.

우선순위 큐에서는 가장 높은 우선순위 요소가 먼저 dequeued(큐에서 제거)됩니다. 최대 힙은 우선순위 큐를 구현하는 데 사용되며, 가장 높은 우선순위 요소는 힙의 루트에 저장됩니다. 우선순위 큐의 삽입(enqueue) 및 제거(dequeue) 작업은 힙 데이터 구조를 사용하여 효율적으로 구현할 수 있습니다.

 

그래프 알고리즘

힙 데이터 구조는 다익스트라의 최단 경로 알고리즘과 프림의 최소 신장 트리 알고리즘과 같은 그래프 알고리즘에서 사용됩니다. 다익스트라의 알고리즘에서는 아직 처리되지 않은 정점을 저장하는 데 우선순위 큐가 사용되며, 출발 정점에서 가장 짧은 거리를 가진 정점에 가장 높은 우선순위가 부여됩니다. 우선순위 큐는 최소 힙을 사용하여 구현되며, 출발 정점에서 가장 짧은 거리를 가진 정점은 힙의 루트에 저장됩니다. 알고리즘의 각 반복에서 가장 짧은 거리를 가진 정점이 우선순위 큐에서 제거되고, 인접한 정점들의 거리가 업데이트됩니다.

프림의 알고리즘에서는 탐색된 정점과 탐색되지 않은 정점을 연결하는 간선을 저장하는 데 우선순위 큐가 사용되며, 가장 작은 가중치를 가진 간선에 가장 높은 우선순위가 부여됩니다. 우선순위 큐는 최소 힙을 사용하여 구현되며, 가장 작은 가중치를 가진 간선은 힙의 루트에 저장됩니다. 알고리즘의 각 반복에서 가장 작은 가중치를 가진 간선이 우선순위 큐에서 제거되고, 간선으로 연결된 정점이 탐색된 정점 집합에 추가됩니다.

 

힙 데이터 구조의 구현

힙 데이터 구조는 배열 또는 트리 데이터 구조로 구현할 수 있습니다. 배열 구현에서는 힙의 요소가 배열에 저장되며, 루트 노드는 인덱스 0에 위치합니다. 인덱스 i에 있는 노드의 왼쪽 자식은 인덱스 2i+1, 오른쪽 자식은 인덱스 2i+2에 위치합니다. 인덱스 j에 있는 노드의 부모는 인덱스 (j-1)/2에 위치합니다. 힙 속성은 힙화(Heapify) 작업을 수행하여 유지됩니다.

트리 구현에서는 힙이 이진 트리 데이터 구조로 구현되며, 루트 노드는 트리의 최상단에 위치합니다. 노드의 왼쪽 자식은 부모 노드의 왼쪽에, 오른쪽 자식은 부모 노드의 오른쪽에 위치합니다. 힙 속성은 힙화 작업을 수행하여 유지됩니다.

 

힙화 작업

힙화 작업은 힙 데이터 구조의 힙 속성을 유지하는 데 사용됩니다. 힙화 작업은 노드를 루트로 하는 서브트리를 힙으로 변환합니다. 삽입 또는 삭제 작업으로 인해 힙의 힙 속성이 위반될 때 힙화 작업이 수행됩니다.

최대 힙에서는 힙화 작업이 부모 노드의 키를 자식 노드의 키와 비교하여 수행됩니다. 부모 노드의 키가 자식 노드의 키보다 작으면 키가 교환됩니다. 힙화 작업은 교환된 자식 노드에서 재귀적으로 수행됩니다.

최소 힙에서는 힙화 작업이 부모 노드의 키를 자식 노드의 키와 비교하여 수행됩니다. 부모 노드의 키가 자식 노드의 키보다 크면 키가 교환됩니다. 힙화 작업은 교환된 자식 노드에서 재귀적으로 수행됩니다.

 

힙 데이터 구조의 복잡도

힙 데이터 구조 작업의 시간 복잡도는 힙의 높이에 따라 달라지며, 이는 힙의 요소 수에 대해 로그 규모로 증가합니다. 힙 데이터 구조의 공간 복잡도는 힙의 요소 수에 대해 선형입니다.

배열에서 n개의 요소로 힙을 만드는 시간 복잡도는 바닥-업 힙 구성 알고리즘을 사용하여 O(n)입니다. 힙에 요소를 삽입하는 시간 복잡도는 힙화 작업이 하나 필요하기 때문에 O(log n)입니다. 힙의 루트 노드를 삭제하는 시간 복잡도는 힙화 작업이 하나 필요하기 때문에 O(log n)입니다. 힙의 최대 또는 최소 요소를 찾는 시간 복잡도는 힙의 루트에 위치하기 때문에 O(1)입니다.

 

힙의 장단점

힙 데이터 구조는 대규모 데이터셋을 빠르고 효율적으로 처리하는 데 매우 유용합니다. 또한, 메모리를 적게 사용하여 효율적으로 구현할 수 있습니다. 힙 데이터 구조는 정렬, 우선순위 지정, 그래프 알고리즘이 필요한 응용 프로그램에 매우 유용합니다.

그러나 힙 데이터 구조에는 몇 가지 단점도 있습니다. 주요 단점 중 하나는 검색 작업이 효율적이지 않다는 것입니다. 힙의 요소는 특정 순서로 정렬되지 않기 때문에 특정 요소를 찾는 데 시간이 많이 걸릴 수 있습니다. 또한, 힙 데이터 구조는 동적 크기 조정을 지원하지 않기 때문에 초기 용량보다 큰 데이터셋을 관리하기 어려울 수 있습니다.

반응형