[자료구조] 정렬

728x90

1. 정렬 라이브러리로 풀 수 있는 문제 : 단순히 정렬 기법을 알고있는지 물어보는 문제
2. 정렬 알고리즘의 원리에 대해서 물어보는 문제 : 선택 정렬, 삽입 정렬, 퀵 정렬 등의 원리를 알고 있어야 함
3. 더 빠른 정렬이 필요한 문제 : 계수 정렬 등 다른 알고리즘을 이용하거나 구조적인 개선을 거쳐야 풀 수 있는 문제

1️⃣ 정렬

• 데이터를 특정한 기준에 따라서 순서대로 나열하는 것

• 데이터를 정렬하면 이진탐색이 가능해진다.

• 선택정렬, 삽입 정렬, 퀵정렬, 계수정렬

• 알고리즘 효율성과 관련되어 있음

※ 책에서는 모두 오름차순 정렬을 기준으로 설명한다. 내림차순은 오름차순 결과에서 인덱스 Reverse 해서 출력하면 된다.

2️⃣ 선택정렬

• 원시적인 방법으로 매번 가장 작은 것을 선택하는 방식

• 인덱스 접근 , 모든 pair 비교

• 시간 복잡도 : O(N^2) , 다소 비효율적이다.

array = [7,5,9,0,3,1,6,2,4,8] 

for i in range(len(array)) : 
	min_index = i  
    for j in range(i+1, len(array)) : 
    	if array[min_index] > array[j] : 
        	min_index = j 
    array[i], array[min_index] = array[min_index], array[i]

↪ 차례대로 인덱스를 순회하면서, 기준 인덱스와 나머지 인덱스에 해당하는 실제 값을 비교하면서, 최소값에 해당하는 인덱스를 할당한다. 가장 작은 값을 최종적으로 나서 값을 실제로 스와프 한다.

3️⃣ 삽입정렬

• 삽입정렬은 필요할 때만 위치를 바꾸기 때문에 데이터가 거의 정렬되어 있을 때 훨씬 효율적이다.

• 특정한 데이터가 적절한 위치에 들어가기 전에 그 앞까지의 데이터는 이미 정렬되어 있다고 가정한다. 정렬되어 있는 데이터 리스트에서 적절한 위치를 찾은 뒤 그 위치에 삽입된다는 것이 특징이다. 정렬이 이루어진 원소는 항상 오름차순을 유지한다.

• 삽입정렬은 두번째 데이터부터 시작한다. 첫번째 데이터는 그 자체로 정렬되어 있다고 판단하기 때문이다.

• 시간 복잡도 : O(N^2) , 다만 어느정도 정렬되어 있는 상태라면 퀵정렬 알고리즘보다 더 강력하다.

array = [7,5,9,0,3,1,6,2,4,8] 

for i in range(1, len(array)) : 
	for j in range(i,0,-1) : # 인덱스 i 부터 1까지 감소하며 반복하는 문법 🟡
    	if array[j] < array[j-1] : # 한칸씩 왼쪽으로 이동 
        	array[j], array[j-1] = array[j-1], array[j] 
        else : # 자기보다 작은 데이터를 만나면 그 위치에서 멈춤 🟡
        	break

↪ range(i,0,-1) : i 부터 0까지 1씩 감소. 가령 range(5, 0, -1)은 5, 4, 3, 2, 1과 같은 숫자를 생성

4️⃣ 퀵 정렬

• 기준을 설정한 다음 큰 수와 작은 수를 교환한 후 리스트를 반으로 나누는 방식으로 동작

• 기준을 "pivot" 피벗이라 한다. 피벗을 어떻게 설정하느냐에 따라 퀵 정렬 방식이 여러가지인데, 책에서는 호어 분할 방식을 다룬다.

(1) 리스트에서 첫번째 데이터를 피벗으로 정한다. (호어 분할 방식)

(2) 피벗을 설정한 뒤에는 왼쪽에서부터 피벗보다 큰 데이터를 찾고 오른쪽에서부터 피벗보다 작은 데이터를 찾는다. 그 다음 큰 데이터와 작은 데이터의 위치를 서로 교환한다. left, right

(3) 찾는 값의 위치가 엇갈린 경우 (왼쪽에 작은 데이터, 오른쪽에 큰 데이터) 에는 작은 데이터와 피벗의 위치를 서로 변경한다.

(4) 분할이 완료되면, 피벗이 이동한 상태에서 왼쪽에는 모두 피벗보다 작고, 오른쪽에는 피벗보다 큰 데이터가 위치하게 된다.

(5) 이후 왼쪽, 오른쪽 각각에 대해 피벗을 설정해 동일한 방식으로 정렬을 수행한다. 재귀함수 원리와 같다. 퀵정렬이 끝나는 조건은 현재 리스트의 데이터 개수가 1개인 경우다.

• 원리 이해 버전

array = [5,7,9,0,3,1,6,2,4,8]

def quick_sort(array, start, end) : 
  if start >= end : # 원소가 1개인 경우 종료 
    return 
  
  # 🟡
  pivot = start # 맨 첫번째 원소가 피벗 (호어 분할) 
  left = start + 1 
  right = end 

  while left <= right : 
    # 피벗보다 큰 데이터를 찾을 때까지 왼쪽 방향이 오른쪽으로 이동 
    while left <= end and array[left] <= array[pivot] : 
      left += 1 
    # 피벗보다 작은 데이터를 찾을 때까지 오른쪽 방향이 왼쪽으로 이동 
    while right > start and array[right] >= array[pivot] : 
      right -= 1 
    
    # 엇갈렸다면 피벗과 작은 데이터를 교체 
    if left > right : 
      array[right], array[pivot] = array[pivot], array[right]
    # 엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체 
    else : 
      array[left], array[right] = array[right], array[left] 
    
  # 분할 이후 왼쪽과 오른쪽 부분에서 각자 정렬 수행 
  quick_sort(array, start, right-1)
  quick_sort(array, right+1, end)
  

quick_sort(array, 0, len(array)-1)
print(array)

• 간단 버전

array = [5,7,9,0,3,1,6,2,4,8]

def quick_sort(array) : 
  # 리스트가 하나 이하의 원소를 담고 있다면 종료 
  if len(array) <= 1 : 
    return array
  
  # 피벗과 피벗을 제외한 리스트
  pivot = array[0] # 첫번째 원소 
  tail = array[1:] 

  # 분할된 왼쪽 부분 
  left_side = [x for x in tail if x <= pivot]  # pivot 보다 작은 값들 
  print(left_side)

  # 분할된 오른쪽 부분 
  right_side = [x for x in tail if x > pivot] # pivot 보다 큰 값들 
  print(right_side)

  # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각자 정렬을 수행, 전체 리스트 반환 
  return quick_sort(left_side) + [pivot] + quick_sort(right_side)  # 🟡
  
  
print(quick_sort(array))

• 시간 복잡도 : O(NlogN)

↪ 그러나 최악의 경우는 O(N^2) 이다. 데이터가 무작위로 입력되는 경우 퀵정렬은 빠르게 동작할 확률이 높으나, 리스트의 가장 왼쪽 데이터를 피벗으로 삼게되면 '이미 데이터가 정렬되어 있는 경우' 에는 매우 느리게 동작한다.

5️⃣ 계수 정렬

• 특정 조건이 부합할 때만 사용할 수 있지만 매우 빠른 정렬 알고리즘

• 데이터 개수가 N, 최대값이 K 일 때, 계수정렬은 최악의 경우에도 수행시간 O(N+K) 를 보장한다.

• 계수정렬은 '데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때' 만 사용할 수 있다. 가장 큰 데이터와 가장 작은 데이터 차이가 1,000,000 을 넘지 않을 때 효과적으로 사용할 수 있다.

• 계수정렬은 비교 기반의 정렬 알고리즘이 아니다.

(1) 가장 큰 데이터와 가장 작은 데이터의 범위가 모두 담길 수 있도록 하나의 리스트를 생성한다. 리스트의 인덱스가 값의 범위를 모두 포함할 수 있도록 생성한다. 가령 가장 작은 값이 0이고 큰 값이 9이면 0부터 9까지 정수 인덱스 차례로 리스트를 생성한다.

(2) 데이터를 하나씩 확인하며 데이터의 값과 동일한 인덱스의 데이터를 1씩 증가시키면 정렬이 완료된다.

(3) 결과적으로 리스트에는 각 데이터가 몇 번 등장했는지 그 횟수가 기록된다.

(4) 정렬된 데이터를 확인하고 싶다면 리스트의 첫 번째 데이터부터 하나씩 그 값 만큼 인덱스를 출력하면 된다.

# 모든 원소의 값이 0보다 크거나 같다고 가정 
array = [7,5,9,0,3,1,6,2,9,1,4,8,0,5,2] 

# 모든 범위를 포함하는 리스트 선언 (모든 값은 0으로 초기화)
count = [0] * (max(array) + 1) 

for i in range(len(array)) : 
  count[array[i]] += 1 # 각 데이터에 해당하는 인덱스 값 증가 

for i in range(len(count)) : # 리스트에 기록된 정렬 정보 확인 
  for j in range(count[i]) : 
    print(i, end=' ') # 띄어쓰기 구분으로 등장한 횟수 만큼 인덱스 출력

• 계수 정렬의 시간 복잡도는 데이터 범위만 한정되어 있다면 효과적이나, 때에 따라 공간 복잡도에서 심각한 비효율성을 초래할 수 있다. 데이터가 0 과 999,999 단 2개만 존재한다면 이럴 때에도 리스트 크기가 100만개가 되도록 선언해야 한다.

• 동일한 값을 가지는 데이턱 여러 개 등장할 때 적합하다.

6️⃣ 파이썬 정렬 알고리즘

• sorted() : 퀵 정렬과 동작 방식이 비슷한 병합 정렬을 기반으로 만들어졌다. 최악의 경우에도 시간 복잡도 O(NlogN) 을 보장한다.

sorted(array)

• sort() : 리스트를 바로 정렬하는 메소드

array.sort()

• key 매개변수 : key 값으로는 하나의 함수가 들어가야 하며 이는 정렬 기준이 된다.

연습문제 + 코드

• 정수 리스트 입력 받기

n = int(input()) # n 입력 받기 

# N 개의 정수를 입력받아 리스트에 저장 
array = [] 

for i in range(n) : 
  array.append(int(input()))

• (key, value) 형식으로 리스트 입력 받기

n = int(input())  # 2 

array = []

for i in range(n) : 
  input_data = input().split() 
  array.append((input_data[0], int(input_data[1])))

• 숫자 리스트 만들기

a = list(map(int, input().split())) 
b = list(map(int, input().split())) # 숫자 리스트 만드는 방법

728x90

'2️⃣ Study > ⚙ 알고리즘' 카테고리의 다른 글

[자료구조] 이진탐색 (1)	2024.04.04
[자료구조] DFS/BFS (0)	2022.09.02
[자료구조] 구현 (1)	2022.09.02
[자료구조] 그리디 (0)	2022.09.02
[자료구조] 필수 파이썬 문법 - 조건문, 반복문, 함수, 입출력, 라이브러리 (0)	2022.09.02

Getting better

[자료구조] 정렬

1️⃣ 정렬

2️⃣ 선택정렬

3️⃣ 삽입정렬

4️⃣ 퀵 정렬

5️⃣ 계수 정렬

6️⃣ 파이썬 정렬 알고리즘

연습문제 + 코드

'2️⃣ Study > ⚙ 알고리즘' 카테고리의 다른 글

댓글

티스토리툴바

[자료구조] 정렬

1️⃣ 정렬

2️⃣ 선택정렬

3️⃣ 삽입정렬

4️⃣ 퀵 정렬

5️⃣ 계수 정렬

6️⃣ 파이썬 정렬 알고리즘

연습문제 + 코드

'2️⃣ Study > ⚙ 알고리즘' 카테고리의 다른 글

관련글

댓글

티스토리툴바