7. 최단 경로 알고리즘 - 다익스트라(Dijkstra)

728x90

최단 경로

  • 최단 경로 알고리즘은 가장 짧은 경로를 찾는 알고리즘을 의미한다.
  • 다양한 문제 상황
    • 한 지점에서 다른 한 지점까지의 최단 경로
    • 한 지점에서 다른 모든 지점까지의 최단 경로
    • 모든 지점에서 다른 모든 지점까지의 최단 경로
  • 각 지점은 그래프에서 노드로 표현
    • 각 노드는 문제상황에 따라 국가, 도시, 마을 등으로 다르게 정의될 수 있다.
  • 지점 간 연결된 도로는 그래프에서 간선으로 표현

image

다익스트라 최단 경로 알고리즘

  • 특정한 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산한다.
  • 다익스트라 최단 경로 알고리즘은 음의 간선이 없을 때 정상적으로 동작한다.
    • 현실 세계의 도로(간선)은 음의 간선으로 표현되지 않는다.
  • 다익스트라 최단 경로 알고리즘은 그리디 알고리즘으로 분류된다.
    • 매 상황에서 가장 비용이 적은 노드를 선택해 임의의 과정을 반복한다.

기본적으로 최단경로 문제는 DP 알고리즘으로 분류되기도 한다.

다익스트라 알고리즘 동작 과정

  1. 출발 노드를 설정한다.
  2. 최단 거리 테이블을 초기화한다.
    • 자기자신으로 가는 경로는 0, 다른 노드로 가는 경로는 무한으로 설정한다.
  3. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
    • 그리디 알고리즘이라고 불리는 이유!
  4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
  5. 위 과정에서 3번과 4번을 반복한다.
  • 알고리즘 동작과정에서 최단 거리 테이블은 각 노드에 대한 현재까지의 최단 거리 정보를 가지고 있다.
  • 처리 과정에서 더 짧은 경로를 찾으면 '이제부터는 이 경로가 제일 짧은 경로야'라고 갱신한다.

image

)

image

  • [초기 상태] 그래프를 준비하고 출발 노드를 설정한다.
  • 출발* : 1번 노드

image

  • [Step 1] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드인 1번 노드를 처리한다.
    (Step1 이미지)
  • [Step 2] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드인 4번 노드를 처리한다.
    (Step2 이미지)
  • [Step 3] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드인 2번 노드를 처리한다.
    • 2번과 5번의 최단 거리가 같기 때문에 둘 중 어느 것을 먼저 선택하던지 상관없지만, 일반적으로 노드 번호가 작은 것을 먼저 선택한다.
  • 이미 방문한 노드라면 무시하는 방법을 사용할 수도 있다.
    • 이미 방문한 노드는 그 노드까지의 최단거리가 이미 결정이되어 바뀌지 않기 때문이다.
  • [Step 4] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드인 5번 노드를 처리한다.
  • [Step 5] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드인 3번 노드를 처리한다.
  • [Step 6] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드인 6번 노드를 처리한다.
    • 사실 마지막 노드는 처리하지 않아도 괜찮다.

다익스트라 알고리즘의 특성

  • 그리디 알고리즘: 매 상황에서 방문하지 않은 가장 비용이 적은 노드를 선택해 임의의 과정을 반복한다.
  • 단계를 거치며 한 번 처리된 노드의 최단 거리는 고정되어 더 이상 바뀌지 않는다.
    • **한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있다.
  • 다익스트라 알고리즘을 수행한 뒤에 테이블에 각 노드까지의 최단 거리 정보가 저장된다.
    • 완벽한 형태의 최단 경로를 구하려면 소스코드에 추가적인 기능을 더 넣어야 한다.

다익스트라 알고리즘: 간단한 구현 방법

  • 단계마다 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 매 단계마다 1차원 테이블의 모든 원소를 확인(순차 탐색)한다.
package shortest_path_finder;

import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.Scanner;

public class SimpleDijkstra {

    private static final int INF = (int) 1e9; // 무한을 의미하는 값으로 10억을 설정

    // 노드의 개수(N), 간선의 개수(M), 시작 노드 번호(Start)
    // 노드의 개수는 최대 100,000개라고 지정
    private static int n, m, start;
    // 각 노드에 연결되어 있는 노드에 대한 정보를 담는 배열
    private static List<List<Node>> graph = new ArrayList<>();

    // 방문한 적이 있는지 체크하는 목적의 배열 만들기
    private static boolean[] visited = new boolean[100001];

    // 최단 거리 테이블 만들기
    private static int[] d = new int[1000001];


    // 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
    public static int getSmallestNode() {
        int minValue = INF;
        int index = 0; // 가장 최단 거리가 짧은 노드(인덱스)
        for (int i = 1; i <= n; i++) {
            if (d[i] < minValue && !visited[i]) {
                minValue = d[i];
                index = i;
            }
        }
        return index;
    }

    public static void dijkstra(int start) {
        // 시작 노드에 대해서 초기화
        d[start] = 0;
        visited[start] = true;
        for (int i = 0; i < graph.get(start).size(); i++) {
            d[graph.get(start).get(i).getIndex()] = graph.get(start).get(i).getDistance();
        }

        // 시작 노드를 제외한 전체 n - 1개의 노드에 대해 반복
        for (int i = 0; i < n - 1; i++) {
            // 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
            int now = getSmallestNode();
            visited[now] = true;
            // 현재 노드와 연결된 다른 노드를 확인
            for (int j = 0; j < graph.get(now).size(); j++) {
                int cost = d[now] + graph.get(now).get(j).getDistance();
                // 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
                if (cost < d[graph.get(now).get(j).getIndex()]) {
                    d[graph.get(now).get(j).getIndex()] = cost;
                }

            }
        }
    }

    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);
        n = sc.nextInt();
        m = sc.nextInt();
        start = sc.nextInt();


        // 그래프 초기화
        for (int i = 0; i <= n; i++) {
            graph.add(new ArrayList<>());
        }

        // 모든 간선 정보를 입력받기
        for (int i = 0; i < m; i++) {
            int a = sc.nextInt();
            int b = sc.nextInt();
            int c = sc.nextInt();
            // a번 노드에서 b번 노드로 가는 비용이 c라는 의미
            graph.get(a).add(new Node(b, c));
        }

        // 최단 거리 테이블을 모두 무한으로 초기화
        Arrays.fill(d, INF);

        // 다익스트라 알고리즘을 수행
        dijkstra(start);

        // 모든 노드로 가기 위한 최단 거리를 출력
        for (int i = 1; i <= n; i++) {
            // 도달할 수 없는 경우, 무한(INFINITY)라고 출력
            if (d[i] == INF) {
                System.out.println("INFINITY");
                continue;
            }

            System.out.println(d[i]);
        }
    }

    public static class Node {

        private final int index;
        private final int distance;

        public Node(int index, int distance) {
            this.index = index;
            this.distance = distance;
        }

        public int getIndex() {
            return index;
        }

        public int getDistance() {
            return distance;
        }
    }

}

간단한 구현 방법 성능 분석

  • O(V)번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색해야 한다.
  • 따라서 전체 시간 복잡도는 O(V^2)이다.
  • 일반적으로 코딩 테스트의 최단 경로 문제에서 전체 노드의 개수가 5,000개 이하라면 이 코드로 문제를 해결할 수도 있다.
    • 하지만 노드의 개수가 10,000개를 넘어가는 문제라면 어떻게 해야할까?
    • 이 경우에는 시간초과 판정을 받을 수 있다.
    • 더 효율적으로 동작하는 알고리즘을 설계해야한다.

우선순위 큐(Priority Queue)를 사용하여 최적화한다.

우선순위 큐란...?

  • 우선순위가 가장 높은 데이터를 가장 먼제 삭제하는 자료구조이다.
  • Python, C++, Java를 포함한 대부분의 프로그래밍 언어에서 표준 라이브러리 형태로 지원한다.

힙(Heap)

  • 우선순위 큐를 구현하기 위해 사용하는 자료구조 중 하나이다.
  • 최소 힙(Min Heap)최대 힙(Max Heap)이 있다.
  • 다익스트라 최단 경로 알고리즘을 포함해 다양한 알고리즘에서 사용된다.
우선순위 큐 구현 방식 삽입 시간 삭제 시간
리스트 O(1) O(N)
힙(Heap) O(logN) O(logN)

다익스트라 알고리즘: 개선된 구현 방법

  • 단계마다 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 힙(Heap) 자료구조를 이용한다.
  • 다익스트라 알고리즘이 동작하는 기본 원리는 동일하다.
    • 현재 가장 가까운 노드를 저장해 놓기 위해서 힙 자료구조를 추가적으로 이용한다는 점이 다르다.
    • 현재의 최단 거리가 가장 짧은 노드를 선택해야 하므로 최소 힙을 사용한다.

다익스트라 알고리즘: 도작과정 살펴보기 (우선순위 큐)

  • [초기 상태] 그래프를 준비하고 출발 노드를 설정하여 우선순위 큐에 삽입한다.
  • [Step 1] 우선순위 큐에서 원소를 꺼낸다. 1번 노드는 아직 방문하지 않았으므로 이를 처리한다.
  • [Step 2] 우선순위 큐에서 원소를 꺼낸다. 4번 노드는 아직 방문하지 않았으므로 이를 처리한다.
  • [Step 3] 우선순위 큐에서 원소를 꺼낸다. 2번 노드는 아직 방문하지 않았으므로 이를 처리한다.
  • [Step 4] 우선순위 큐에서 원소를 꺼낸다. 5번 노드는 아직 방문하지 않았으므로 이를 처리한다.
  • [Step 5] 우선순위 큐에서 원소를 꺼낸다. 3번 노드는 아직 방문하지 않았으므로 이를 처리한다.
  • [Step 6] 우선순위 큐에서 원소를 꺼낸다. 3번 노드는 이미 방문했으므로 무시한다.
  • [Step 7] 우선순위 큐에서 원소를 꺼낸다. 6번 노드는 이미 방문했으므로 무시한다.
  • [Step 8] 우선순위 큐에서 원소를 꺼낸다. 3번 노드는 이미 방문했으므로 무시한다.

다익스트라 알고리즘: 개선된 구현 방법

public class ImprovedDijkstra {

    private static final int INF = (int) 1e9; // 무한을 의미하는 10억을 설정

    // 노드의 개수(N), 간선의 개수(M), 시작 노드 번호(Start)
    private static int n, m, start;

    // 각 노드에 연결되어 있는 노드에 대한 정보를 담는 배열
    private static List<List<Node>> graph = new ArrayList<>();

    // 최단 거리 테이블 만들기
    private static int[] d = new int[100001];

    public static void dijkstra(int start) {
        Queue<Node> pq = new PriorityQueue<>();
        //시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
        pq.offer(new Node(start, 0));
        d[start] = 0;
        while (!pq.isEmpty()) { // 큐가 비지 않았다면
            //가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
            Node node = pq.poll();
            int distance = node.getDistance(); // 현재 노드까지의 비용
            int now = node.getIndex(); // 현재 노드

            // 현재 노드가 이미 처리된 적이 있는 노드라면 무시
            if (d[now] < distance) {
                continue;
            }

            // 현재 노드와 연결된 다른 인접한 노드들을 확인
            for (int i = 0; i < graph.get(now).size(); i++) {
                int cost = d[now] + graph.get(now).get(i).getDistance();
                // 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
                if (cost < d[graph.get(now).get(i).getIndex()]) {
                    d[graph.get(now).get(i).getIndex()] = cost;
                    pq.offer(new Node(graph.get(now).get(i).getIndex(), cost));
                }
            }
        }
    }

    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);

        n = sc.nextInt();
        m = sc.nextInt();
        start = sc.nextInt();

        // 그래프 초기화
        for (int i = 0; i <= n; i++) {
            graph.add(new ArrayList<>());
        }

        // 모든 간선 정보를 입력받기
        for (int i = 0; i < m; i++) {
            int a = sc.nextInt();
            int b = sc.nextInt();
            int c = sc.nextInt();
            // a번 노드에서 b번 노드로 가는 비용이 c라는 의미
            graph.get(a).add(new Node(b, c));
        }

        // 최단 거리 테이블을 모두 무한으로 초기화
        Arrays.fill(d, INF);

        // 다익스트라 알고리즘을 수행
        dijkstra(start);

        // 모든 노드로 가기 위한 최단 거리를 출력
        for (int i = 1; i <= n ; i++) {
            if (d[i] == INF) {
                System.out.println("INFINITY");
                continue;
            }

            System.out.println(d[i]);
        }
    }

    public static class Node implements Comparable<Node> {

        private int index;
        private int distance;

        public Node(int index, int distance) {
            this.index = index;
            this.distance = distance;
        }

        public int getIndex() {
            return this.index;
        }

        public int getDistance() {
            return this.distance;
        }

        // 거리(비용)가 짧은 것이 높은 우선순위를 가지도록 설정
        @Override
        public int compareTo(Node other) {
            if (this.distance < other.distance) {
                return -1;
            }
            return 1;
        }
    }

}

참고로 동빈님 강의에서는 python의 heap 라이브러리를 예시로 드는데, 라이브러리는 최소힙만 제공하기 때문에 최대힙을 구하기 위해서는 value를 -(음수)로 넣어서 최소힙으 일단 구한 뒤, 값을 꺼낼 때는 다시 양수로 변경하라고 한다. 자바는 아래와 같이 Comparator.reverseOrder()를 파라미터로 넣어서, 우선순위가 높은 순서대로 정렬할 수 있다. 추측해보자면... 최대힙으로도 사용할 수 있지 않을까?

Queue<Node> pq = new PriorityQueue<>(Comparator.reverseOrder());

개선된 구현 방법 성능 분석

  • 힙 자료구조를 이용하는 다익스트라 알고리즘의 시간 복잡도는 O(ElogV)이다.
  • 노드를 하나씩 꺼내 검사하는 반복문(While문)은 노드의 개수 V 이상의 횟수로는 처리되지 않는다.
    • 결과적으로 현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인하는 총횟수는 최대 간선의 개수(E)만큼 연산이 수행될 수 있다.
  • 직관적으로 전체 과정은 E개의 원소를 우선순위 큐에 넣었다가 모두 빼내는 연산과 매우 유사하다.
    • 시간 복잡도는 O(ElogE)로 판단할 수 있다.
    • 중복 간선을 포함하지 않는 경우에 이를 O(ElogV)로 정리할 수 있다.
      • O(ElogE) -> O(ElogV^2) -> O(2ElogV) -> O(ElogV)

 

todo: 이미지 추가하기! 

728x90