Python [AtoZ] Chapter 05. DFS/BFS

늦깎이 갓생러

Python [AtoZ] Chapter 05. DFS/BFS

Python [AtoZ] Chapter 05. DFS/BFS

티스토리툴바

'PS/Python' Related Articles

티스토리툴바

꼭 필요한 자료구조 기초

탐색 알고리즘 DFS/BFS

실전 문제

기출 문제

꼭 필요한 자료구조 기초

탐색 알고리즘 DFS/BFS

실전 문제

기출 문제

꼭 필요한 자료구조 기초

탐색 알고리즘 DFS/BFS

실전 문제

기출 문제

1. 스택

2. 큐

3. 재귀함수

1. DFS

2. BFS

1. 음료수 얼려 먹기

2. 미로 탈출

'PS > Python' 카테고리의 다른 글

1. 스택

2. 큐

3. 재귀함수

1. DFS

2. BFS

1. 음료수 얼려 먹기

2. 미로 탈출

'PS > Python' 카테고리의 다른 글

1. 스택

2. 큐

3. 재귀함수

1. DFS

2. BFS

1. 음료수 얼려 먹기

2. 미로 탈출

'PS > Python' 카테고리의 다른 글

[ Table of Contents ]

꼭 필요한 자료구조 기초

1. 스택

2. 큐

3. 재귀함수

탐색 알고리즘 DFS/BFS

1. DFS

2. BFS

실전 문제

1. 음료수 얼려 먹기

2. 미로 탈출

기출 문제

1. 특정 거리의 도시 찾기

2. 연구소

3. 경쟁적 전염

4. 괄호 변환

5. 연산자 끼워 넣기

6. 감시 피하기

7. 인구 이동

8. 블록 이동하기

[ Abstract ]

탐색Search이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 의미한다. 프로그래밍에서는 그래프, 트리 등의 자료구조 안에서 탐색을 하는 문제를 자주 다룬다. 대표적인 탐색 알고리즘으로 DFS와 BFS를 꼽을 수 있는데 이 두 알고리즘의 원리를 제대로 이해해야 코딩 테스트의 탐색 문제 유형을 풀 수 있다. 그런데 DFS와 BFS를 제대로 이해하려면 기본 자료구조인 스택과 큐에 대한 이해가 전제가 되어야 한다.

자료구조Data Structure란 데이터를 표현하고 관리하고 처리하기 위한 구조를 의미한다. 그중 스택과 큐는 자료구조의 기초 개념으로 삽입Push와 삭제Pop이란 두 핵심적인 함수로 구성된다.

물론 실제로 스택과 큐를 사용할 때는 삽입과 삭제 외에도 오버플로와 언더플로를 고민해야 한다.

스택Stack은 박스 쌓기에 비유할 수 있다. 스택 구조는 선입후출FILO 또는 후입선출LIFO 구조라 한다.

파이썬에서 스택을 이용할 때에는 별도의 라이브러리를 사용할 필요가 없으며, append()와 pop() 메서드를 이용하면 된다.

큐Queue는 대기 줄에 비유할 수 있다. 큐 구조는 선입선출FIFO 구조라 한다.

파이썬으로 큐를 구현할 때는 collections 모듈에서 제공하는 deque 자료구조를 활용하자. 대부분의 코딩 테스트에서는 collections 모듈과 같은 기본 라이브러리 사용을 허용하므로 안심하고 사용해도 괜찮다. 또한 list(deque)을 하면 리스트 자료형으로 변경 가능하다.

DFS와 BFS를 구현하려면 재귀 함수도 이해하고 있어야 한다. 재귀 함수Recursive Function란 자기 자신을 다시 호출하는 함수를 의미한다. 재귀 함수는 프랙털Fractal 구조와 흡사하다. 대표적인 예로는 시에르핀스키의 삼각형Sierpinski Triangle이 있다.

재귀 함수를 사용할 때는 재귀 함수의 종료 조건을 꼭 명시해야 한다. 종료 조건을 명시하지 않으면 함수가 무한 호출 될 수 있기 때문이다. 따라서 재귀 함수 내에서 특정 조건일 때 더 이상 재귀적으로 함수를 호출하지 않고 종료하도록 if문을 이용하여 꼭 종료 조건을 구현해주어야 한다.

컴퓨터 내부에서 재귀 함수의 수행은 스택 자료구조를 이용한다. 함수를 계속 호출했을 때 가장 마지막에 호출한 함수가 먼저 수행을 끝내야 그 앞의 함수 호출이 종료되기 때문이다. 컴퓨터의 구조 측면에서 보자면 연속해서 호출되는 함수는 메인 메모리의 스택 공간에 적재되므로 재귀 함수는 스택 자료구조와 동일한다는 것만 기억하자. 따라서 스택 자료구조를 활용하는 알고리즘은 재귀 함수를 이용해서 간편하게 구현될 수 있다. DFS가 대표적인 예이다.

재귀 함수를 이용하는 대표적 예로는 팩토리얼Factorial 문제가 있다. 재귀 함수 코드가 간결한 이유는 재귀 함수가 점화식(재귀식)을 그대로 소스코드로 옮겼기 때문이다. 수학에서 점화식은 특정한 함수를 자신보다 더 작은 변수에 대한 함수와의 관계로 표현한 것을 의미한다. 이 개념은 Chap 08. DP 로 이어지기 때문에 중요하다.

#1.반복문을 이용한 n!
def iterative(n):
    result = 1
    for i in range(1, n+1):
        result *= i
    return result
#2.재귀을 이용한 n!
def recursive(n):
    if n <= 1: #n이 1이하인 경우 1을 반환, 재귀 함수에서 종료 조건 구현 필수
        return 1
    return n * recursive(n-1)
print('반복:', iterative(5)) #120
print('재귀:', recursive(5)) #120

프로그래밍 대회에서는 재귀 함수를 스택을 이용한 함수처럼 동작하도록 자동으로 변경해주는 라이브러리를 사용하기도 한다. 이는 파이썬의 재귀 호출 제한을 처리하기 위한 또 다른 테크닉이며, 일반적인 코딩 테스트에서는 사용할 일이 적기 때문에 본 책에서는 다루지 않겠다.

DFS는 Depth-First Search, 깊이 우선 탐색이라고도 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다. 그래프는 노드Node와 간선Edge으로 표현되며 이때 노드를 정점Vertex이라고도 말한다. 그래프 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다. 또한 두 노드가 간선으로 연결되어 있다면 '두 노드는 인접한다Adjacent'라고 표현한다.

프로그래밍에서 그래프는 크게 2가지 방식으로 표현할 수 있는데 코딩 테스트에서는 이 두 방식 모두 필요하니 두 개념에 대해 바르게 알고 있도록 하자.

	0	1	2
0	0	7	5
1	7	0	무한
2	5	무한	0

먼저 인접 행렬Adjacency Matrix 방식은 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식이다. 위와 같이 연결된 그래프를 인접 행렬로 표현할 때 파이썬에서는 2차원 리스트로 구현할 수 있다.

연결 되어 있지 않은 노드끼리는 무한Infinity의 비용이라고 작성한다. 실제 코드에서는 논리적으로 정답이 될 수 없는 큰 값 중에서 999999999, 987654321 등의 값으로 초기화하는 경우가 많다. 이렇게 그래프를 인접 행렬 방식으로 처리할 때는 다음과 같이 데이터를 초기화한다.

#인접 행렬 방식 예제
INF = 999999999 #무한의 비용 선언
graph = [
    [0,7,5],
    [7,0,INF],
    [5,INF,0]
]
print(graph) #[[0, 7, 5], [7, 0, 999999999], [5, 999999999, 0]]

그렇다면 인접 리스트Adjacency List 방식에서는 데이터를 어떤 방식으로 저장할까? 인접 리스트 방식에서는 다음 그림처럼 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다.

인접 리스트는 '연결 리스트'라는 자료구조를 이용해 구현하는데, C++나 Java에서는 별도로 연결 리스트 기능을 위한 표준 라이브러리를 제공한다. 반면에 파이썬은 기본 자료형인 리스트 자료형이 append()와 메소드를 제공하므로, 전통적인 프로그래밍 언어에서의 배열과 연결 리스트의 기능을 모두 기본으로 제공한다. 파이썬으로 인접 리스트를 이용해 그래프를 표현하고자 할 때에도 단순히 2차원 리스트를 이용하면 된다는 점만 기억하자.

#인접 리스트 방식 예제
graph = [[] for _ in range(3)] #행row이 3개인 2차원 리스트로 인접 리스트 표현
#TypeError: list.append() takes exactly one argument (2 given) append()에 튜플(a,b)넣어주어야

graph[0].append((1,7)) #노드0에 연결된 노드 정보 저장(node, edge) : 0에서 1로(간선: 7),
graph[0].append((2,5)) #(1,5)가 아닌 (2,5)임을 유의할 것! : 1에서 2로(간선: 5) 이어지는 정보

graph[1].append((0,7)) #노드1에 연결된 정보
graph[2].append((0,5)) #노드2에 연결된 정보

print(graph) #[[(1, 7), (2, 5)], [(0, 7)], [(0, 5)]]

이 두 방식에는 어떤 차이가 있을까? 코딩 테스트를 위해 학습하는 터라 메모리와 속도 측면에서 살펴보겠다. 메모리 측면에서 보자면 인접 행렬 방식은 모든 관계를 저장하므로 노대 개수가 많을수록 메모리가 불필요하게 낭비된다. 반면에 인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다. 하지만 이와 같은 속성 때문에 인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다. 인접 리스트 방식에서는 연결된 데이터를 하나씩 확인해야 하기 때문이다.

또 다른 예시로 한 그래프에서 노드1과 노드7이 연결되어 있는 상황을 생각해보자. 인접 행렬 방식에서는 graph[1][7]만 확인하면 된다. 반면에 인접 리스트 방식에서는 노드1에 대한 인접 리스트를 앞에서부터 차례대로 확인해야 한다. 그러므로 특정한 노드와 연결된 모든 인접 노드를 순회하는 경우, 인접 리스트 방식이 인접 행렬 방식에 비해 메모리 공간의 낭비가 적다.

DFS는 탐색을 위해서 사용되는 탐색 알고리즘이라고 했는데 구체적으로 어떻게 동작할까? DFS는 스택 자료구조를 이용하며 구체적인 동작 과정은 다음과 같다.

1) 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.

2) 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 놓고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.

3) 2)번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

TIP 방문 처리는 스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것을 의미한다. 방문 처리를 함으로써 각 노드를 한 번씩만 처리할 수 있다.

또한 일반적으로 인접한 노드 중에서 방문하지 않은 노드가 여러 개 있으면 번호가 낮은 순서부터 처리한다.

TIP DFS의 기능을 생각하면 순서와 상관 없이 처리해도 되지만, 코딩 테스트에서는 번호가 낮은 순서부터 처리하도록 명시하는 경우가 종종 있다. 따라서 관행적으로 번호가 낮은 순서부터 처리하도록 구현하는 편이다.

DFS는 스택 자료구조에 기초한다는 점에서 구현이 간단하다. 실제로는 스택을 쓰지 않아도 되며 탐색을 수행함에 있어서 데이터의 개수가 N개인 경우 O(N)의 시간이 소요된다는 특징이 있다. 또한 DFS는 스택을 이용하는 알고리즘이기 때문에 실제 구현은 재귀 함수를 이용했을 때 매우 간결하게 구현할 수 있다.

#DFS 예제
def dfs(graph, v, visited):
    visited[v] = True #현재 노드 방문 처리
    print(v, end=' ')
    for i in graph[v]: #현재 노드와 연결된 다른 노드를 재귀적으로 방문
        if not visited[i]: #인접노드가 방문상태가 아니라면, 재귀함수를 이용해 방문할 수 있다.
            dfs(graph, i, visited)
graph = [ #각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원리스트)
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]
visited = [False] * 9 #각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원리스트)
dfs(graph, 1, visited) #dfs함수 호출 : 1 2 7 6 8 3 4 5

BFS Breadth First Search 알고리즘은 너비 우선 탐색으로, 쉽게 말해 가까운 노드부터 탐색하는 알고리즘이다. BFS는 FIFO 방식인 큐 자료구조를 이용하는 것이 정석이다. 인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행하게 된다.

BFS 동작 방식은 다음과 같다.

1) 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.

2) 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.

3) 2)번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

실제로 구현함에 있어 deque 라이브러리를 사용하는 것이 좋으며 탐색을 수행함에 있어 O(N)의 시간이 소요된다. 일반적인 경우 실제 수행 시간은 DFS보다 좋은 편이다.

TIP 재귀 함수로 DFS를 구현하면 컴퓨터 시스템의 동작 특성상 실제 프로그램의 수행 시간은 느려질 수 있다. 따라서 스택 라이브러리를 이용해 시간 복잡도를 완화하는 테크닉이 필요할 때도 있다.

#BFS 예제
from collections import deque
def bfs(graph, start, visited):
    queue = deque([start]) #큐 구현을 위해 deque라이브러리 사용
    visited[start] = True #현재 노드 방문 처리
    while queue: #큐가 빌때까지 반복
        v = queue.popleft() #큐에서 하나의 원소를 뽑아 출력
        print(v, end=' ')
        for i in graph[v]: #해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
            if not visited[i]:
                queue.append(i)
                visited[i] = True
graph = [ #각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원리스트)
    [],
    [2,3,8],
    [1,7],
    [1,4,5],
    [3,5],
    [3,4],
    [7],
    [2,6,8],
    [1,7]
]
visited = [False] * 9 #각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원리스트)
bfs(graph, 1, visited) #bfs함수 호출 : 1 2 3 8 7 4 5 6

앞서 DFS와 BFS를 설명하는 데 전형적인 그래프 그림을 이용했는데 1차원 배열이나 2차원 배열 또한 그래프 형태로 생각하면 수월하게 문제를 풀 수 있다. 특히나 DFS와 BFS 문제 유형이 그러하다.

[난이도: 중하 / 풀이시간: 30분 / 시간제한: 1초 / 메모리제한: 128MB]

NxM크기의 얼음 틀이 있다. 구멍이 뚫려 있는 부분은 0, 칸막이가 존재하는 부분은 1로 표시된다. 구멍이 뚫려 있는 부분끼리 상, 하, 좌, 우로 붙어 있는 경우 서로 연결되어 있는 것으로 간주한다. 이때 얼음 틀의 모양이 주어졌을 때 생성되는 총 아이스크림의 개수를 구하는 프로그램을 작성하시오. 다음의 4x5 얼음 틀예시에서는 아이스크림이 총 3개가 생성된다.

문제 해설

0이 상하좌우로 연결되어 있는 노드 단위로 묶기 위해서는 DFS를 이용하면 간단히 해결할 수 있다.

1) 특정한 지점의 주변 상하좌우를 살펴본 뒤에 주변 지점 중에서 값이 0이면서 아직 방문하지 않은 지점이 있다면 해당 지점을 방문한다.

2) 방문한 지점에서 다시 상하좌우를 살펴보면서 방문을 다시 진행하면, 연결된 모든 지점을 방문할 수 있다.

3) 1)~2)번의 과정을 모든 노드에 반복하여 방문하지 않은 지점의 수를 센다.

#음료수 얼려 먹기
n, m = map(int, input().split()) #n,m을 공백 구분하여 입력받기
graph = [] #2차원 리스트의 맵 정보 입력받기
for i in range(n): #행이 n개인 2차원 리스트
    graph.append(list(map(int, input())))
def dfs(x,y): #dfs로 특정 노드를 방문한 뒤 연결된 모든 노드들도 방문
    if x<=-1 or x>=n or y<=-1 or y>=m: #주어진 범위를 벗어나는 경우 즉시 종료
        return False
    if graph[x][y] == 0: #현재 노드를 방문하지 않았다면,
        graph[x][y] = 1 #현재 노드 방문 처리
        dfs(x-1,y) #상하좌우 위치 재귀적 호출
        dfs(x,y-1)
        dfs(x+1,y)
        dfs(x,y+1)
        return True
    return False
result = 0 #모든 노드에 대하여 음료수 채우기
for i in range(n):
    for j in range(m):
        if dfs(i,j) == True: #현재 위치에서 DFS 수행
            result += 1
print(result) #정답 출력

[난이도: 중하 / 풀이시간: 30분 / 시간제한: 1초 / 메모리제한: 128MB]

누군가 NxM 크기의 직사각형 형태의 미로에 갇혀 있다. 미로에는 여러 마리의 괴물이 있어 이를 피해 탈출해야 한다. 그 사람의 위치는 (1,1)이고 미로의 출구는 (N,M)의 위치에 존재하며 한 번에 한 칸씩 이동할 수 있다. 이때 괴물이 있는 부분은 0으로, 괴물이 없는 부분은 1로 표시되어 있다. 미로는 반드시 탈출할 수 있는 형태로 제시된다. 이때 남자가 탈출하기 위해 움직여야 하는 최소 칸의 개수를 구하시오. 칸을 셀 때는 시작 칸과 마지막 칸을 모두 포함해서 계신한다.

[입력예시]
5 6
101010
111111
000001
111111
111111

[출력예시]
10

[입력조건]
첫째 줄에 두 정수 N, M(4<=N,M<=200)이 주어진다. 다음 N개의 줄에는 각각 M개의 정수(0 혹은 1)로 미로의 정보가 주어진다. 각각의 수들은 공백 업시 붙어서 입력으로 제시된다. 또한 시작 칸과 마지막 칸은 항상 1이다.

[출력조건]
첫째 줄에 최소 이동 칸의 개수를 출력한다.

문제 해설

BFS는 시작 지점에서 가까운 노드부터 차례대로 그래프의 모든 노드를 탐색하기 때문에, (1,1) 지점에서부터 BFS를 수행하여 모든 노드의 값을 거리 정보로 넣으면 된다. 특정한 노드를 방문하면 그 이전 노드의 거리에 1을 더한 값을 리스트에 넣는다.

참고로 소스코드 상에서, 첫 번째 시작 위치는 다시 방문할 수 있도록 되어 첫 번째 시작 위치에 해당하는 값이 3으로 변경될 여지가 있다. 하지만, 본 문제에서는 단순히 가장 오른쪽 아래 위치로 이동하는 것을 요구하고 있기 때문에, 가장 간결한 정답 코드이다.

#미로 탈출
from collections import deque
n,m = map(int, input().split())
graph = []
for i in range(n):
    graph.append(list(map(int, input())))
dx = [-1,1,0,0] #이동할 네 방항 정의 [상,하,좌,우]
dy = [0,0,-1,1]
def bfs(x,y):
    queue = deque() #큐 구현을 위해 deque라이브러리 사용
    queue.append((x,y))
    while queue: #큐가 빌때까지 반복
        x,y = queue.popleft()
        for i in range(4): #현재 위치에서 4방향으로의 위치 확인
            nx = x + dx[i]
            ny = y + dy[i]
            if nx<0 or ny<0 or nx>=n or ny>=m: #미로 찾기 공간을 벗아나면 무시
                continue
            if graph[nx][ny] == 0: #벽은 무시
                continue
            if graph[nx][ny] == 1: #해당 노드를 처음 방문하는 경우에만 최단 거리 기록
                graph[nx][ny] = graph[x][y] + 1 #바로 직전노드graph[x][y] 위치에서의 최단거리값에 +1을 더한 값을 넣어줌
                queue.append((nx,ny))
    return graph[n-1][m-1] #가장 오른쪽 아래까지의 최단 거리 반환
print(bfs(0,0)) #bfs결과 출력

1. 특정 거리의 도시 찾기

2. 연구소

3. 경쟁적 전염

4. 괄호 변환

5. 연산자 끼워 넣기

6. 감시 피하기

7. 인구 이동

8. 블록 이동하기

이 글은 자습 목적을 위해 <이것이 취업을 위한 코딩 테스트다 with 파이썬>을 99.99% 참고하여 만들었다.

Python [AtoZ] Chapter 07. 이진탐색 (2)	2024.11.25
Python [AtoZ] Chapter 06. 정렬 (3)	2024.11.08
Python [AtoZ] Chapter 04. 구현 (1)	2024.09.16
Python [AtoZ] Chapter 03. 그리디 (1)	2024.09.15
Python [AtoZ] Chapter 01. 기본문법 및 복잡도 총정리 (4)	2024.09.14

[예시]
00110
00011
11111
00000

[입력조건]
1. 첫 번째 줄에 얼음 틀의 세로 길이 N과 가로 길이 M이 주어진다.
2. 두 번째 줄부터 N+1 번째 줄까지 얼음 틀의 형태가 주어진다.
3. 이때 구멍이 뚫려 있는 부분은 0, 그렇지 않은 부분은 1이다.

[출력조건]
한 번에 만들 수 있는 아이스크림의 개수를 출력한다.