스레드와 동기화 (Thread)

이해하기 쉽고, 장황하지 않은 자료를 기반으로 강의를 진행합니다.
잔재미코딩 소식 공유
좀더 제약없이, IT 컨텐츠를 공유하고자, 자체 온라인 사이트와, 다음 두 채널도 오픈하였습니다
응원해주시면, 곧 좋은 컨텐츠를 만들어서 공유하겠습니다
●  잔재미코딩 뉴스레터 오픈 [구독해보기]
●  잔재미코딩 유투브 오픈 [구독해보기]

8. 스레드와 동기화

Thread (스레드)

  • Light Weight Process 라고도 함
  • 프로세스
    • 프로세스 간에는 각 프로세스의 데이터 접근이 불가
  • 스레드
    • 하나의 프로세스에 여러개의 스레드 생성 가능
    • 스레드들은 동시에 실행 가능
    • 프로세스 안에 있으므로, 프로세스의 데이터를 모두 접근 가능

Thread는 각기 실행이 가능한 stack 존재

Process VS Thread

OS.xlsx -> Thread


Multi Thread (멀티 스레드)

  • 소프트웨어 병행 작업 처리를 위해 Multi Thread를 사용함

멀티 프로세싱과 Thread

  • 멀티 태스킹과 멀티 프로세싱

  • 출처: http://donghoson.tistory.com/15

  • 최근 CPU는 멀티 코어를 가지므로, Thread를 여러 개 만들어, 멀티 코어를 활용도를 높임


멀티 프로세스와 멀티 태스킹


Thread 장점1

  1. 사용자에 대한 응답성 향상

Thread 장점2

  1. 자원 공유 효율
    • IPC 기법과 같이 프로세스간 자원 공유를 위해 번거로운 작업이 필요 없음
    • 프로세스 안에 있으므로, 프로세스의 데이터를 모두 접근 가능

Thread 장점3

  1. 작업이 분리되어 코드가 간결
    • 사실 작성하기 나름

Thread 단점

  • 스레드 중 한 스레드만 문제가 있어도, 전체 프로세스가 영향을 받음

  • 멀티 프로세스

  • 멀티 스레드


Thread 단점

  • 스레드를 많이 생성하면, Context Switching이 많이 일어나, 성능 저하

  • 예: 리눅스 OS에서는 Thread를 Process와 같이 다룸

    • 스레드를 많이 생성하면, 모든 스레드를 스케쥴링해야 하므로, Context Switching이 빈번할 수 밖에 없음

Thread vs Process

  • 프로세스는 독립적, 스레드는 프로세스의 서브셋
  • 프로세스는 각각 독립적인 자원을 가짐, 스레드는 프로세스 자원 공유
  • 프로세스는 자신만의 주소영역을 가짐, 스레드는 주소영역 공유
  • 프로세스간에는 IPC 기법으로 통신해야 함, 스레드는 필요 없음

PThread

  • POSIX 스레드(POSIX Threads, 약어: PThread)
    • Thread 관련 표준 API

정리

  • Thread 개념 정리
    • 프로세스와 달리 스레드간 자원 공유
  • 스레드 장점
    • CPU 활용도를 높이고,
    • 성능 개선 가능
    • 응답성 향상
    • 자원 공유 효율 (IPC를 안써도 됨)
  • 스레드 단점
    • 하나의 스레드 문제가, 프로세스 전반에 영향을 미침
    • 여러 스레드 생성시 성능 저하 가능

동기화(Synchronization)


여기서 잠깐!

스레드 너무 좋아하세요 사실 별거 아닙니다. 하지만 스레드 관리가 힘들어요. 개념/원리를 이해해놓으면, 사용하다 문제가 생겼을 때, 어떤 부분이 잘못될 수 있는지, 왜 특별한 함수들을 사용하는지를 이해할 수 있습니다.


동기화(Synchronization) 이슈

  • 동기화: 작업들 사이에 실행 시기를 맞추는 것
  • 여러 스레드가 동일한 자원(데이터) 접근시 동기화 이슈 발생
    • 동일 자원을 여러 스레드가 동시 수정시, 각 스레드 결과에 영향을 줌

동기화(Synchronization) 이슈 예제

  • 컴퓨터 구조, 파이썬과 함께 복습

python_mutual_exclusion OS.xlsx -> Thread Synchronization


동기화 이슈 해결 방안

  • Mutual exclusion (상호 배제)

  • 쓰레드는 프로세스 모든 데이터를 접근할 수 있으므로,

    • 여러 스레드가 변경하는 공유 변수에 대해 Exclusive Access 필요
    • 어느 한 스레드가 공유 변수를 갱신하는 동안 다른 스레그가 동시 접근하지 못하도록 막아라

Mutual exclusion (상호 배제)

  • 임계 자원(critical resource)
  • 임계 영역(critical section)
lock.acquire()           
    for i in range(100000):
        g_count += 1
    lock.release()

동기화 이슈 해결 예제

python_mutual_exclusion.ipynb

동기화(Synchronization)와 세마포어


Mutex와 세마포어 (Semaphore)

  • Critical Section(임계 구역)에 대한 접근을 막기 위해 LOCKING 메커니즘이 필요
    • Mutex(binary semaphore) : 임계구역에 하나의 스레드만 들어갈 수 있음
    • Semaphore : 임계구역에 여러 스레드가 들어갈 수 있음 : counter를 두어서 동시에 리소스에 접근 할 수 있는 허용 가능한 스레드 수를 제어

세마포어 (Semaphore)

  • P: 검사 (임계영역에 들어갈 때)
    • S값이 1 이상이면, 임계 영역 진입 후, S값 1 차감 (S값이 0이면 대기)
  • V: 증가 (임계영역에서 나올 때)
    • S값을 1 더하고, 임계 영역을 나옴
  • S: 세마포어 값 (초기 값만큼 여러 프로세스가 동시 임계 영역 접근 가능)
P(S): wait(S) {
        while S <= 0  // 대기
            ;
        S--;    // 다른 프로세스 접근 제한
      }
V(S): signal(S) {
        S++;    // 다른 프로세스 접근 허용
      }

세마포어 (Semaphore) - 바쁜 대기

  • wait() 은 S가 0이라면, 임계영역에 들어가기 위해, 반복문 수행
    • 바쁜 대기, busy waiting
      P(S): wait(S) {
          while S <= 0 // 바쁜 대기
              ;
          S--;    // 다른 프로세스 접근 제한
        }
      

여기서 잠깐

  • 프로그래밍은 근본적으로는 중단이 없음. 끊임없이 코드 실행
    • 중단은 대부분 loop로 표현
    • loop는 CPU에 부하를 걸리게 함

세마포어 (Semaphore) - 대기큐

운영체제 기술로 보완 - 대기큐

  • S가 음수일 경우, 바쁜 대기 대신, 대기큐에 넣는다.
wait(S) {
    S->count--;
    if (S->count < 0) {
        add this process to S->queue;
        block()
    }
}

세마포어 (Semaphore)

  • wakeup() 함수를 통해 대기큐에 있는 프로세스 재실행
    signal(S) {
      S->count++;
      if (S->count <= 0) {
          remove a process P from S->queue;
          wakeup(P)
      }
    }
    

참고: 주요 세마포어 함수 (POSIX 세마포어)

  • sem_open(): 세마포어를 생성

  • sem_wait(): 임계영역 접근 전, 세마포어를 잠그고, 세마포어가 잠겨있다면, 풀릴 때까지 대기

  • sem_post(): 공유자원에 대한 접근이 끝났을 때 세마포어 잠금을 해제한다.


정리


Thread (스레드)

- 교착상태(Deadlock)와 기아상태(Starvation)


교착상태(deadlock)란?

  • 무한 대기 상태: 두 개 이상의 작업이 서로 상대방의 작업이 끝나기 만을 기다리고 있기 때문에, 다음 단계로 진행하지 못하는 상태

배치 처리 시스템에서는 일어나지 않는 문제 프로세스, 스레드 둘다 이와 같은 상태가 일어날 수 있음


참고: 교착상태 발생 조건

  • 다음 네 가지 조건이 모두 성립될 때, 교착상태 발생 가능성이 있음
  1. 상호배제(Mutual exclusion): 프로세스들이 필요로 하는 자원에 대해 배타적인 통제권을 요구한다.
  2. 점유대기(Hold and wait): 프로세스가 할당된 자원을 가진 상태에서 다른 자원을 기다린다.
  3. 비선점(No preemption): 프로세스가 어떤 자원의 사용을 끝낼 때까지 그 자원을 뺏을 수 없다.
  4. 순환대기(Circular wait): 각 프로세스는 순환적으로 다음 프로세스가 요구하는 자원을 가지고 있다.

참고: 교착상태 해결 방법

  1. 교착상태 예방
  2. 교착상태 회피
  3. 교착상태 발견
  4. 교착상태 회복

참고: 교착상태 예방(deadlock prevention)

  • 4가지 조건 중 하나를 제거하는 방법
  1. 상호배제 조건의 제거: 임계 영역 제거
  2. 점유와 대기 조건의 제거: 한번에 모든 필요 자원 점유 및 해제
  3. 비선점 조건 제거: 선점 가능 기법을 만들어줌
  4. 순환 대기 조건 제거: 자원 유형에 따라 순서를 매김

참고: 교착상태 회피(deadlock avoidance)

  • 교착상태 조건 1, 2, 3은 놔두고, 4번만 제거
    • 1, 2, 3 제거시, 프로세스 실행 비효율성이 증대
  • 교착상태 조건 중, 자원 할당 순서를 정의하지 않음(순환 대기 조건 제거)
  1. 상호배제 조건의 제거: 임계 영역 제거
  2. 점유와 대기 조건의 제거: 한번에 모든 필요 자원 점유 및 해제
  3. 비선점 조건 제거: 선점 가능 기법을 만들어줌
  4. 순환 대기 조건 제거: 자원 유형에 따라 순서를 매김

참고: 교착상태 발견(deadlock detection)과 회복

  • 교착상태 발견(deadlock detection)

    • 교착상태가 발생했는지 점검하여 교착 상태에 있는 프로세스와 자원을 발견하는 것
  • 교착상태 회복(deadlock recovery)

    • 교착 상태를 일으킨 프로세스를 종료하거나 교착상태의 프로세스에 할당된 자원을 선점하여 프로세스나 자원을 회복하는 것

기아상태(starvation)

  • 특정 프로세스의 우선순위가 낮아서 원하는 자원을 계속 할당 받지 못하는 상태

  • 교착상태와 기아상태

    • 교착상태는 여러 프로세스가 동일 자원 점유를 요청할 때 발생
    • 기아상태는 여러 프로세스가 부족한 자원을 점유하기 위해 경쟁할 때, 특정 프로세스는 영원히 자원 할당이 안되는 경우를 주로 의미함

기아상태 해결 방안

  • 우선순위 변경
    • 프로세스 우선순위를 수시로 변경해서, 각 프로세스가 높은 우선순위를 가질 기회주기
    • 오래 기다린 프로세스의 우선순위를 높여주기
    • 우선순위가 아닌, 요청 순서대로 처리하는 FIFO 기반 요청큐 사용