본문 바로가기
CS/운영체제

운영체제 스터디 4주차 - 스레드

by 데브겸 2024. 1. 24.

4.1 Overview

지금까지는 프로세스가 하나의 스레드를 가지는 실행 프로그램으로 가정하고 이야기하였으나, 실제 컴퓨터에서는 하나의 프로세스 안에서 여러 개의 스레드를 컨트롤할 수 있음. 스레드는 경량화된 프로세스(Lightweight Process, LWP)이면서 CPU의 가장 기본적인 단위가 됨. 그렇게 되면 실질적으로 CPU 점유는 프로세스 아이디(pid)가 아닌 스레드 아이디(thread ID)를 기준으로 진행됨.

 

스레드는 하나의 프로세스 안에서 코드, 데이터, 파일은 공유하지만 / 레지스터셋, 스택, 프로그램 카운터를 별도로 가지게 됨. 즉, 멀티 스레드 프로세스는 아래와 같이 표현 가능할 수 있음. (여기에서 주목할 점은 어떤 것을 공유하고 어떤 것을 따로 처리하는 가. 예를 들어 하나의 프로세스 안에서 전역변수의 경우 스레드끼리 공유하기 때문에 처리할 때 주의해야 한다)

 

 

멀티 스레딩을 사용할 경우 스레드 생성 한도까지 새로운 스레드를 만들어 각 요청에 대한 처리를 맡길 수 있음. 아래 그림과 같이 (Non-blocking I/O 환경) 원래는 하나 이상 처리할 수 없었던 것을, 각각의 스레드마다 처리하게 하여 훨씬 더 빠르고 효율적으로 모든 작업을 처리할 수 있게 된다.

 

멀티 스레딩의 장점으로는

  • Responsiveness: 여러 개의 스레드를 통해 각각 작업을 처리하게 하여 블로킹하지 않고 작업을 받아서 처리
  • Resource Sharing: 애초에 스레드끼리는 코드, 데이터 영역을 공유하기 때문에 IPC(공유 메모리, 메시지 패싱) 형식보다 더 리소스 효율적으로 자원을 공유할 수 있음
  • Economy: 프로세스 생성(복제 등), 컨텍스트 스위치보다 스레드를 생성하고, 스레드끼리 스위칭하는 것이 더 비용 효율적임
  • Scalability: 멀티 프로세서 아키텍쳐의 장점을 가져갈 수 있음

 

 


4.2 Multicore Programming

멀티코어 시스템에서 멀티 스레딩을 사용하면 훨씬 더 효율적으로 작업 처리가 가능. 하나의 코어에서는 하나의 CPU자원을 시분할하여 사용해야 했지만, 멀티 코어 환경에서는 시분할하여 사용하기는 하지만 어쨋든 몇 개의 스레드는 병렬적으로 처리될 수 있음.

 

하지만 멀티코어 시스템이 등장하면서 몇 가지 챌린지가 등장하였는데

  • Identifying tasks: 어떤 종류의 태스크를 멀티 스레딩으로 처리할 수 있는가를 알아내야 함
  • Balance: 각 코어가 너무 놀지도, 너무 빡세게 일하지도 않게 밸런스를 맞춰줘야 함
  • Data Splitting: 각 코어별로 데이터를 어떻게 나눌 것인지
  • Data Dependency: 작업 별 의존성이 있을 수 있는데 이를 고려해야 함
  • Testing and debugging: 어떤 스레드에서 고장이 났는지 모를 수도 있고, 하나는 고장났는데 다른 것들을 고장 안 나고 그대로 진행하고 그렇기 때문에 테스트와 디버깅이 까다로움

 

또한 암달의 법칙(Amdahl's Law)에 따라 코어가 많다고 해서 반드시 그에 비례하여 처리 속도가 빨리지지도 않음

S: 어떤 시스템에서 연속적으로 수행해야 하는 작업의 비율 / N: 프로세스 코어의 갯수

 

 

스레드에는 두 가지 타입의 스레드가 존재한다. 하나는 유저 모드에서 사용할 수 있는(커널 서포트가 없는) user thread와 OS가 직접 관리하는 kernel thread가 존재. user thread와 kernel thread의 관계는 Many-to-one, One-to-one, Many-to-many 모델이 있다.

 

이런 유저 스레드와 커널 스레드의 구분과 둘의 관계에 대한 얘기가 왜 나왔을까. SW 개발할 때 생각해보면 분명 사용가능한 하드웨어의 스레드의 갯수는 한정적일텐데 하이레벨의 프로그래밍 언어로 개발을 할 때 그 스레드의 갯수 생각 안하고 무한정으로 만들어서 띄우는 경우들이 있다. 이런 경우 어떤 일이 벌어질까에 대한 이야기이다. 이런 경우 메모리 용량만큼 만들 수 있는 '소프트웨어적 스레드'들이 만들어지고 이 중 일부는 하드웨어가 자신을 불러서 처리해줄 때까지 대기하다가('물리적(하드웨어적) 스레드'가 처리할 수 있는 최대 스레드 수는 제한적이니) OS가 컨텍스트 스위치를 하듯 준비가 된 스레드 중에서 선택하여 동시에 실행하는 형태로 진행된다.

 

자세한 설명과 비유는 https://kldp.org/node/154708 아래 링크 참고


그냥 비유 하나 들어서 두 줄로 요약하죠. 4코어 8스레드란 건 예컨대 상/하권으로 분권된 어떤 책이 4세트(=8권) 있는 겁니다. 그 4세트를 도서관에 두고 사서가 관리하면 대출/반납규정 지켜가며 수십~수백 명의 도서관 회원이 읽을 수 있죠. 한 순간엔 최대 8명까지밖에 못 읽지만.

절묘한 비유에 감탄을 하고 갑니다. 책을 챕터별로 모두 분권 해 놓고 각 분권별로 대기자 목록을 만들어 두면 사실 무한대 인 거 맞죠? 물론 물리적인 대기자 목록의 페이지 수의 한계는 분명 있을 거구요. 거기다가 대출중인 1인이 규정을 위반하면 병목현상이 그냥~~ 캬~~
 

CPU가 지원하는 쓰레드랑 프로그래밍 상의 쓰레드랑 다른건가요? | KLDP

안녕하세요. TCP/IP 멀티 쓰레드를 공부중입니다. 공부하면서 제가 무언가 이해를 잘못하는 부분이 있는거 같아요. 제 컴퓨터 CPU는 코어4 쓰레드8입니다. 코어 1개에 2개 씩 쓰레드가 가능해서 8쓰

kldp.org