INTRO
클라우드 컴퓨팅(Cloud Computing)이란?
- 전화 서비스(Utility, 공공 서비스)처럼 사용하는 컴퓨팅
- 대규모 데이터센터(Data Center)를 통한 컴퓨팅
- 즉, Computing as a Utility(컴퓨팅을 유틸리티처럼 제공하는 것)
온프레미스(On-Premise)
- 클라우드 컴퓨팅의 대안
- 소프트웨어, 하드웨어, 인프라를 조직 내부에서 직접 호스팅/관리하는 방식
클라우드 활용 사례 (Cloud Examples)
B2B 중심( Business to Business - 기업과 기업 사이의 크고 장기적인 거래)
- 대표 기업: Netflix (대부분 인프라를 AWS 위에서 운영 → 스트리밍, 스토리지, 추천 시스템)
- 기타: NASA, Airbnb, LinkedIn
- Top Cloud Spenders(최대 지출 기업)
- Sony: 약 1,100만 달러/월 (EC2 사용)
- Adobe: 약 750만 달러/월
- Facebook: 약 500만 달러/월
- 한국 고객 사례
- LG AI Research: Amazon SageMaker를 이용해 초거대 모델 Exaone 개발
- 무신사, 대한항공, 직방 등
소비자 대상 클라우드 (Consumer-Facing Cloud Examples)
- Google Docs, Gmail, Dropbox 등
이 강의에서 다룰 주제 (Topics in This Course)
- Cloud Infrastructure(클라우드 인프라)
- Cloud Platforms(클라우드 플랫폼, IaaS / PaaS / SaaS)
- Virtualization(가상화)
- Compute Services(컴퓨터 서비스, 예: AWS EC2)
- Networking(네트워킹)
- Cloud Storage(클라우드 스토리지, 예: AWS S3)
- Cloud Database(클라우드 데이터베이스, 예: AWS RDS)
- Security & Privacy(보안과 프라이버시)
- Serverless(서버리스)
- Reliability & Availability(신뢰성과 가용성)
- Cloud-based AI(클라우드 기반 인공지능)
왜 클라우드 컴퓨팅을 배우는가? (Why Learn Cloud Computing)
1. 현대 IT의 기반 (Foundational Technology for Modern IT)
- 클라우드 컴퓨팅(Cloud Computing)은 오늘날 거의 모든 디지털 서비스의 기반
- 예: Netflix 스트리밍, 온라인 쇼핑, AI 기반 앱
- 클라우드의 기본을 이해한다는 것은 현대 컴퓨팅의 백본(Backbone, 중추)을 이해하는 것과 같음
- 클라우드는 더 이상 선택이 아님 → 조직의 IT 인프라 운영의 표준(Standard)
2. AI와 데이터 사이언스의 필수 요소 (Essential for AI and Data Science)
- 머신러닝(Machine Learning), 빅데이터 분석(Big Data Analytics), 생성형 AI(Generative AI) 모두 확장 가능한 클라우드 리소스(Cloud Resources)에 의존
- 클라우드 없이는 대규모 AI 학습이나 데이터 파이프라인(Data Pipeline)이 사실상 불가능
3. 시장 관점 (Market’s Perspective)
- 클라우드 서비스 사용량은 계속 증가
- 팬데믹 이후 이 트렌드가 더욱 가속화됨
4. 산업 수요와 커리어 경쟁력 (Industry Demand & Career Advantage)
- 기술(Tech), 금융(Finance), 의료(Healthcare), 제조업(Manufacturing) 등 모든 분야의 기업들이 클라우드 역량을 요구
- 클라우드 엔지니어(Cloud Engineer) 수요 증가 → 취업 기회 확장
- AWS 개념을 숙지하면 인턴십·취업 경쟁력에서 강점 확보
- 한마디로, 클라우드 역량이 있으면 어디서든 갈 수 있다
Lecture 2: 클라우드 인프라 (Cloud Infrastructure)
Agenda (강의 개요)
- 클라우드 컴퓨팅(Cloud Computing): 공식 정의
- 온프레미스(On-Premise)의 문제점
- 클라우드의 장점 (Benefits of Cloud)
- 클라우드의 위험과 도전 과제 (Risks & Challenges of Cloud)
- 클라우드 인프라 (Cloud Infrastructure)
- 서버(Server)
- 네트워킹(Networking)
- 스토리지(Storage)
- 데이터센터(Datacenter)
클라우드 컴퓨팅 공식 정의 (Cloud Computing: Formal Definition)
NIST(미국표준기술연구소, 2011) 정의 (가장 널리 받아들여지는 정의):
- 클라우드 컴퓨팅은 구성 가능한 컴퓨팅 자원(Computing Resources: 네트워크, 서버, 스토리지, 애플리케이션, 서비스 등)의 공유 풀에 언제 어디서나(on-demand, ubiquitous) 접근 가능하도록 하는 모델
- 이러한 자원은 최소한의 관리 노력 또는 서비스 제공자와의 상호작용으로 빠르게 할당(Provision)·해제(Release) 가능
- 다시 말해, Computing as a Utility(컴퓨팅을 유틸리티처럼 제공)
- 컴퓨팅을 제3자나 내부 조직에 아웃소싱
- 핵심 특성 (Essential Characteristics):
- On-demand self-service(주문형 자기 서비스)
- Broad network access(광범위한 네트워크 접근성)
- Resource pooling(자원 풀링)
- Rapid elasticity(빠른 탄력성)
- Measured service(계량된 서비스)
온프레미스(On-Premise)의 문제점
가정 (Assumption)
AI 챗봇 서비스를 만든다고 가정:
- 수백만 명의 사용자가 예상됨
- 선택지:
- 온프레미스(On-Premise) 서버 구축
- 클라우드 서비스(Cloud Service) 사용
온프레미스 선택 시 (Going On-Premise)
- 서버, 스토리지, 네트워킹 장비 구매
- 서버 관리 전담 인력 고용
- 보기에는 괜찮아 보이지만, 실제 운영은 쉽지 않음
문제 1: 수요 예측의 어려움 (Difficult to Dimension)
- 사용량(Load)이 크게 변동
- 예: 낮 시간대에는 사용자가 급증
- 해결책 두 가지:
- 최대 피크 수요 기준(Provision for Peak Load) → 과잉 투자
- 피크 이하 기준(Provision below Peak) → 성능 저하
문제 2: 높은 비용 (High Cost)
- 하드웨어 비용 막대
- 소규모 서버 클러스터도 $100,000+ 소요
- Microsoft는 단일 데이터센터에 4억 9,900만 달러 투자
- 전문성 필요
- 클러스터 계획·설치 복잡, 특수 소프트웨어 필요
- 유지보수 필요
- 고장난 하드웨어 교체, 소프트웨어 업그레이드, 사용자 계정 관리 등
문제 3: 확장성 문제 (Scaling Difficulty)
- Scaling Up(확장): 새로운 서버 주문·설치·통합 → 몇 주 소요, 대규모 확장은 구조 재설계 필요 (새 스토리지·네트워크·건물 등)
- Scaling Down(축소): 불필요한 하드웨어 처리 문제, 서버는 유휴 상태에서도 최대 전력의 60% 소모, 건물/시설 같은 고정 비용 존재
클라우드의 장점 (Benefits of Cloud)
1. 투자 및 비용 절감 (Reduced Investments & Proportional Costs)
- 초기 IT 투자(하드웨어·소프트웨어 구매 및 소유 비용) 감소
- 필요한 만큼만 지불 → 불필요한 자원 낭비 방지
2. 사용량 기반 과금 (Pay-as-you-go Pricing)
- 대부분 서비스는 분 단위 / 바이트 단위 과금
- 최소 요금·선불 요금 없음
- 변동이 큰 앱(Utilization Variable Apps)에 특히 유용
3. 확장성 증가 (Increased Scalability)
- 클라우드는 즉각적이고 동적인 자원 할당 가능
- 사용자 수가 급증하면 바로 IT 자원 확장 가능 → 서비스 품질 유지
4. 규모의 경제 (Economies of Scale)
- 대규모 구매·전력 관리·운영으로 단위 비용 절감
- 고객은 더 저렴하게 클라우드 사용 가능
5. 가용성과 신뢰성 증가 (Increased Availability & Reliability)
- Availability(가용성): 더 긴 시간 동안 서비스 접근 가능
- Reliability(신뢰성): 장애를 피하고 회복할 능력
- 클라우드 제공자는 일반적으로 Service Level Agreement(SLA, 서비스 수준 협약)로 높은 가용성을 보장
- 모듈형 아키텍처(Modular Architecture) → 장애 시 자동 전환(Failover) 기능 제공 → 신뢰성 강화
참고: AWS SLA 문서 → https://aws.amazon.com/compute/sla/?nc1=h_ls
사례 연구 (Case Study: Animoto, 2008)
- Animoto: 사진·음악을 활용해 자동으로 비디오 제작해주는 앱
- Amazon EC2 + S3 + SQS 기반으로 개발
- 2008년 4월 Facebook 앱 출시
- 3일 만에 75만 명 가입
- EC2 사용량: 50대 → 3,500대 서버로 확장 (70배 Scalability)
클라우드의 위험과 도전 과제 (Risks & Challenges of Cloud)
1. 보안 취약성 증가 (Increased Security Vulnerabilities)
- 클라우드 제공자가 클라우드 소비자의 데이터에 특권 접근(Privileged Access) 가능
- 악의적인 클라우드 사용자(Malicious Cloud Consumers)가 IT 자원을 공격하거나 데이터 탈취·손상 가능성 증가
2. 운영 관리 통제 감소 (Reduced Operational Governance Control)
- 클라우드 사용자는 온프레미스(On-Premise) IT 자원을 관리할 때보다 더 낮은 수준의 통제권만 가짐
3. 제한된 이식성 (Limited Portability between Cloud Providers)
- 퍼블릭 클라우드(Public Cloud)는 대체로 독점적(Proprietary) 성격
- 다른 클라우드 제공자로 이전(Migration)하기 어려움
4. 다지역 규제 및 법적 문제 (Multi-Regional Compliance & Legal Issues)
- 예: 챗봇이 미국과 한국 양쪽의 데이터 규제를 모두 따라야 함
- 지역별로 데이터와 프라이버시(Privacy) 규제가 다르기 때문에 클라우드는 이를 모두 구현해야 함
- 주요 규제 이슈는 데이터(Data)와 개인정보 보호(Privacy)
클라우드 인프라 (Cloud Infrastructure)
- 클라우드 인프라는 고객에게 클라우드 서비스를 제공하기 위해 필요한 모든 하드웨어 및 소프트웨어 구성 요소로 이루어짐
- 핵심 물리적 구성 요소: 서버(Server), 네트워킹 장비(Networking Equipment), 스토리지(Storage)
- 보통 데이터센터(Datacenter) 형태로 구축 → 수많은 서버, 네트워크 장비, 스토리지 집약
서버 (Server)

- 서버는 클라이언트에 서비스를 제공하는 컴퓨터
- 신뢰성(Reliability)과 대량 요청 처리에 최적화됨
- 멀티코어 CPU 서버(1~2 소켓, 신뢰성 기능 포함)
- ECC 메모리(Main Memory with ECC)
- 최근 변화: GPU, FPGA, AI 가속기(Custom Accelerator) 도입
블레이드 서버 (Blade Server)
- 대규모 설치 환경에서 공간 절약형 서버
- 장점:
- 바닥 공간 절약
- 관리 용이성 (Manageability)
- 확장성 (Scalability)
- 전력 및 냉각 효율성
랙 (Rack)
- 블레이드 서버는 랙(Rack)에 장착
- 모듈형 설계 → 랙 단위 배치
- 한 랙은 최대 42대의 1U 블레이드 서버 수용
이기종 서버 (Heterogeneous Servers)
- 모든 서버가 동일하지 않음 (Non-Homogeneous)
- 내부 하드웨어 구성이 다를 수 있음
- 주요 애플리케이션 클래스에 맞게 최적화된 서버 구성 존재
네트워킹 (Networking)
- 클라우드 자원은 주로 인터넷(Internet)을 통해 사용자에게 전달됨
- 이를 위해 제3자 서비스 제공자가 네트워킹 인프라 구축·운영 필요
- 핵심 네트워킹 장비:
- 물리적 케이블(Cables)
- 스위치(Switches)
- 라우터(Routers)
- 무선 액세스 포인트(Wireless Access Points)
스토리지 (Storage)
기본 스토리지 장치 (Basic Storage Device)
- HDD(디스크 트레이)
- SSD & NVM 플래시
스토리지 어레이 (Storage Array)
- 대량 스토리지를 연결한 강력한 컴퓨터
- 다수의 드라이브를 하나의 시스템으로 통합 → 페타바이트(Petabyte) 단위 데이터 저장 가능
- 중앙 관리 시스템(Central Management System) 기반
- 여러 서버에 스토리지 제공 가능 (전용 네트워크 기반 연결)
클러스터 (Cluster)
- 여러 랙(Rack)이 모여 클러스터 형성
- 유사한 머신들이 긴밀하게 상호 연결된 구조
데이터센터 (Datacenter)
- 대규모 서버·스토리지 팜(Farm) 집합
- 구성:
- 50,000 ~ 200,000개의 랙
- 랙당 약 100코어(Cores)
- 전력 소비: 10 ~ 100MW
- 스토리지: 제타바이트(Zettabyte, 10^21 바이트) 규모
데이터센터 내부 (Inside a Datacenter)
- 거대한 창고 형태, 포함 요소:
- 서버 랙(Racks of Servers)
- 네트워크 스위치(Network Switches)
- 스토리지 어레이(Storage Arrays)
- 냉각 장치(Air Conditioning)
- 이중 전력 공급 (UPS, 발전기, 다중 전력 라인)
- 화재 방지(Fire Protection)
- 물리적 보안(Physical Security)
- 모니터링 시스템(Monitoring Systems)
글로벌 데이터센터 분포 (Global Datacenter Distribution)
- 데이터센터는 전 세계적으로 분산 배치됨
- 예: Google Datacenter 위치 (추정치)
- 이유:
- 사용자와 가까워야 함 (물리적 거리 → 지연 최소화)
- 더 저렴한 자원 확보
- 장애(Failure)에 대한 보호
전력과 냉각 (Power and Cooling)
- 클러스터(Cluster)는 막대한 전력 필요
- 예: 서버 1대 = 약 140W
- 랙(Rack) 32대 서버 = 약 4.5kW (특수 전력 공급 장치 필요)
- 대부분의 전력은 열(Heat)로 변환됨
- 대규모 클러스터는 대형 냉각 장치 필요
- 랙 1개(4.5kW)는 전기 난로 3개와 비슷한 열 발생
- 따라서 데이터센터는 막대한 에너지 소비
전력 소비 현황
- 데이터센터 전체 전력 사용량은 일부 국가의 전력 소비보다 많음
현장 전력 생산 (On-Site Power Generation)
- 예: Google의 앨라배마 데이터센터는 전용 발전소(Power Plant) 보유
수중 데이터센터 (Underwater Datacenter)
- Microsoft의 실험적 수중 데이터센터
- 해안 지역 사용자에게 빠른 클라우드 서비스 제공
- 냉각 효율 극대화
새로운 데이터센터 트렌드 (New Datacenter Trends)
- AI Factory(인공지능 공장)로의 전환
- AI 성장과 GPU 사용 증가로 에너지 사용 구조 변화
- NVIDIA: 2024년 데이터센터 GPU 출하량 2배 이상 전망
- 데이터센터 건설 확산 지역
- 아프리카, 중남미, 중동, 인도, 태국, 베트남 등
- 효율성과 지속 가능성 (Efficiency & Sustainability)
- 액체 냉각(Liquid Cooling) 채택 증가
- ASIC(Application-Specific Integrated Circuit) 채택
요약 (Summary)
- Cloud Computing(클라우드 컴퓨팅): 공식 정의
- 핵심: Computing as a Utility(컴퓨팅을 유틸리티처럼)
- On-Premise(온프레미스)의 문제점
- 부하 변동으로 인한 수요 예측 어려움
- 구축·유지 비용 고가
- 확장/축소 어려움
- 클라우드의 장점 (Benefits of Cloud)
- 투자 및 비용 절감
- 사용량 기반 과금 (Pay-as-you-go)
- 높은 확장성 (Scalability)
- 규모의 경제 (Economies of Scale)
- 가용성·신뢰성 강화 (Availability & Reliability)
- 클라우드의 위험과 도전 과제 (Risks & Challenges)
- 보안 취약성 증가
- 운영 관리 통제 감소
- 클라우드 간 이식성 제한
- 다지역 규제 및 법적 문제
- 클라우드 인프라 (Cloud Infrastructure)
- 서버(Server), 네트워킹(Networking), 스토리지(Storage), 데이터센터(Datacenter)