클라우드 컴퓨팅이란 무엇인가?
인터넷에서 종량 요금제 방식으로 클라우드 서비스 플랫폼을 통해 컴퓨팅 파워, 데이터베이스 스토리지, 애플리케이션, 기타 IT 리소스를 온디맨드로 제공하는 서비스
클라우드 컴퓨팅의 여섯 가지 이점
- 자본 비용을 가변 비용으로 대체
- 규모의 경제로 얻게 되는 이점
- 용량 추정 불필요
- 속도 및 민첩성 향상
- 데이터 센터 운영 및 유지 관리에 비용 투자 불필요
- 몇 분만에 전 세계에 배포
클라우드 컴퓨팅 유형
클라우드 컴퓨팅 모델
- 서비스형 인프라(IaaS) - 네트워킹 기능, 컴퓨터(가상 또는 전용 하드웨어) 및 데이터 스토리지 공간
- 서비스형 플랫폼(PaaS) - 기본 인프라(대개 하드웨어 및 운영 체제)를 관리할 필요 없이 애플리케이션 배포 및 관리에 집중
- 서비스형 소프트웨어(SaaS) - 최종 사용자 애플리케이션(이메일 서비스 등)
클라우드 컴퓨팅 배포 모델
- 클라우드 - 클라우드상에 완전히 배포되며 애플리케이션의 모든 부분이 클라우드에서 실행
- 하이브리드 - 클라우드 기반 리소스와 클라우드에 위치하지 않은 기존 리소스 간에 인프라와 애플리케이션을 연결하는 방법
- 온-프레미스 - 프라이빗 클라우드 = 레거시
글로벌 인프라
AWS 클라우드 인프라는 리전 및 가용 영역(AZ)을 중심으로 구축
AZ는 하나 이상의 개별 데이터 센터로 구성
각 데이터센터는 분리된 시설에 구축되고 중복 전력, 네트워킹 및 연결성을 갖추고 있음
보안 및 규정 준수
보안
소프트웨어 기반 보안 도구를 사용하여 클라우드 리소스에서 송수신되는 정보를 모니터링하고 보호
AWS 보안의 혜택
- 데이터를 안전하게 유지
- 규정 준수 요구 사항 충족
- 비용 절감
- 신속한 확장
규정 준수
전 세계 거의 모든 규제 기관의 규정 준수 요구 사항을 충족할 수 있음
AWS가 준수하는 보증 프로그램의 일부 목록
- SOC 1/ISAE 3402, SOC 2, SOC 3
- FISMA, DIACAP 및 FedRAMP
- PCI DSS 레벨 1
- ISO 9001, ISO 27001, ISO 27017, ISO 27018
Amazon Web Services 클라우드
AWS 액세스 방법
- AWS 관리 콘솔
- AWS CLI(Command Line Interface)
- SDK(Software Development Kit)에서 프로그래밍 언어 or API로 액세스
1. 분석
1.1 Amazon Athena*
표준 SQL을 사용하여 Amazon S3에 저장된 데이터를 간편하게 분석할 수 있는 대화형 쿼리 서비스
서버리스 서비스로, 실행한 쿼리에 대해서만 비용을 지불
1.2 Amazon CloudSearch
검색 솔루션
1.3 Amazon EMR(Elastic MapReduce)*
페타바이트급 데이터 처리, 대화식 분석 및 기계 학습을 위한 클라우드 빅 데이터 플랫폼
ex) Amazon EC2 인스턴스에서 대량의 데이터를 쉽고 빠르며 비용효율적으로 처리할 수 있는 AWS 관리형 Hadoop 프레임워크는 어떤 서비스입니까?
1.4 Amazon FinSpace
금융 서비스 산업(FSI)을 위해 특별히 제작된 데이터 관리 및 분석 서비스
1.5 Amazon Kinesis
실시간 스트리밍 데이터를 손쉽게 수집, 처리 및 분석
완전관리형 스트리밍 애플리케이션
비디오, 오디오, 애플리케이션 로그와 같은 실시간 데이터를 수집되는 대로 처리 및 분석
1.6 Amazon Kinesis Data Firehose
스트리밍 데이터를 캡처하고 변환하여 Amazon S3, Amazon Redshift, Amazon OpenSearch Service 및 Splunk로 로드
데이터 처리량에 맞춰 자동으로 크기가 조정
1.7 Amazon Kinesis Data Analytics
완전관리형 서버리스 Apache Flink로 스트리밍 데이터에서 실행 가능한 인사이트 확보
1.8 Amazon Kinesis Data Streams
데이터 스트림을 쉽게 캡처, 처리 및 저장할 수 있는 서버리스 실시간 데이터 스트리밍 서비스
1.9 Amazon Kinesis Video Streams
분석, 기계 학습(ML), 재생 및 기타 처리를 위해 커넥티드 디바이스에서 AWS로 비디오를 쉽고 안전하게 스트리밍
1.10 Amazon OpenSearch Service
실시간으로 데이터를 검색, 분석 및 시각화할 수 있게 지원
Amazon Elasticsearch Service의 후속으로 최신 버전의 OpenSearch을 제공
OpenSearch Dashboards와 Kibana(버전 1.5~7.10)이 제공하는 시각화 기능을 제공
1.11 Amazon Redshift
클라우드 데이터 웨어하우스
테라바이트에서 페타바이트에 이르는 규모의 정형 데이터 및 반정형 데이터 에서 복잡한 분석 쿼리를 실행할 수 있음
1.12 Amazon QuickSight
조직 내 모든 구성원에게 인사이트를 손쉽게 제공할 수 있는 빠른 클라우드 기반 비즈 니스 인텔리전스(BI) 서비스
대시보드를 애플리케이션에 포함하여 고객에게 강력 한 셀프 서비스 분석 기능을 제공
1.13 AWS Data Exchange
클라우드에서 손쉽게 서드 파티 데이터를 검색하고 구독
데이터 제품을 구독하면 AWS Data Exchange API를 사용하여 데이터를 Amazon S3에 직접 로드한 다음 다양한 AWS 분석 및 기계 학습 서비스로 분석할 수 있음
1.14 AWS Data Pipeline
지정된 간격으로 데이터를 안정적으로 처리하고 이동할 수 있도록 지원하는 웹 서비스
데이터가 저장된 위치에서 데이터를 정기적으로 액세스하여 규모에 맞게 변형 및 처리하고 그 결과를 Amazon S3, Amazon RDS, Amazon DynamoDB, Amazon EMR과 같은 AWS 서비스로 효율적으로 전송
1.15 AWS Glue
손쉽게 데이터를 준비하고 로드할 수 있게 지원하는 완전관리형 추출, 변환, 로드(ETL) 서비스
1.16 AWS Lake Formation
안전한 데이터 레이크*를 손쉽게 설정할 수 있도록 지원하는 서비스
* 데이터 레이크는 큐레이션된 안전한 중앙 집중식 리포지토리로, 모든 데이터를 원래 형식 및 분석에 필요한 형식으로 저장
Lake Formation 을 활용한 데이터 레이크 생성 절차 : 데이터베이스 및 객체 스토리지의 데이터를 수집하고 카탈로그화한 후, 새로운 Amazon S3 데이터 레이크로 옮긴 다음, 기계 학습 알고리즘을 사 용해 정리 및 분류하고, 민감한 데이터에 대한 액세스를 보호
1.17 Amazon Managed Streaming for Apache Kafka(Amazon MSK)
Apache Kafka를 사용하여 스트리밍 데이 터를 처리하는 애플리케이션의 구축 및 실행을 간소화하는 완전관리형 서비스