이야기박스
GCP 교육 1일차 본문
반응형
2019-02-19
[개요]
Data Distribute 제품 --> Dataproc
Serverless
- BigQuery
- DataFlow
ML - Tensorflow
[메인]
unstructured data (google define)
제품1. Dataproc
< Scaling out >
sharding --> 데이터를 나누는 작업
map --> 데이터를 넣는 작업
shuffling --> 집계된 데이터를 정리하는 작업
reduce --> 마지막으로 합침
Dataproc이란?
GCP 존
반응형
'Computer & Data > Cloud Platform' 카테고리의 다른 글
GCP 설계 & 디자인 (0) | 2019.04.04 |
---|---|
GCP 교육 2일차 - DataFlow (0) | 2019.02.20 |
GCP 교육 2일차 - BigQuery (0) | 2019.02.20 |
AWS Cli 설치 (0) | 2019.02.19 |
AWS Glue - 이론 (0) | 2019.01.29 |