1. 쏘카 데이터 그룹 - 데이터 엔지니어링 팀이 하는 일
쏘카의 데이터 엔지니어링 팀은 전사 통합적인 데이터 저장소를 마련하고 여기에 쌓인 데이터를 지표, 시각화, 보고서의 형태로 타 부서에 제공한다. 이외에도 쌓인 데이터를 기반으로 백엔드 서비스 및 운영을 담당하고 GCP(Google Cloud Service)나 CI/CD 파이프라인 등 데이터를 유용하게 사용하기 위한 인프라 관리도 맡고 있다.
브런치 작가 '마르코'님은 실리콘밸리에 본사를 두고 있는 싱가폴 지점 회사에서 데이터 엔지니어로 근무하고 있다. 이 회사에서는 하둡(Hadoop)과 스파크(Spark)기반으로 일을 하고 Druid, HBase등 다양한 데이터베이스를 사용한다. 정확히 말하면 단순한 사용을 넘어 성능 개선을 위한 끊임없는 튜닝과 모니터링 작업도 필수적으로 진행하고 있다. AWS 등 클라우드 기반의 업무에도 익숙해야하기 때문에 단순히 데이터만 다루는게 아니라 DevOps에 준하는 시스템 관리 지식과 경험이 필요한 경우가 많다. 작가님은 데이터 관련 일을 하고 싶은 사람들이 먼저 데이터 관련 석사 학위를 취득하거나 백엔드 분야의 경력을 먼저 쌓을 것을 조언하고 있다.
반응형
'Data Analysis > Data' 카테고리의 다른 글
ANN(Artifical Neural Networks) 요약 (0) | 2022.02.11 |
---|---|
데이터 분석의 고전 - PCA (Principal Component Analysis) (0) | 2022.02.08 |
전세계 회사의 딥러닝 모델은 어떻게 운용(Serving)되고 있을까? (0) | 2022.01.27 |
데이터 분석에서의 Narrative Failure (0) | 2022.01.26 |
데이터과학자가 전세계 사람들과 소통하고자 한다면.. (0) | 2022.01.20 |