Data Enginerring/데이터 엔지니어링 스타터 키트

프로그래머스 데이터 엔지니어링 스터디 9기 수강 후기

dashwood 2022. 9. 21. 22:31

https://school.programmers.co.kr/learn/courses/14783

 

[스터디/10기] 실리콘밸리에서 날아온 데이터 엔지니어링 스타터 키트 with Python

🎁 아쉽지만 10기는 마감되었어요. 11기 오픈 알림 신청하고 최저가에 수강하세요! 오픈 알림 신청 데이터 엔지니어링을 시작하려는 모두에게 자신있게 추천하는 첫 스텝 : 실리콘밸리에서 날아

school.programmers.co.kr

 

 

1. 신청 계기

 올해 초 직무 전환 이직을 결심했다. 당시에는 정말 'ML/DL 엔지니어나 데이터 분석가만 아니면 된다' 하며 이것 저것 닥치는 대로 공부를 했다. 스프링 백엔드도 조금 공부했다가 사이드 프로젝트를 기획하며 플러터를 공부하기도 했다.

 

  여러 개발 블로그들을 구경하곤 하는데 그러다 데이터 엔지니어링이라는 것이 무엇인지 구체적으로 알게되었다. 현재 일하는 회사에서도 가장 많이 고민했던 문제였고(데이터를 믿을만 한 것인가? 데이터가 일관된 판단아래 라벨링이 되었는가? 등) 데이터 엔지니어가 딱 이런 문제를 해결하는 직무였다.

 

 실제 일을 하면서도 모델을 개선했을 때 성능이 향상되는 경우보다 데이터 셋을 엎을 때 마다(대규모 노가다) 성능이 향상되는 경우가 훨씬 많았다. 대략 2년 반 동안 가장 크게 배운 것은 '데이터에 집착할 수록 성과가 난다!' 였다. 그러다 보니 논문을 보는 것도 재미없고(모델이 다 무슨 소용이람 ㅠ 다 SOTA 대충 기워서 쓰는 건데 이게 코드 복붙이 아니면 뭐란 말임..) 데이터 사이언스 분야에 대한 관심이 사라져 버렸다. 그래서 데이터 엔지니어로 직무를 전환해야 겠다! 라고 마음을 먹고 공부를 시작해 보기로 했다.

 

 아무튼 이런 와중에 구글링을 하며 알게된 주니어 데이터 엔지니어 분들의 블로그를 보니 다들 프로그래머스의 이 스터디를 수강했었다! 그런데 이 스터디의 존재를 8기가 시작한지 얼마 안됐을 때 알아버려 9기 오픈을 애타게 기다렸다.

 

 개인적으로 수준이 비슷한 사람들끼리 모여 챕터를 나누어 각자 공부한 후 챕터를 나누어 돌아가면서 발표하는 형식의 스터디를 좋아하지 않는다. 이렇게 능력자 한 분이 멱살잡고 끌고가며 강의해주고 피드백해주는 스터디를 가장 선호하는 편이다. (잘 없어서 아쉽다..)

 

 마냥 기다릴 수 만은 없으니 데이터 엔지니어 오픈 채팅에서도 많은 주니어 데엔 분들의 추천 도서인 '빅데이터를 지탱하는 기술' 을 세 번 정도 읽었다. 데이터 엔지니어링 분야가 완전 처음이라면 스터디 시작전에 이 책을 한 번쯤이라도 읽어 보는 것을 추천한다. 공부 조금이라도 안해갔으면 큰일날 뻔 했다. 아 도커 공부한다고 AWS를 조금 공부했었는데 이것도 아주 도움이 됐다. AWS도 조금만 구경하고 스터디 참여하는 것도 추천한다. 그러고 '데이터 파이프라인 핵심 가이드'를 보는 중 스터디 시작 날이 되었다.

 

 

 

2. 수강 후기

 두서없지만 스터디를 수강하며 느꼈던 점들 몇 가지를 적어본다. 전반적으로 아주 만족한 스터디였다!!

 

1) 스터디 시작 전 EO에서 리더님의 인터뷰를 보았다. 그리고 커리어와 성장에 대해 이야기한 첫 수업을 듣고 맥스님의 팬이 되었다(?) 1대1 슬랙콜 타임을 가질 때 이직에 대한 고민을 얘기해보고자 했었는데 내 고민의 많은 부분이 해결되었다. 신입 데이터 엔지니어 직무를 고민 중 이라면 추천하는 과정이다.

 

2) 생각보다 나처럼 데싸에서 데엔으로 이직을 목표로 하는 분들이 많았다. 이 분들과 어떤 이야기도 하지 않았지만 괜히 내가 잘 선택했구나라는 생각이 들었다. 왜 인지는 모르겠지만.. 괜히 유대감 느껴지고 다들 잘 됐으면 좋겠고.. 뭐 그런 ㅎ

 

3) AWS 관련 괴담이 너무 많아 공부해 볼 겸 써볼 때도 무서워서 구글링 백번해보고 쓰고 그랬었는데(대왕 쫄보임) 스터디를 진행하는 동안 이런 부담없이 스터디에 필요한 리소스들이 제공되어서 좋았다. 딱 집중할 것만 집중할 수 있도록 짜여져 있다.

 

4) 스터디 진행 시간이 마음에 들었다! 토요일 오전 10시로 주말에 잠을 몰아서 자는 나에겐 다소 이른 시간이었지만 주말의 시작인 토요일 오전을 알차게 보내는 것이 엄청난 긍정적 에너지를 가져다 준다는 것을 알게 되었다. 왜 유튜버 드림코딩님이 토요일 오전 루틴을 지키는지 몸소 느껴보니 알겠다. 그 분처럼 주말 새벽 기상은 너무 어렵지만 앞으로도 이 시간을 활용해보려 한다. 작은 성취의 힘이 이런 것이군..!

날씨도 좋아서 한 컷 찍어봄

 

5) 스터디에서 에어플로우를 공부하면서 조금 막히는 부분이 있어 에어플로우 책을 구입해보았는데 책에서 start_date와 excution_date 같은 개념들에 대한 설명이 맥스님의 설명과 비교했을 때 책이 너무나도 부족했었다. 에어플로우가 아직 한국어 자료가 많이 부족한데 이해가 어려운 부분들에 대해 설명을 잘 해주셔서 좋았다.

 

6) 복습에 시간을 많이 들여야 한다. 전체적으로 복습하며 세네번씩 강의를 들어줬는데 들을 때마다 강의 자료에 필기를 못한 부분이 있다! 라이브 세션시간에 생각보다 내가 바로바로 못 알아 듣는 내용이 많아 아주 살짝 자괴감이 들기도 했지만 뭐 어때!!! 회사일과 개인적인 일로 인해 중요한 주차의 과제를 못해서 너무 아쉽다..

 

7) 마지막 시간에 앞으로 뭘 공부하면 좋을지 그리고 커리어에 대한 이야기를 한 번 더 해주셨다. 이것이 수미상관..!? 스터디에 마친 후 머릿속에 바로 떠오른 생각은 '앞으로 무엇을 해야할지 알겠다.' 이다. 앞으로 무엇을 공부하면 좋을지 알려줘서 뭘 해야할지 알겠다라기 보다 어떤 선택을 해야할지 알겠다. 이제 내가 부딪치기만 하면 된다.