[독후감] 빅데이터 커리어 가이드북

1. 읽게 된 계기

2년 전 어느 날 갑자기 회사에서 디지털 리터러시에 대한 중요성을 강조했다. 그러고는 갑자기 뉴칼라라는 이름의 강좌가 생겨났다. 단계별로 뉴칼라 Lv1~4까지 있는데 3부터는 대학원 과정이고 보통 2까지 수료한다. 뉴칼라 워크벤치, R, Python 이렇게 3가지로 나뉘어있다. 대학 때 C언어를 2학기 동안 배웠어서 아무래도 파이썬이 관심이 갔다.
 
회사는 수료를 장려하고자 아이패드 프로를 지급한다. 그리고 승진 가점에도 반영이 되기 때문에 직원들에게는 쏠쏠한 동기부여가 된다. 하지만 나는 약간의 불순한 의도로 뉴칼라를 수료하고자 했다. 정확히는 뉴칼라 교육을 듣는 것 자체가 목적이었다. 레벨 1은 3일, 레벨 2는 5일 동안 교육을 진행을 한다. 물론 근태는 교육으로 올린다. 그래서 나는 부서로 출근하지 않고 교육장으로 출근했다. 결국 회사 출근하고 싶지 않은 욕망으로 나는 뉴칼라를 하고자 했던 것이다. 갑자기 교육 들으러 간다고 통보해서 직책자에게 쓴소리 들었지만 내가 잘 못한 건 맞다. 하지만 어쨌든 나는 욕먹고 원하는 교육에 참여할 수 있게 되었다.
 
그냥 코딩 교육인 줄 말 알았다. 첫날 오전에 파이썬, 주피터 노트북 설치하는 법부터 해서 코딩 짜고 결과가 어떻게 나오는지 함께하는 시간을 가졌다. 패키치는 판다스와 넘파이로 했다. 거기까지는 그냥 코딩수업인 줄 알았다. 하지만 오후에 이론을 설명하는데 수학과 통계이야기를 하길래 깜짝 놀랐다. 나 혼자 이 교육이 코딩인 줄만 알았던 것일까 혼란스러웠다. 교수님들은 열심히 설명하셨지만 완전 소귀에 경 읽기였다. 그래도 졸지 않고 따라가려고 노력했다. 하지만 코딩 받아쓰기 하느라 이해하는 여유는 없었다.
 
따라가다 보니까 약간 통계에 관심을 가지게 되었다. 그리고 새로운 학문에 대한 관심을 가지게 되었다. 그래서 꾸준히 관심을 가져보고자 유튜브에 관련 내용들을 찾아봤다. 처음에는 내가 좋아하는 포프 TV의 클립들을 라디오처럼 들었다. 그중에 빅데이터와 데이터 사이언티스트를 언급하는 영상이 관심을 가지게 되었다. 데이터 사이언티스트라는 용어자체도 처음 알게 되었다. 덕분에 찾아볼 때도 좀 더 자세하게 검색할 수 있게 되었다.
 

포프TV - DB 관리자의 미래

전체적인 코딩에 관심이 다시 살아나면서 조코딩이라는 유튜버도 생각이 났다. 예전에 재밌게 보았던 시리즈물을 본 적이 있어서 다시 한번 그 영상들을 즐겼다. 그리고 조코딩 채널에서 하나의 영상을 보게 되었고 그 덕분에 빅데이터 커리어 가이드북이라는 책을 알게 되었다.
 

 

2. 독후감

 
과연 독후감을 쓸 수 있을까 의문이다. 이 책에서 나온 명언 중 하나를 먼저 소개하고 글을 마저 쓰도록 하겠다. UC버클리의 마이클 조던 교수가 이런 말을 했다고 한다. "여러분은 이 책들을 일독으로 끝내는 것이 아니라, 세 번을 읽어야 합니다. 처음 읽을 때는 무슨 말인지 잘 모를 거에요. 두 번째 읽은 때는 이해하기 시작하겠죠. 그리고 마지막으로 읽을 때는 모든 것이 당연해 보일 것입니다."  이번 독서는 초벌로 훓어보는 걸로 만족하고 다음에 다시 한번 읽을 때 좀 더 자세히 읽어보도록 하겠다. 아직까지는 확실히 이해하기 어려운 부분들이 많으니까 말이다. 
 

 
이 책에서 가장 관심 있던 부분은 현업에 있는 전문가들의 인터뷰와 어떻게 공부해야 되는지 알려주는 부분이었다. 그리고 해당 단원의 중요도를 직군별로 구분하고 있다. 데이터 엔지니어, 데이터 애널리스트, 데이터 사이언티스트, 데이터 리서처, 시티즌 데이터 사이언티스트, 데이터 기획자 이렇게 6개의 직군으로 나누고 설명한다. 그리고 인터뷰까지 가미해서 앞서 말한 직군들의 특징들을 잘 나타내준다. 그리고 또한 어떤 공부를 해야 하는지도 제시해 준다. 예를 들어서 머신러닝 같은 경우 지도학습, 비지도학습 그리고 강화학습에 대해서 짚어준다. 그리고 마지막으로 취업은 어떻게 하는지도 알려준다. 세세하게 이력서와 면접은 어떻게 봐야 하는지 까지도 말이다. 다 읽고 나서 보면 진짜 책이 제목처럼 가이드북이라는 것을 깨달을 수 있다.
 

더보기

첫째마당. 빅데이터 세상

1. 빅데이터의 등장
01 쌓이는 데이터
02 연산 기술의 발전
03 데이터 개방과 융합

2. 기업의 변화
01 기존 기업의 전환
02 새로운 기업의 출현
03 미래 기업의 모습

3. 빅데이터 직무를 정의하는 이유
01 직무 공고 현황
02 직무 정의

4. 직무별 개관
01 직무별 한 줄 설명
02 직무별 직무기술서

5. 케이스 스터디
01 빅데이터팀 구성
02 데이터베이스 구축과 시각화 도구 도입
03 분석 환경 설계 및 구축
04 고객 이탈 예측 모델 개발

둘째마당. 빅데이터 직무

1. 데이터 엔지니어
01 데이터 엔지니어의 업무
02 성공 요소
03 데이터 엔지니어 인터뷰 1
04 데이터 엔지니어 인터뷰 2

2. 데이터 애널리스트
01 데이터 애널리스트의 업무
02 성공 요소
03 데이터 애널리스트 인터뷰 1
04 데이터 애널리스트 인터뷰 2

3. 데이터 사이언티스트
01 데이터 사이언티스트의 업무
02 성공 요소
03 데이터 사이언티스트 인터뷰 1
04 데이터 사이언티스트 인터뷰 2

4. 데이터 리서처
01 데이터 리서처의 업무
02 성공 요소
03 데이터 리서처 인터뷰 1
04 데이터 리서터 인터뷰 2

5. 시티즌 데이터 사이언티스트
01 시티즌 데이터 사이언티스트의 업무
02 시티즌 데이터 사이언티스트 인터뷰

6. 데이터 기획자
01 데이터 기획자의 업무
02 데이터 기획자 인터뷰(데이터 앙트레프레너)

셋째마당. 빅데이터 지식

1. 예비 빅데이터 전문가를 위한 지식
01 빅데이터 지식 마당 활용법
02 공부 자료 활용법

2. 빅데이터 프로젝트
01 문제 정의
02 데이터 수집 및 이해
03 데이터 분석과 모델링
04 배포 및 적용

3. 시각화
01 시각화의 유형
02 공부 자료

4. 데이터 분석 소프트웨어
01 이렇게 공부하세요
02 데이터 분석 소프트웨어

5. 웹 크롤링
01 웹 크롤링 기법
02 공부 자료

6. 프로그래밍
01 이렇게 공부하세요
02 프로그래밍 언어
03 자료 구조와 알고리즘
04 공부 자료

7. 수학 및 통계학
01 이렇게 공부하세요
02 수학
03 통계학
04 정보 이론
05 공부 자료

8. 머신러닝
01 이렇게 공부하세요
02 머신러닝
03 지도학습
04 지도학습 프로세스
05 지도학습 기법
06 비지도학습
07 비지도학습 프로세스
08 비지도학습 기법
09 강화학습
10 강화학습 프로세스
11 강화학습 기법
12 머신러닝 패키지
13 공부 자료

9. 데이터 파이프라인 및 클라우드
01 데이터 파이프라인
02 클라우드

넷째마당. 빅데이터 취업

1. 빅데이터 직업 시장
01 빅데이터 직업 시장에 참여하기
02 직무 정하기
03 산업 도메인 정하기
04 적합한 회사 찾기

2. 준비 활동
01 인턴십
02 연구 경험
03 데이터 분석 대회(공모전)
04 프로젝트 경험(개인 경험)
05 인사이트 도출 훈련
06 링크드인과 깃허브로 온라인 프로필 관리하기
07 헤드헌터와의 관계 관리하기

3. 취업 절차
01 국내 취업 절차 알아보기
02 해외 취업 절차 알아보기

 
이책은 IT와 관련 없는 일을 한다고 해도 유익한 책이다. 어쨌든 지평을 넓혀주는데 도움이 된다. (갑자기 삼천포지만 책에서 콜드메일이라는 단어도 처음 알게 되었다.)그리고 어떤 일을 하고 있던지 간에 시티즌 데이터 사이언티스트처럼 융합형 인재가 되지 못하리라는 법은 없지 않은가? 그런 의미로도 좋은 책이다. 약소한 관심으로 빅데이터에 관심을 가지고 있다가도 나중에 진심으로 전선에 뛰어들 때에도 가이드가 될 수 있는 책일 것 같다. 앞으로 나도 어떤 일을 할지 모르겠지만 여러 분야들을 알아두는 일은 유익하다. 어떻게 해서 좋아할지도 모르고 직무변경해서 이직할 수도 있을 테니 말이다.