Data Science가 되기 위한 8단계

How-to-become-a-data-scientist

 

Source: datacamp

개인적으로 작년 말 phd를 준비하며 data scientist에 대한 관심이 생겼다. 본래 웹을 다루며 내가 하고자 했던 일들이 사용자의 흐름을 분석하고, 그들에게 보다 나은 제안을 하자는 취지였는데 이를 위해서는 사실 사용자에 대한 분석이 필수적으로 들어가야 한다.

내 개인적인 커리어 패스를 보면, 웹디자인->기초플밍(C,C++,Java)->웹(php,jsp,ruby)플밍+DB(mysql,oracle등 rdb위주) 실무->HCI및 각종 CS subjects 에서 이제 막 최신 기술동향들, 예로 Cloud Computing, ML, Big Data, Data Mining등 이런 부분으로 넘어간 실정이다. 내가 재밌어하고, 특이한 웹서비스를 만들자는 것이 내 가장 큰 취지이고 더 broad한 웹개발자가 되자는 내 방향에 맞는 부분이다.

하지만 Scientists라는 것이 약간 부담으로 느껴지기도 한다. 허나 이미 CS의 학문적인 길로, 앞으로의 최소 5년간을 투자하기로 마음먹은 이상, Data Scientists + Human-centered Interaction에 대한 관심이야 무궁무진하고.. 이것을 5년간 공부할 수 있다는 사실이 무척 기대대고 설래이기도 한다.

스크린샷 2015-01-13 오전 5.44.34

특히 이 영역적인 측면으로 보면, 내가 부족한 부분을 확실히 알 수 있다. 솔직히 substantive expertise는 나름 충족했다. 물론 많은 실무선배님들 앞에서 할 소리는 아니지만, 금융권/공공기관/대기업/중소기업/대학 등의 사이트를 5년간 다루면서 실무의 데이터의 흐름 및 사용에 대해 감지했다. Hacking Skills에 있어서도, 최소한 RDB는 나름 깊게 이해를 했고 NoSQL은 살짝 경험만 있으니 아직은 부족한 실정이라고 할 수 있다.

가장 중요한 것은 Math and Statistics인데, 작년말에 확률 및 통계를 건성으로 들은 감도 있고 수학에 있어서는 솔직히 놓고 살았다. 수학을 한다는 자체가 내겐 실무를 내려놓는 느낌이었으니깐..

약간 이 Infographics를 보며, 나는 내게 부족한 부분을 확연히 느낄 수 있었다. 내 성적을 봐도, 실질적인 스킬을 봐도 수학적인 부분은 상당히 비루하기 그지없다. 결국 2015년 상반기에는 수학적 지식을 늘려야 다른 깊이있는 과목을 접할 수 있는 능력이 생긴다는 것. 더 열심히 공부해야 할 필요성을 느낀다.