나는 규모가 크지도 작지도 않은 회사에서 데이터 분석 업무를 맡고있다.
뭔가 데이터로 분석한다는 것에 굉장한 멋을 느꼈고, 대학원을 가면 좋다는 얘기에 데이터 사이언스학과를 졸업해 석사 학위를 받았다.
근데 석사학위때만 해도 데이터 분석에 대한 열망?열정? 이런 것들이 있었는데 막상 회사에서 실업무를 하다보면 그런 것들이 다 사라지는 것 같다.
지금 다니는 회사는 IT 업종이고 소프트웨어 개발 중심인 회사이다.
나름 여러 제품을 글로벌하게 서비스하고 있다. 그렇다보니 사업이나 마케팅과 같은 유관부서에서 분석 요청이 들어오는 경우도 많고 자체적으로 신사업에 대한 분석을 진행하기도 한다.
뭐 아무튼 여러 유관부서와 함께 일하면서 느꼈던 부분들을 주저리 주저리 풀어보려 한다.
1. 언어는 어떤걸 써야하나?
다 필요없다. SQL 위주로 공부하는 게 가장 중요하다.
물론 Python이나 R과 같은 언어도 어느정도 능숙하게 다룰 줄 알아야 한다. 하지만 그보다 SQL 쿼리 작성이 더 중요하다.
내가 학교에서 배울때 테이블은 크기도 작고 조그맣고 귀여웠는데 활용
회사에 있는 테이블은 크고 징그럽고 무섭다....
쿼리문을 통해서 어느 정도 회사 데이터에 익숙해진 후에 Python이나 R로 넘어가는게 좋을 것 같다.
R이 좋냐, Python이 좋냐라고 한다면 나는 Python이 더 낫다고 생각한다.
분석의 다양성에서 본다면 Python이 압도적이라고 생각한다.
자연어 처리 분석이나 이미지 분석을 진행하다보면 R보다 Python의 활용도가 훨씬 좋고 다른 사람들의 레퍼도 찾기 쉽다.
정리하자면,
우선 SQL에 능숙(익숙 ㄴㄴ)해지고 난 후에 Python이나 R로 넘어가는게 좋다.
R과 Python 중에서는 본인 업무가 다양한 데이터에 대한 분석인지에 따라 결정하는 게 좋을 것 같다.
2. 어디까지 설명해줘야 하나? -- 개인적인 생각입니다.
보통 분류 모델을 만들었을때 성능 평가로 F1 score를 사용할 때가 많다.
그리고 그 결과물 그대로 유관 부서에 설명해주는 사람들이 있는데, 그러면 안된다.
유관부서와 얘기하다보면 분산/표준편차 얘기만 나와도 질색하는 경우가 많은데 이런 자리에서 F1 score를 설명한다?
따라서 기초부터 차근 차근 보여주고 설명해주는 게 중요하다.
예를 들어 고객 이탈 예측 모델을 만들었다면, 모델이 어떤 부분을 가장 고려해서 분류해내는지 등을 설명해줘야한다.
우선 기존 유저들 가운데 이탈한 유저와 이탈하지 않은 유저를 비교해주고, 이탈한 유저들 대상으로 어떠한 유형들을 가지고 있는지 설명해주는 게 필요하다.
이럴 때 가장 중요한 스킬이 시각화이다.
생애주기에 따란 이탈 유형의 변화나, 구매 상품에 따른 이탈 유형(ex: 행사 제품만 사고 이탈하는 유형), 사용량에 따른 차이 등등을 보여주는 것이 필요하다.
이 부분이 분석보다 더 어려운 부분인것 같다.
많은 사람들이 결과물을 원하지만 생각했던 결과가 아니면 납득하지 못하는 경우가 많기 때문이다.
3. 소통이 가장 중요하다.
앞서 언급했듯이 유관부서의 경우 분석하는 사람들처럼 지표에 익숙하지 않다.
하지만 그들에겐 그들만의 노하우와 감각이 있다.
만화 킹덤을 보면 지략형과 본능형 무장에 대한 얘기가 나오는데, 지략형의 말 그대로 미리 전술을 짜서 전쟁에 임하는 반면에 본능형은 그때 그때 작은 낌새에 맞춰 대응하면서 빈틈을 찌르는 형이다.
분석가가 지략형이라면 유관 부서의 담당자는 본능형이라 볼 수 있다.
분석가는 가설을 설정하고 많은 양의 데이터를 바탕으로 인사이트를 도출해내는 반면에 담당자들은 주요 지표들을 통해서 로드맵을 세우는 느낌이다.(개인적인 느낌이다.)
개인적으로 분석결과를 공유하는 자리는 내 결과를 발표하는 게 아니라 해당 주제에 대한 토의하는 자리라고 생각하는 게 좋을 것 같다
나는 이 일을 한지 3년이 되어가는 데 아직도 이 부분이 제일 어렵다...
데이터 분석을 하다보면 내가 가졌던 편견이 많이 깨지는 경우도 많았다.
신기하고 재밌는 일... 하지만
데이터 분석 하기 싫다.
모델을 만들기 위한 분석도... 다 힘들다...
혹여나 이 일을 하고 싶은 분들....힘내요..
'Daily' 카테고리의 다른 글
[Python] 파이썬 책 추천(깔끔한 파이썬 탄탄한 백엔드) (0) | 2020.10.10 |
---|---|
[군산여행] 2박 3일 군산 식도락 여행 - 카페 & 맛집 (0) | 2020.08.05 |
[군산여행] 2박3일 군산 여행기 - 숙소 편 (0) | 2020.08.05 |
[자취방 가죽공예] 인센스 홀더 만들기 준비중 (0) | 2020.03.31 |
[Study] 아파트 호재 분석(2020-03-07) (0) | 2020.03.07 |
댓글