본문 바로가기
Analysis Tips

실제 데이터 분석가들은 어떤 일을 할까?

by dovah. 2023. 8. 20.
반응형

최근 독일 여행도 다녀오고, 여기저거 이력서를 내면서 정신이 없었다.

면접 준비나 과제도 다 끝난 건 아니지만 그래도 생각도 정리할겸 적어보려 한다.

 

데이터 분석가로 경력을 쌓은 지 만 6년이 다 되어가지만,

회사마다 분석가에게 기대하는 역량이나 업무는 너무 천차 만별이다.

요샌 분석가도 데이터 분석가, 프로덕트 분석가, 비즈니스 분석가 등 세분화되어있어,

내가 어떤 분석가인지 조차 구분하기 어렵다.

 

여기선 내가 진행해왔던 업무들 위주로 정리할 예정인데,

나는 굳이 따지자면 프로덕트 분석가에 가까운 것 같다.

 

1. 외부 데이터 수집(크롤링, API)

외부 데이터의 경우 게임회사에 근무할 때 많이 진행했었다.

주로 디지털 마케팅 관련 데이터였다.

디지털 마케팅의 경우 하나의 매체만 사용하는 것이 아니라 여러 매체를 사용하는데, 이게 또 글로벌 게임인 경우에는 국가별로 사용하는 매체가 다른 경우가 많다.

매체가 다르기 때문에 디지털 마케팅의 현황이나 분석을 하기 위해선 각각의 매체에서 기간별 데이터를 받아야한다.

이게 말로는 쉬운데, 각 매체마다 제공하는 항목도 다르고 단어도 다르기 때문에 꽤나 손이 많이 간다.

그래서 크롤러를 통해서 매일 매일 매체별 마케팅 비용이나 설치, 클릭, 노출 등의 데이터를 수집했고, 이를 자동화하고 시각화하는 것까지 진행했었다.

 

지금 생각해보면 백엔드나 엔지니어가 하면 더 쉽고 빠르게 되었겠지만,

해당 매체를 언제까지 사용할지 정확하지 않고, 지금 당장 데이터가 필요해 내가 진행했었다.

 

이렇게만 보면 "니가 했던 업무지 분석가가 할일은 아니자나?" 할 수 있는데, 

맞다.

내가 했던 일이고 남들은 안했던 경험일 수도 있다.

그치만 분석가가 이런 업무들까지 자동화할 줄 안다면 분석의 바운더리가 더 넓어진다.

 

나는 처음에는 비용관련 데이터만 모았는데,

나중에는 각 스토어별 설치 데이터를 받아 비용외에도 국가별 설치전환율을 확인하거나 출시예정 게임들만 따로 모아 경쟁 게임에 대한 정보도 수집하기도 했었다.

그리고 나중엔 센서타워 API를 연결해 SEO 최적화 분석까지 이어나갔다.

 

분명 시작은 디지털 마케팅 비용만을 위한 것이었는데 어느순간 리포트의 범위가 굉장히 넓어졌다.

 

 

2. 리포트 자동화(를 위한 데이터 적재 및 로그 기획)

사실 리포트 자동화를 업무라고 하기엔 좀 그렇다.

처음 입사할 때는 지금처럼 태블로를 많이 사용하지 않아서 엑셀을 많이 사용했는데,

이젠 태블로 서버에 올리면 자동으로 다 업데이트를 해준다.

 

그래서 리포트 자동화에서 가장 중요한 것은 데이터 배치와 로그 기획일 것인가이다.

데이터를 적재 주기를 언제로 하고, 어떤 항목들에 대해서 적재할 것인가?

한 로그를 어떻게 정의하고 여기에 필요한 데이터를 어떻게 녹여낼 것인가?

그리고 이걸 실패없이 어떻게 자동화해 안정적인 리포팅 서비스를 만들것인지가 중요하다.

 

전회사에선 hive 스케쥴링을 통해서 postgresql에 바로 적재하는 형태로 했었는데, 가장 골치 아팠던게,

어떻게 앱로그를 구성해야 하는가 였다.

 

그렇다.

제목은 리포트 자동화지만 실제는 데이터 적재 자동화에 가깝다.

 

실제 리포트를 만들면서도 데이터를 쪼개거나 성과를 측정할 때,

로그 기획이 정확하지 않으면 간단한 업무임에도 절대 쉽게 끝나지 않을 것이다.

 

3. 서비스 로직 구현 및 개선

이 부분은 사실 데이터 사이언티스트와 겹치는 부분일 수도 있다고 생각한다.

내가 생각하는 분석가와 사이언티스트의 가장 큰 차이는 실제 서비스에 반영여부이다.

데이터 사이언티스트는 실제 알고리즘을 구현하고 이를 서비스에 반영시켜 서비스의 개선을 직접 이끈다면

데이터 분석가는 이와 달리 서비스에서 나타나는 주요 문제점들을 파악하고 이를 해결할 수 있는 방은 제시하면서 서비스의 개선을 간접적으로 이끈다.

(물론, 이 부분은 내 생각이고 앞서 언급했던 것처럼 나는 프로덕트 분석가에 가깝기 때문에 이렇게 표현했다.)

 

그치만 저런 업무 분류는 데이터 사이언티스트도 있고, 분석가도 있는 회사에서나 구별되는 차이점이다.

보통에선 데이터 분석가가 다 해야하는 업무이다.

 

그렇기 때문에 서비스 로직을 개선하기 위한 데이터 분석, 해당 콘텐츠를 얼마나 잘 이용하고 있는지, 목적에 부합하는지, 사업에는 기여하는 지등을 분석하고 도출되는 결과를 통해 로직의 개선안을 제시해줘야한다.

예를들어 추천 시스템의 경우 지금까진 ctr이 높은 상품을 추천했으나, 실제 구매하는 유저들의 행동패턴을 보면 ctr보다 재방문율을 활용한 로직이 더 효과적일 것이다. 그렇기 때문에 재방문율을 중심으로 블라블라 ~ 와 같이 말이다.

 

4. 원인 분석

앞서서 얘기했던 모든 내용들은 이 업무를 위한 것이다.

 

왜 유저는 이탈할까?

왜 재구매가 발생하지 않을까?

왜 신규 유저의 이탈율이 더 높을까?.. 등 서비스에 대한 분석을 하다보면 다양한 이슈가 나타난다.

 

내부 데이터만으로 해결이 가능한 경우가 있고, 그렇지 않은 경우가 있다.

그렇지 않을 때, 외부 데이터로 보완할 수 있는지 검토하고 이를 지속적으로 활용할 수 있어야한다.

 

분석에서 제일 중요한 건 원인으로 예상되는 요소들을 하나씩 제거하는 것이 중요하다고 생각한다.

그리고 그 자리를 개선으로 이어질 수 있는 예상 요소들을 만들어가는게 서비스의 개선과 분석 업무의 높은 효율로 이어질 것이다.

 

 

 

다소 급하게 마무리하는 감이 없지 않은데,

앞서 했던 얘기를 다시 또 하긴 좀 그래서,,,,

아무튼 실제 분석 업무는 더 다양하다. 생각치도 못했던 업무들도 했었는데 너무 보편적이지 않은 업무니 그런 것들은 제외했다.

반응형

댓글