본 게시글은 아래의 글을 바탕으로 작성되었습니다.
데이터 분석가가 되어보니 중요한 것들 | 요즘IT
개발자, 디자이너, 기획자, HR, 오퍼레이션 등 대부분의 직무에서 우리가 일하기 전 예상했던 업무와 실제 업무에는 차이점이 존재합니다. 비즈니스는 빠르게 변화하기 때문에, 학생 때 배운 교
yozm.wishket.com
데이터 분석가란
'데이터에 기반해 성공 확률이 높은 의사결정을 지속적으로 하도록 돕는 사람'
데이터 분석가에게 중요한 세 가지
1. 데이터 기반
- 주요 업무 : 데이터에 기반한 의견을 내는 것
데이터가 흐르는 조직
- 피라미드의 아래 단계가 조직 내에서 충족되지 않으면, 위 단계의 내용으로 기여할 수 없다.
- 아래층일수록 달성했을 때, 비즈니스 임팩트가 더 크다.
1단계 : 데이터가 흐르는 조직
- 실무자가 필요한 데이터가 있을 때 쉽게 데이터를 확인할 수 있고, 주요 지표가 어떻게 진행되는지 알고 있다 -> 데이터가 잘 흐른다고 볼 수 있다.
- 만약 담당 업무에 대한 데이터를 알기 어렵거나, 알 수는 있으나 잘 확인하지 않고 있다면 2~3단계의 업무는 무의미하다.
결국, 데이터가 잘 흐르는 조직을 만들기 위해선, 데이터를 쉽게 확인할 수 있고, 주요 지표를 잘 인지하게 만드는 노력 필요
조직 내에서 데이터를 쉽게 확인하기 위해서는 BI 툴 도입, 대시보드 개발, SQL 교육, 사용하기 쉬운 데이터 마트 개발, PA 툴 활용, 알림봇 개발 등 다양한 방법 존재
✅ BI 툴 도입 -> 여러 대시보드가 만들어짐
- 초기에는 봐야할 지표가 많지 않아, 여러 지표를 한 대시보드에 표현하는 것이 중요할 수 있다.
- 이후 지표가 많아지면, 지표를 잘 찾을 수 있도록 설계하는 과정도 필요하다.
- 카테고리별로 분류, 중요도를 시각적으로 표현한다면 지표를 찾기 훨씬 수월해진다.
- 또한, 사용자를 분석할 수 있는 필터 제공 (성별, 멤버십 가입 여부 등의 측정 기준)
✅ SQL 교육 및 데이터 마트
1) 데이터가 흐르는 조직을 표방하기 위해 비데이터 직군 구성원도 SQL을 사용할 수 있도록 교육 진행.
-> 단순 쿼리 요청을 줄여주고, 데이터가 어떤 형태로 존재하는지 직접 파악할 수 있어, 내용이 구체화되고 깊이 있는 분석이 가능해진다.
2) SQL 문법 숙지보단, 어떤 데이터가 어디에 쌓이고, 어떤 히스토리가 있는지 교육하기 어렵다. 실제로 어디에 원하는 데이터가 있는지 몰라 데이터를 사용하지 못하는 경우도 많다.
-> 미리 문서화 후, 여러 데이터를 모아 목적에 따라 가공한 데이터 마트를 만들어, 원천 데이터가 아닌 데이터 마트를 사용하도록 유도하기
3) 데이터를 여러 사람이 사용하게 되면서 각자 지표 정의와 구현법이 다르다.
-> 최근에는 지표를 통합된 기준으로 관리하는 '메트릭 스토어'를 도입하는 회사도 늘어나는 추세 (콴다)
✅ 주요 지표 인지하기
데이터가 잘 흐르지 않는 조직에서는 가볍게 상황을 요약하는 리포트를 꾸준히 공유하는 것이 도움이 된다. (EX. 매출은 어느 정도 규모로 나오는지, 거래가 얼마나 발생하는지 등)
리포트 형태로 제공할 때, 결과 지표만 공유하지 않고 다음의 내용을 추가하면 주요 지표를 더 확고하게 인지시킬 수 있다
- 결과 지표 추이를 통해 예상되는 미래 상황과 목표를 고려했을 때 얼마나 잘하고 있는지 알려준다.
- 결과 지표에 선행하는 것으로 보이는 지표를 소개한다.
- 최근 액션에 대응하는 결과를 볼 수 있는 지표가 무엇인지, 현재 상황이 어떠한지 소개한다.
지표마다 특정 구성원에게 오너십을 부여하는 것도 하나의 방법
-> 특정 지표에 오너십을 가진 사람을 '메트릭 오너(Metric Owner)'라고 하는데, 각자 담당 지표가 생기면 그 성과가 곧 본인의 성과이기 때문에 잘 이해되고, 지표에 변화가 생길 때 관련된 주요 지표뿐만 아니라 관련 지표까지도 파악하기 위해 노력하게 된다.
2. 성공 확률이 높은 의사결정
데이터 분석가는 조직이 성공 확률이 높은 의사결정을 하도록 기여해야 한다.
✅ 상황을 정확하게 해석하기
- 데이터 분석가는 여러 지표를 적절히 조합하고 분석하여 편항되지 않게 해석하고 상황을 진단하는 사람이어야 한다.
이때 상황에 대한 해석을 업데이트하고, 왜 이렇게 해석했는지 이유를 알리는 것이 필요하다.
- 도메인 지식을 지속적으로 기르기
* 도메인 지식 : 회사가 속한 산업, 상품, 서비스에 대한 지식
생각의 프레임워크를 사실에 가깝게 구성하기 위해 도메인 지식이 필요하다. 이는 작업 시간을 줄여주고, 커뮤니케이션을 명확하게 하며, 제대로 된 해석이 이뤄질 수 있게 도와준다.
✅ 목표 설정과 성과 측정
목표 설정하기
목표치 : 예상치에 구조화된 로직이 있을 때 그 로직을 구성하는 수치를 기대치와 의지치를 이용해 변경한 값
1) 구조화된 로직에 과거 데이터를 활용한 예상치
2) 새로운 액션에 대한 확신 수준, 시장이나 경쟁사 상황, 불확실성을 반영한 기대치
3) 의지치
EX) "예상 매출 = 예상 방문자 수 * 구매 전환율 * 객단가" (구조화된 로직)
- 현재 방문자 수가 1만 명이지만, 연말 특수로 전년도 트렌트를 반영하면 3만 명이 예상된다. 여기에 올해는 마케팅을 좀 더 효율화해서 1만 명이 더 들어오게 될 것이다. (예상 방문자 수: 4만 명)
- 할인 쿠폰 이벤트를 할 때 구매전환율이 2배 정도 올랐으니, 구매 전환율을 4%에서 8%로 높이고 연말 특수로 2% p 오르기를 기대한다. (예상 구매 전환율: 10%)
- 객단가는 5만 원으로 동일할 것으로 예상된다. (예상 객단가: 5만 원)
따라서 예상 매출 목표는 2억 원이라고 설정할 수 있다.
목표 설정은 현실적이지만, 조금 어려운 수준에서 공동의 목표를 만들고 구성원들의 몰입을 이끌어내는 것이 중요하다.
성과 측정하기
성과를 축적하고 조직에 기여하기 위한 액션도 중요하지만, 이 중에서 좋은 성과를 가려내기 위해 잘 측정하는 것도 필요하다.
가장 보편적으로 사용되는 성과 측정 방법 : '해당 시기 이후로 지표가 어떻게 변했는지 확인'
EX) ‘공유하기 버튼의 UI 변경으로, 공유 비율이 이전 평균 3% 수준에서 5% 수준으로 변해서 2% p의 성과가 있었다.’ 같은 형태
통제할 수 없는 외부 요인까지 반영하기 위해 A/B 테스트 진행
* A/B 테스트 : 무작위로 할당된 그룹 간 지표 차이를 통해 성과를 측정하는 것
외부 요인으로 인한 지표 변화는 모든 실험 그룹에 공통되기 때문에, 실험을 통한 성과 측정에 영향을 주지 않는다.
3. 지속성
지속성을 위해 비즈니스 사이클에 맞게 분석해야 한다.
1. 분석 주제가 현재 회사에 집중하는 것과 다르면 안 된다.
2. 분석 주제의 결과물이 비즈니스 사이클에서 필요한 적절한 것이어야 한다.
✅ 비즈니스 사이클
- 기회 발굴, 아이디어 수집, 정책 설계 등의 플래닝
- 플래닝의 결과 실행 및 배포
- 성과 측정 및 후속 분석
데이터 분석가 역시 비즈니스 사이클에 맞게
- 플래닝 시기에는 기회 발굴을 위한 탐색적 분석과 데이터 및 성과 측정 방법 설계
- 실행 및 배포 시기에는 데이터 확인과 대시보드 관리
- 성과 측정 및 추가 데이터 분석을 통해 인사이트를 뽑고 다시 플래닝에 반영할 것이 있을지 확인