본문 바로가기
데이터 관련/데분당태 챌린지

01. [데분당태 챌린지 2주차] 도메인 지식

by 준쓰_ 2023. 1. 15.

선 요약

  • 데이터분석에서 데이터분석 스킬도 중요하지만 더 중요한 것은 산업에 대한 도메인 지식
  • 도메인 지식을 쌓기 위한 다양한 방법을 소개
    • 도메인 지식이란?
    • 도메인 지식을 배우는 방법
    • 도메인 지식을 쌓는 법

https://www.linkedin.com/in/data-richard/

 

내용

[도메인 지식에 대하여]

데이터분석가라면 한번쯤은 느껴봤을 주제로 강의를 시작하시더군요.

취준생이었을 시절, 데이터분석에는 데이터분석 스킬이 가장 중요하고, EDA를 멋지게 하면 된다라고 생각했던 시절이 있었습니다. 때문에 '분석을 하자!' 라고 생각하고 분석을 시작하면 '왜?'라는 질문에 대해서는 항상 빼먹고 진행하곤 했습니다. 그러다보니 피상적으로 나온 결과에만 집착을 했습니다. 유명한 예시로 제가 자주 했던 실수를 설명해보겠습니다.

  • [1단계] 여름철 익사사고와 관련이 있는 요소들을 찾기 위해 여러 요소들의 상관관계를 분석한다.
  • [2단계] 아이스크림과 익사사고의 상관성을 매우 높은 것이 발견됐다.
  • [3단계] 아이스크림을 좋아하는 사람은 익사로 죽을 확률이 높다. (오류)

누가 봐도 이해가 가지 않는 분석 결과이고, 잘못된 분석이라는 것을 느낄 수 있습니다. 아이스크림과 익사사고의 공통점은 여름이라는 계절에 있는데, 단순히 상관관계를 뽑아내는 코드로만 보았을 때는 아이스크림이 익사사고와 관련이 있으니 이를 결론까지 가지고 가는 것이죠. 데이터분석을 처음 해보신 분들은 아마 한번쯤은 겪어보셨을 겁니다.

결국 데이터분석을 위해서라면 이러한 결과들이 왜 나타났는지에 대해 지속적으로 산업에 대해 탐구하고, 배경지식을 쌓아나가는 수밖에 없습니다. 그렇다면 도메인 지식을 어떻게 배워야 하는 걸까요? 취준생인 시절에는 방법도 모르고, 단순히 도메인 지식이 있어야 한다라는 현업자들의 말이 어려울 뿐이었습니다. '이렇게 해야 한다!' 라는 방향성도 없고, 도무지 어느 정도 수준이 도메인 지식이 필요한 건지도 몰랐습니다.

이제야 막 데이터분석에서 일하고 있는 저의 개인적인 경험을 말씀드리자면.. `나도 잘 모르겠다` 입니다.

결국 현업에 들어와서 데이터를 까보다보면 하나씩 하나씩 알게 되는 도메인 지식이 많습니다. 동일한 산업에서 1년 넘게 일해도 아직도 새로운 도메인 지식이 너무 많습니다. 이 분야에서 제가 얼마나 알고 있는지도 모르겠습니다. 이 분야에서 오래 계시면서 대단한 인사이트를 가지신 분들은 다를 수도 있겠지만, 제 입장에서는 그냥 `도메인 지식이 중요하다라는 것은 알겠다!` 정도인 것 같네요.

 

[도메인 지식을 배우는 방법]

데분당태 챌린지에서는 다양한 방법을 통해 도메인 지식을 쌓기를 추천하고 있습니다. 우선 배우는 방법과 정리된 사이트들을 제시해주셨습니다.

이와 같은 정리된 글을 보면 뭔가 조금씩 알아간다라는 느낌이 들긴 합니다만, 그래도 흔히 말하는 `네카라쿠배당토직야몰두센`을 가기에는 한참 부족한 느낌이죠. 뭔가 내가 가고 싶은 산업에 대해 전문적으로 도메인 지식을 쌓고 싶으신 분들이 있으실 겁니다. 때문에 데분당태 챌린지에서는 특정 회사를 준비한다면, 이렇게 도메인 지식을 쌓을 수 있다고 소개합니다.

 

[특정 분야에서 도메인 지식을 쌓는 법]

1) 관심있는 회사를 1개 선택하기

참고 페이지 : https://techcompanies.kr/

 

2) 회사의 주요 사업과 제품 조사하기 (예시)

    회사명 : 우아한 형제들

    주요 사업 : 배달 주문 서비스 + 상품 판매

    카테고리 : 유통/커머스 플랫폼

    비즈니스에 대한 질문 : 배달의 민족은 왜 [배달통]과 [요기요]를 제치고 1위가 될수 있었을까?

 

3) 관심있는 기업의 비즈니스 모델 캔버스 만들기

개인적으로는 하나하나 설명해주셔서 굉장히 듣기 편했던 강의였습니다. 이 글을 보시는 여러분들도 한번쯤 챌린지에 도전해보셨으면 좋을 것 같습니다.