본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬
통계의 기초

경영 의사 결정을 위한 가설 검정 - Part 1

by 아참형인간 2026. 5. 9.

처음 가는 식당에서는 보통 가장 인기 있는 메뉴를 선택합니다. 메뉴에 대한 사전 지식이 없기 때문에, 가장 인기 있는 요리가 우리에게도 가장 만족스러울 것이라고 가정하는 것이죠. 이러한 가정은 ‘가설’입니다. 즉, 결과에 대한 검증 가능한 추측을 의미합니다.

비즈니스 세계도 마찬가지입니다. 하지만 일상에서 흔히 하는 ‘만약 ~하면 ~할 것이다’ 식의 사고와 달리, 조직 내에서의 가설 검정은 보다 체계적이고 데이터 기반의 과정을 따릅니다. 과학과 경영학 교과서에서 배우는 많은 원칙들이 바로 이러한 접근 방식에 기반을 두고 있습니다.

오늘날의 데이터 중심 환경에서 기업들은 직관보다는 증거를 바탕으로 전략적 결정을 내리기 위해 가설 검증을 활용합니다. 이 블로그에서는 가설 검증이 무엇인지, 그리고 실제 비즈니스 상황에서 이를 어떻게 적용할 수 있는지 자세히 살펴보겠습니다.

 

가설 검정이란 무엇일까요?

먼저 ‘가설’이라는 단어부터 살펴보겠습니다. 고등학교 과학 시간에 ‘근거 있는 추측’이라는 뜻으로 배웠을 것입니다. 만약 특정 웹 레이아웃이 기부 페이지의 가입률을 높인다는 가설을 세운다면, 이를 뒷받침할 데이터가 필요합니다.

하지만 데이터를 표본 추출하여 막대 그래프에서 레이아웃 B의 가입률이 레이아웃 A보다 높다는 결과가 나왔다고 해도, 이 데이터가 가설과 통계적으로 유의미한 상관관계가 있는지 검증해야 합니다. 이는 우리가 표본으로 추출한 방문자 집단이 단순히 운이 좋았을 수도 있기 때문에 매우 중요합니다.

연구 및 데이터 과학에 충분한 예산을 가진 기업들은 가설 검정을 통해 비즈니스 의사결정을 내립니다. 한편, 과학자와 통계학자들은 연구 과정에서 항상 가설 검정을 활용합니다.

이는 가설 검정이 과학적 방법론의 핵심 요소이기 때문이며, 과학적 방법론은 데이터로 설명할 수 있는 거의 모든 것을 이해하는 우리의 방식입니다. '데이터 과학(data science)'이라는 용어에 '과학(science)'이 포함된 것은 결코 우연이 아닙니다.

 

표본 대 모집단

우리는 대상 모집단에 대한 가설을 세우고자 합니다. 하지만 안타깝게도 전체 모집단을 분석하는 것은 비용과 시간이 많이 소요되는 경우가 많습니다. 그렇기 때문에 연구자들은 모집단에 대한 정보를 추론하기 위해 무작위 표본을 활용합니다.

아래는 50명의 모집단에서 추출한 10명의 무작위 표본을 나타낸 도표입니다. 표본의 편향을 피하기 위해 무작위 추출이 사용됩니다.

 

우리는 무작위 표본이 모집단을 잘 대표하도록 합니다. 예를 들어, 가설의 대상이 성인 여성 고객이라면, 표본에 포함된 각 개인은 반드시 성인 여성 고객이어야 합니다.

여기서 ‘모집단’이란 반드시 한 국가의 인구를 의미하는 것은 아닙니다. 대신, 유사한 특성을 공유하는 개인이나 집단의 집합을 의미합니다.

예를 들어, 모집단은 전 세계 모든 구글 직원이나 전 세계에 유통되는 500mL 코카콜라 음료 전체일 수 있습니다.

 

‘주장’이란?

우리의 주장은 모집단의 매개변수 값이나 확률 분포의 형태와 관련이 있습니다. 하지만 이 글에서는 비즈니스 맥락에서의 매개변수에 초점을 맞출 것입니다.

매개변수에는 구글 직원의 이직률(즉, 퇴사하고 대체되는 직원의 비율)과 같은 비율이나, 500mL 코카콜라 음료의 평균 매출액과 같은 평균값이 포함될 수 있습니다.

또한 매개변수에는 중앙값, 분산, 상관관계 등이 포함됩니다.

가설은 다음과 같을 수 있습니다. "필리핀 내 구글 직원의 이직률은 전 세계 평균 이직률보다 낮은가?" 여기서 표본은 필리핀에 근무하는 구글 직원들입니다.

 

귀무가설 대 대립가설

가설 검정은 귀무가설(Ho)과 대립가설(Ha) 사이의 확률적 대결입니다.

대립가설은 대상 모집단에 대한 우리의 주장인 반면, 그 정반대가 귀무가설입니다. 예를 들어:

 

귀무가설(Ho): 필리핀 구글 직원의 이직률은 전 세계 평균 이직률(전 세계 평균 이직률을 약 13%라고 가정하자)보다 낮지 않다. 기호로 나타내면, 여기서 p는 비율을 나타내며 다음과 같이 표기한다:

 

 

대립가설(Ha): 필리핀 구글 직원의 이직률은 전 세계 평균 이직률보다 낮다. 기호로 나타내면:

 

가설 검정은 표본 데이터를 통해 귀무가설을 기각할 수 있는지 여부를 판단하는 것이다.

원칙적으로 우리는 대립가설이 참임을 증명할 수 없으며, 단지 귀무가설에 대항하여 우리의 주장을 통계적으로 유의미하게 뒷받침할 수 있는지 여부를 결론지을 수 있을 뿐이다.

지식을 추구하는 과정에서 귀무가설은 우위를 점한다. 대립되는 증거가 없는 한, Ho는 기각될 수 없기 때문이다.

이 개념을 흔히 “현상 유지의 폭정(tyranny of the status quo)”이라고 부릅니다. 그리고 현상 유지는 ‘참’이 아닌 진술입니다.

 

<출처: https://medium.com/data-science-collective/introduction-to-hypothesis-testing-for-business-decision-making-fa4a3cad755f>

댓글