마케팅 사례를 통한 기본 로그 계산
로그에서 몇 가지 규칙은 자주 등장하므로 알아두면 좋습니다. 간단히 설명하겠습니다. 이 규칙들을 외울 필요는 없습니다. 실제 문제에서 이 규칙 중 하나를 접했을 때 어떤 원리가 작용하는지 파악할 수만 있으면 됩니다.
로그는 곱셈을 덧셈으로 바꿈
이것이 바로 슬라이드 룰이 작동하게 만든 원리입니다. log(a × b) = log(a) + log(b). 캠페인 비용이 두 배로 늘고 전환율도 두 배로 늘어난다면, 총 전환 수는 4배가 되지만 로그 척도에서는 단순히 두 개의 동일한 덧셈으로 나타납니다. 이것이 바로 로그 변환이 곱셈 관계를 덧셈 관계로 바꾸는 이유이기도 합니다.
로그는 나눗셈을 뺄셈으로 변환
log(a / b) = log(a) − log(b)입니다. 광고 투자 수익률(ROAS)과 같은 비율의 대수함수를 구하면, 이를 분자의 대수함수에서 분모의 대수함수를 뺀 형태로 분해할 수 있습니다. 분석가들은 특히 기간이나 채널 간 성과를 비교할 때, 원시 비율보다는 대수 비율을 사용하는 경우가 많습니다.
로그는 지수를 곱셈으로 변환
log(a^n) = n × log(a)입니다. 고객 기반이 매년 20%씩 증가한다면, 5년 후에는 1.20⁵배로 늘어납니다. 이에 대해 로그를 구하면 5 × log(1.20)이 되는데, 이는 로그 눈금에서 5개의 동일한 단계에 해당합니다. 이것이 바로 복리 성장을 로그 축으로 그래프에 표시했을 때 선형적으로 보이게 하는 법칙입니다. 또한 이는 수많은 금융 수학의 배후에 있는 법칙이기도 합니다.
1의 로그 값은 0입니다.
0의 로그 값은 음의 무한대입니다. 데이터에서 0의 로그를 구하려고 하면 소프트웨어가 오류를 발생시키거나 음의 무한대를 반환하게 되며, 이로 인해 구축 중이던 모델이나 차트가 깨지게 됩니다. 이것이 바로 분석가들이 0이 포함된 데이터의 로그를 구하기 전에 종종 작은 상수를 더하는 이유이며, 이는 log(x + 1)로 표기됩니다.

위 그림에 제시된 로그 산술의 네 가지 법칙이 그 기초가 됩니다. 다음은 여러분이 마케팅 현장에서 마주칠 수 있는 상황에서 각 법칙이 어떻게 적용되는지 보여주는 예시입니다:
- 규모가 매우 다른 두 캠페인을 비교
두 캠페인의 매출은 각각 1,200달러와 48,000달러였습니다. 이 비율은 40 대 1입니다. Log₁₀(1,200) ≈ 3.08, Log₁₀(48,000) ≈ 4.68입니다. 1.6이라는 차이는 두 번째 캠페인이 약 10¹·⁶ ≈ 40배 더 컸음을 의미합니다. 로그 척도에서 40배의 차이는 단지 1.6 단위의 거리일 뿐이므로, 로그 차트는 규모가 크게 다른 캠페인들을 서로 가려지지 않게 표시할 수 있습니다.
- 광고 투자 수익률(ROAS) 분해.
분석가들은 (지출 규모가 작을 때 불안정할 수 있는) 원시 ROAS(Return on Ad Spend, 광고 수익률) 값을 다루는 대신, 종종 log(ROAS) = log(매출) − log(지출)을 살펴봅니다. 각 구성 요소를 별도로 분석할 수 있으며, 이 수학적 방식은 극단적인 상황에서 더 안정적으로 작동합니다.
- 복합 성장 모델링.
5년 동안 매년 20%씩 성장하는 고객 기반은 1.20⁵ ≈ 2.49배로 증가합니다. 로그를 사용하면 이 계산이 곱셈이 아닌 덧셈(5 × log(1.20))이 되며, 그래프로 표시했을 때 성장 패턴이 선형으로 보입니다.
- 로그 변환된 데이터의 0 처리.
회귀 분석을 위해 지출, 트래픽 또는 매출 데이터를 로그 변환할 때, 0 값이 있으면 변환이 깨집니다. 로그를 취하기 전에 1을 더하는 것(log(x + 1))이 표준적인 해결 방법입니다. 이는 일반적인 방법이지만 자동으로 적용되는 것은 아닙니다. 추가된 상수는 데이터의 규모에 비추어 타당해야 하며, 해석도 약간 달라집니다. 로그 변환을 사용하는 대부분의 마케팅 분석 워크플로에서는 이 과정을 자동으로 처리합니다.
보시다시피, 로그에 적용되는 수학 법칙은 그리 어렵지 않습니다. 마케팅 분야에서 로그를 접하게 되는 이유는 마케팅 데이터가 곱셈, 나눗셈, 성장률과 같은 개념을 자주 다루기 때문입니다. 로그는 이러한 일반적인 마케팅 패턴을 더 쉽게 다룰 수 있게 해주는 수학적 도구일 뿐입니다.
마케팅 분석에서 로그 함수가 활용되는 분야
마케팅 분석에서 로그 함수는 주로 차트, 회귀 모델 내부, 모델 간 비교 지표의 세 가지 특정 영역에서 등장합니다. 이 세 가지 모두는 소수의 동일한 규칙을 각기 다른 방식으로 적용한 것입니다.
그래프에서의 로그 척도
Y축의 눈금이 1, 10, 100, 1,000, 10,000으로 표시되어 있고 각 눈금 사이의 간격이 모두 같은 그래프를 본 적이 있다면, 그것은 로그 척도입니다. 축을 따라 한 단계 올라갈 때마다 이는 덧셈이 아닌 곱셈을 의미합니다.
로그 척도는 두 가지 구체적인 이유로 유용합니다.
첫째, 로그 눈금은 여러 차원의 범위를 아우르는 데이터를 압축해 보여줍니다. 100명에서 1,000만 명에 이르는 기업별 고객 수를 그래프로 나타낼 때, 선형 눈금을 사용하면 작은 기업은 하단에 평평한 선처럼 보이고 큰 기업이 상단을 독차지하게 됩니다. 반면 로그 눈금은 각 차원의 범위에 동일한 시각적 공간을 할당하므로, 모든 수준에서 어떤 변화가 일어나고 있는지 실제로 확인할 수 있습니다.
둘째, 로그 눈금은 백분율 변화를 시각적으로 일관되게 보여줍니다. 선형 차트에서는 100에서 200으로의 급증이 10,000에서 20,000으로의 급증보다 훨씬 작아 보이지만, 둘 다 100% 증가라는 점은 동일합니다. 대수 척도에서는 두 증가폭이 동일한 배수적 변화를 나타내므로, 수직 거리도 동일하게 표시됩니다. 이것이 바로 금융 분석가들이 장기 주식 차트에 거의 항상 대수 척도를 사용하는 이유입니다. 또한 역학자들이 코로나19 확진자 수를 나타낼 때 대수 척도를 사용한 이유이기도 합니다. 성장세가 지수적으로 나타날 때, 대수 척도는 곡선을 직선으로 바꾸며, 기울기는 성장률을 알려줍니다.

마케팅 분야에서는 바이럴 성장 곡선, 고객 확보 곡선, 규모가 현저히 다른 채널 간 광고 지출 비교, 그리고 규모가 크게 다른 기업이나 캠페인 간의 성과를 비교할 때 이러한 문제가 자주 발생합니다. 이런 경우 실무에서는 데이터의 범위가 대략 한 자릿수 범위 내에 있을 때는 선형 척도를 사용하고, 데이터가 두 자릿수 이상에 걸쳐 있거나 절대적인 변화보다 백분율 변화를 더 중요하게 여길 때는 로그 척도를 사용하십시오.
회귀 분석에서의 로그 변환
마케팅 분석에서 회귀 모델을 추정할 때, 표준 선형 회귀가 가정하는 방식대로 움직이지 않는 변수들을 다루는 경우가 많습니다. 매출은 비정상 분포를 보입니다. 광고비는 한계 효용이 감소합니다. 고객 생애 가치는 긴 우측 꼬리를 가집니다. 이러한 데이터에 단순한 선형 회귀를 적용하면 모델 적합도가 떨어지고 예측 정확도도 낮아지는 경향이 있습니다.
로그 변환은 이러한 여러 문제를 한 번에 해결하는 데 종종 도움이 됩니다.
로그 변환은 곱셈적 관계를 덧셈적 관계로 바꿔줍니다.
만약 모델이 실제로 “매출 = 기준치 × 미디어 효과 × 계절성 효과 × 가격 효과”라고 표현한다면, 이는 곱셈적 모델입니다. 양변에 로그를 취하면 덧셈적 모델이 됩니다. log(매출) = log(기준치) + log(미디어 효과) + log(계절성) + log(가격). 이제 표준 선형 회귀 분석으로 모델링할 수 있습니다.
비대칭 분포를 처리합니다.
매출, 지출, 트래픽은 대개 우측 편향 분포를 보이는데, 이는 소수의 큰 값들이 분포를 오른쪽 끝으로 크게 끌어당긴다는 의미입니다. 로그 변환을 적용하면 우측 꼬리가 압축되고 분포가 종 모양에 가까워지는데, 이는 대부분의 회귀 모델이 가정하는 형태입니다.
자연스러운 수익의 법칙(diminishing returns)을 반영합니다.
회귀 분석에 광고비를 투입하기 전에 로그 변환을 적용하면, 모델은 광고비를 두 배로 늘렸을 때 효과가 두 배가 되는 것이 아니라 일정한 추가 효과만 발생한다고 암시합니다. 이는 실제 캠페인에서 관찰되는 수익의 법칙 패턴과 정확히 일치합니다.

탄력성을 알려줍니다.
탄력성이란 한 변수가 다른 변수의 변화에 얼마나 민감하게 반응하는지를 나타내는 척도로, 투입 변수가 1% 변화할 때 산출 변수가 얼마나 변화하는지를 백분율로 나타낸 것입니다. 이는 누군가가 직접 보여주기 전까지는 대부분의 마케터들이 깨닫지 못하는 부분입니다. 종속 변수와 독립 변수 모두 로그 변환된 경우(‘로그-로그 모델’), 회귀 계수들은 아주 명확한 해석을 갖습니다. 바로 탄력성인 것입니다. 계수가 0.3이라는 것은, 입력이 1% 증가하면 산출이 0.3% 증가한다는 것을 의미합니다. 마케터(와 경제학자)들은 수요 탄력성, 가격 탄력성, 광고 탄력성에 대해 많은 시간을 할애하며 논쟁합니다. 로그-로그 회귀 분석은 이러한 탄력성 값을 직접적으로 제공합니다.
모델 비교에서의 로그 함수
이 마지막 응용 분야는 대부분의 마케터들이 가장 어려워하는 부분이지만, 그 개념은 이름에서 연상되는 것보다 훨씬 간단합니다.
통계 모델이 데이터에 얼마나 잘 부합하는지 평가할 때, 모델의 매개변수를 전제로 실제 데이터가 나타날 확률을 계산합니다. 이 확률을 '우도(likelihood)'라고 합니다. 데이터 양이 다소 많은 모델의 경우, 우도는 각 데이터 포인트마다 하나씩 적용되는 수많은 작은 확률의 곱이 됩니다. 수많은 작은 수를 곱하면 컴퓨터가 정확하게 표현할 수 없을 정도로 천문학적으로 작은 값이 나오게 됩니다. 이 값들은 언더플로우(underflow) 현상으로 인해 0이 됩니다.
해결책은 로그를 취하는 것입니다. 로그를 적용하면 곱셈이 덧셈으로 바뀌므로, 로그우도 함수는 확률의 곱이 아니라 확률의 로그값의 합이 됩니다. 이렇게 되면 수치를 다루기 쉬워지고, 수학적 연산은 덧셈 형태로 변하며, 최적화도 용이해집니다. 로지스틱 회귀부터 베이지안 MMM, 신경망에 이르기까지 수많은 통계 및 기계 학습 알고리즘은 내부적으로 우도 함수나 로그우도 함수를 극대화하고 있습니다.
로그 우도 함수는 모델을 비교하는 명확한 방법도 제공하지만, 이는 해당 모델들이 동일한 데이터에 적합할 때만 해당됩니다. 로그우도 함수가 높다는 것은 모델이 데이터를 더 가능성이 높다고 판단한다는 뜻이며, 이는 대개 모델이 데이터에 더 잘 부합한다는 것을 의미합니다. 실무에서 접하는 대부분의 모델 비교 지표는 로그우도 위에 구축되어 있습니다. 가장 흔한 모델 선택 기준 중 두 가지인 AIC와 BIC는 본질적으로 모델의 복잡성에 대한 페널티를 적용한 로그우도입니다. "모델이 -2,341의 로그우도를 달성했다"고 적힌 논문을 읽을 때, 그 숫자 자체로는 큰 의미가 없지만, 동일한 데이터셋에서 경쟁하는 두 모델 간의 차이는 어느 모델이 더 잘 맞는지 알려줍니다.

로그를 사용할 때
데이터의 범위가 두 개 이상의 크기 단위(오더 오브 매그니튜드)에 걸치거나, 절대적인 변화보다 백분율 변화가 더 중요할 때 차트에 로그 척도를 사용하십시오.
데이터가 우측 편향되어 있거나, 관계가 곱셈적 또는 지수적으로 보일 때, 또는 계수를 탄력성으로 해석하고자 할 때 회귀 분석에서 변수를 로그 변환하십시오.
탄력성을 구체적으로 구하고자 할 때(X의 1% 변화가 산출량의 Y% 변화를 초래함) 로그-로그 모델을 사용하십시오.
동일한 데이터셋에 적합된 두 모델을 비교할 때는 로그우도(log-likelihood)를 살펴보십시오. 로그우도가 높을수록 적합도가 더 좋음을 의미하지만, 이는 동일한 데이터에 한해서만 해당됩니다.
데이터에 0이 포함되어 있고 로그 변환이 필요한 경우, log(x + 1) 또는 다른 적절한 조정 방법을 사용하십시오.
로그 변환을 사용하지 말아야 할 때
로그는 유용하지만 마법 같은 도구는 아닙니다. 변수가 비대칭적으로 보이거나 모델 결과가 약간 개선된다는 이유만으로 무턱대고 로그 변환을 적용해서는 안 됩니다. 변환 방식은 해결하고자 하는 비즈니스 질문과 부합해야 합니다. 결과를 순수 달러, 순수 고객 수, 또는 순수 전환율로 설명해야 하는 경우, 로그 모델은 청중이 결과를 해석하기 어렵게 만들 수 있습니다.
또한 0과 음수 값을 다룰 때는 주의해야 합니다. 0의 로그를 구할 수 없으며, 일반적인 실수 분석에서는 음수의 로그를 구할 수도 없습니다. 이는 마케팅에서 중요한 문제입니다. 왜냐하면 이익, 리프트, 마진 변화, 순매출 또는 전년 동기 대비 변화 등이 모두 0이거나 음수가 될 수 있기 때문입니다. 0이 포함된 경우 로그를 구하기 전에 1을 더하는 방식(log(x + 1)로 표기)이 흔히 사용되지만, 이는 해석을 바꾸게 되므로 자동적인 해결책으로 간주해서는 안 됩니다.
결론
마케팅 분석에서 한번 눈여겨보면 로그 함수는 어디에나 있습니다. 장기 주가 차트의 로그 눈금 속에도 있고, 지난 분기 미디어 효과를 추정했던 회귀 모델 속에도 있으며, 작년 대신 올해의 MMM을 선정한 로그 우도 계산 속에도 있습니다. 이 수학 자체는 400년이나 된 것이지만, 오늘날에도 여전히 사용되고 있습니다.
로그를 직접 손으로 계산할 필요는 없습니다. 중요한 것은 로그를 알아보는 것입니다. 차트의 로그 눈금은 대개 데이터의 범위가 넓거나, 누군가가 백분율 변화를 일관되게 보이게 하려는 의도가 있음을 의미합니다. 회귀 분석에서 로그 변환은 대개 누군가가 비정상 분포 데이터, 곱셈적 관계, 또는 탄력성을 다루고 있음을 의미합니다. 모델 출력에서 로그우도 함수는 대개 누군가가 동일한 데이터셋을 바탕으로 두 모델을 비교하고 있음을 의미합니다. 무엇을 찾아야 할지 알게 되면, 분석은 더 이상 두렵지 않게 됩니다.
네이피어는 천문학자들이 배를 항해하고, 엔지니어들이 기계를 설계할 수 있도록 20년 동안 손으로 로그 표를 계산했습니다. 오늘날 같은 수학 원리가 여러분의 유료 검색 비용 탄력성을 계산하고, 예산을 소셜 미디어로 전환할지 결정하는 데 도움을 주고 있습니다. 도구는 다르지만, 근본적인 아이디어는 같습니다. 곱셈은 어렵습니다. 덧셈은 쉽습니다. 로그 함수는 이 둘을 연결하는 다리입니다.
핵심 요약
- 대수는 “이 수를 얻기 위해 기수를 몇 제곱해야 하는가?”라는 질문에 답을 주는 개념입니다. 이는 지수의 역함수입니다.
- 마케팅 분야에서 가장 자주 접하게 될 세 가지 기수는 log₁₀(크기 단위), log₂(두 배 증가), 그리고 ln(자연로그, 회귀 분석 및 통계)입니다.
- 소프트웨어의 기본 설정을 주의 깊게 살펴보세요. Excel에서 'log'는 log₁₀을 의미하지만, Python과 R에서는 'log'를 입력하면 ln이 사용됩니다.
- 차트의 로그 축은 넓은 범위를 압축하고 백분율 변화를 시각적으로 일관되게 보여줍니다. 데이터가 두 개 이상의 크기 순서에 걸쳐 있을 때 사용하세요.
- 회귀 분석에서 로그 변환은 곱셈적 관계를 덧셈적 관계로 바꾸고, 편향된 데이터를 정규화하며, 수익의 감소 현상을 모델링하고, 탄력성으로 해석할 수 있는 계수를 산출합니다.
- 대수우도(log-likelihood)는 미미한 확률들의 곱을 다루기 쉬운 합으로 바꾸어, 모델 적합 및 비교를 수치적으로 안정적으로 만듭니다.
- 로그를 직접 계산할 필요는 없습니다. 차트, 모델, 분석에서 로그가 나타날 때 이를 인식할 수 있어야 합니다.
'데이터 사이언스 & 데이터 엔지니어링' 카테고리의 다른 글
| 데이터 과학자에서 AI 아키텍트로(From Data Scientist to AI Architect) (0) | 2026.05.19 |
|---|---|
| 데이터 아키텍쳐의 과거, 현재, 미래 (0) | 2026.05.15 |
| 마케팅 분석에서의 대수(Logarithms)의 실용 가이드 - part 1 (0) | 2026.05.14 |
| 데이터 레이크 vs. 데이터 웨어하우스(Data Lakes vs. Data Warehouses) (0) | 2026.05.13 |
| 데이터베이스의 진화: 데이터 플랫폼 - Part 3 (0) | 2026.05.09 |
댓글