데이터 분석 업무를 하다 보면 두 변수 간의 관계를 파악해야 하는 경우가 많아요. 특히 매출 예측이나 트렌드 분석에서 선형 회귀의 y절편을 구해야 할 때가 있는데요. 엑셀의 INTERCEPT 함수를 사용하면 복잡한 통계 계산 없이도 쉽게 y절편값을 구할 수 있어요.
📌 [고정핀] INTERCEPT 함수는 두 데이터 세트 간의 선형 회귀선이 y축과 만나는 지점(y절편)을 계산하는 통계 함수입니다
🔍 INTERCEPT 함수란?
INTERCEPT 함수는 선형 회귀 분석에서 사용되는 함수로, 독립변수(x값)와 종속변수(y값) 사이의 관계를 나타내는 직선이 y축과 만나는 점의 y좌표를 구해줘요.
쉽게 말해서 x가 0일 때의 y값을 계산해주는 거예요! 📈
선형 회귀는 두 변수 간의 관계를 직선으로 표현하는 통계 기법이에요. 예를 들어 광고비가 증가하면 매출도 비례해서 증가하는 관계를 하나의 직선으로 나타낼 수 있죠. 이때 그 직선이 y축(세로축)과 만나는 점을 y절편(intercept)이라고 해요.
실무에서는 이 y절편값이 매우 중요한 의미를 갖는데요. 마케팅 예산이 0원일 때의 기본 매출액이나, 온도가 0도일 때의 기준 소비량 등을 의미하거든요. 비즈니스 계획을 세울 때 이런 기준점을 아는 것이 핵심이에요.
📝 INTERCEPT 함수 구문
INTERCEPT(known_y's, known_x's)
인수 설명
- known_y's: 종속변수 y값들의 범위 (필수)
- known_x's: 독립변수 x값들의 범위 (필수)
종속변수와 독립변수의 개념을 명확히 이해하는 것이 중요해요. 독립변수(x)는 원인이 되는 변수고, 종속변수(y)는 결과가 되는 변수예요. 예를 들어 광고비(독립변수)에 따라 매출(종속변수)이 변한다고 보는 거죠.
함수 작성 시 순서가 중요한데요, 첫 번째 인수는 반드시 y값(결과값), 두 번째 인수는 x값(원인값)을 입력해야 해요. 순서를 바꾸면 전혀 다른 결과가 나오니까 주의하세요!
💡 노트: 두 배열의 크기는 반드시 같아야 하며, 빈 셀이나 텍스트가 포함되면 오류가 발생할 수 있어요.
💼 실무 활용 예제
📊 예제 1: 월별 매출 예측
다음은 월별 광고비와 매출 데이터예요:
월,광고비(만원),매출(백만원)
1,50,120
2,60,140
3,70,160
4,80,180
5,90,200
6,100,220
7,110,240
8,120,260
9,130,280
10,140,300
11,150,320
12,160,340
사용 공식: =INTERCEPT(C2:C13, B2:B13)
결과: 약 20 (광고비가 0원일 때 기본 매출 20백만원)
이 결과는 매우 중요한 비즈니스 인사이트를 제공해요. 광고를 전혀 하지 않아도 20백만원의 기본 매출이 있다는 뜻이거든요. 이는 기존 고객의 재구매나 입소문 효과 등을 나타내는 수치예요.
마케팅 팀에서는 이 정보를 바탕으로 최소 매출 보장선을 설정하고, 광고 예산 대비 추가 매출 효과를 정확히 측정할 수 있어요. ROI 계산에서도 이 기준점이 매우 중요한 역할을 하죠.
📈 예제 2: 온도별 아이스크림 판매량
온도와 아이스크림 판매량의 관계를 분석해볼게요:
날짜,온도(℃),판매량(개)
1일,15,30
2일,18,45
3일,22,60
4일,25,75
5일,28,90
6일,30,100
7일,32,110
8일,35,125
9일,27,85
10일,20,50
11일,24,70
12일,29,95
사용 공식: =INTERCEPT(C2:C13, B2:B13)
결과: 약 -43 (온도가 0℃일 때 예상 판매량, 실제로는 의미 없는 값)
이 예제에서 y절편이 음수로 나온 것은 통계적으로는 정확하지만 실무적으로는 해석에 주의가 필요해요. 온도 0도에서 아이스크림을 -43개 판다는 건 현실적으로 불가능하죠.
하지만 이 값은 최소 판매 온도의 기준점을 제시해줘요. 대략 15도 이상에서부터 의미 있는 판매가 시작된다고 볼 수 있거든요. 카페나 편의점에서 계절별 상품 진열 계획을 세울 때 이런 데이터가 매우 유용해요.
💰 예제 3: 근무년수별 연봉 분석
직원들의 근무년수와 연봉 데이터예요:
직원명,근무년수,연봉(만원)
김철수,2,3200
이영희,3,3500
박민수,5,4000
정수진,7,4500
최동훈,4,3700
한미영,6,4200
윤상철,8,4800
조은영,1,3000
강지훈,9,5100
송미라,10,5300
임태규,12,5800
차예린,11,5500
사용 공식: =INTERCEPT(C2:C13, B2:B13)
결과: 약 2706 (신입사원의 예상 연봉)
HR 부서에서 이 결과를 보면 신입사원 연봉 책정의 기준점을 얻을 수 있어요. 실제 신입사원 연봉이 3000만원인데 통계적 기준점은 2706만원이니, 현재 신입 대우가 시장 평균보다 약간 높다고 볼 수 있죠.
또한 이 데이터로 승진이나 연차별 인상률도 예측할 수 있어요. SLOPE 함수와 함께 사용하면 매년 평균 몇 %씩 연봉이 오르는지도 계산 가능하거든요. 장기 인사 계획 수립에 매우 유용한 정보예요.
⚠️ 함수 사용 시 주의사항 및 오류 해결
자주 발생하는 오류들
- 배열 크기가 다를 때 발생
- 해결방법: 두 범위의 행/열 수를 동일하게 맞춰주세요
이 오류는 데이터 범위 설정 실수로 가장 자주 발생해요. 예를 들어 x값은 A1:A10으로, y값은 B1:B12로 설정하면 크기가 맞지 않아서 오류가 나죠. 반드시 COUNTA 함수로 데이터 개수를 확인한 후 범위를 설정하는 습관을 들이세요.
- 모든 x값이 동일할 때 발생
- 해결방법: x값에 변화가 있는 데이터를 사용하세요
이는 독립변수에 변화가 없을 때 발생하는 오류예요. 예를 들어 모든 광고비가 100만원으로 동일하다면 회귀선을 그을 수 없거든요. 데이터 수집 단계에서부터 변수의 다양성을 확보하는 것이 중요해요.
🔗 관련 함수와의 연계 활용
INTERCEPT 함수는 다른 통계 함수들과 함께 사용할 때 더욱 강력해져요.
SLOPE 함수와의 조합
- SLOPE: 회귀선의 기울기 계산
- 함께 사용하면 완전한 회귀 방정식(y = ax + b) 완성
- 예시:
="y = " & SLOPE(y범위, x범위) & "x + " & INTERCEPT(y범위, x범위)
RSQ 함수로 신뢰도 확인
- 결정계수(R²)로 회귀선의 적합성 판단
- 0.7 이상이면 신뢰할 만한 관계로 봄
- 예시:
=RSQ(y범위, x범위)
FORECAST 함수로 예측값 계산
- 새로운 x값에 대한 y값 예측
- INTERCEPT로 구한 기준점을 바탕으로 정확한 예측 가능
🎯 컴활 시험 출제 포인트
컴퓨터활용능력 1급/2급에서 INTERCEPT 함수는 주로 다음과 같이 출제돼요:
- 회귀분석 문제와 함께 출제
- SLOPE 함수와 연계하여 기울기와 y절편 모두 구하는 문제
- 차트 작성 후 추세선의 수식 확인 문제
- 예측 분석 시나리오에서 기준값 계산 문제
실제 출제 패턴 분석을 보면, 단순히 함수 문법만 묻는 게 아니라 비즈니스 상황과 연결된 해석 문제가 많아요. 예를 들어 "매출 데이터를 바탕으로 기본 매출액을 구하고, 이를 해석하시오" 같은 문제가 나오죠.
특히 차트와 연계된 문제에서는 산점도를 그린 후 추세선을 추가하고, 그 추세선의 y절편을 INTERCEPT 함수로 검증하는 문제가 자주 출제돼요. 차트 기능과 함수를 모두 활용할 수 있는지 평가하는 거예요.
실무에서는 매출 예측, 비용 분석, 품질 관리 등 다양한 분야에서 활용되니까 꼭 익혀두세요! 💪
🏁 마무리
INTERCEPT 함수는 데이터의 기본 패턴을 파악하는데 매우 유용한 도구예요. 특히 비즈니스 분석에서 기준점을 설정하거나 예측 모델을 만들 때 필수적으로 사용되죠.
복잡해 보이지만 실제로는 두 개의 데이터 범위만 지정하면 되니까 생각보다 간단해요! 중요한 건 결과값을 어떻게 해석하고 활용하느냐예요.
단순한 숫자가 아니라 비즈니스 인사이트로 연결시켜 생각하는 습관을 기르세요. 오늘 배운 내용을 실무에 바로 적용해보시고, 더 정확한 데이터 분석으로 업무 효율을 높여보세요.
이 글이 도움이 되셨다면 동료들과도 공유해주세요! 🚀
작성자: 마늘빵