데이터 분석을 하다 보면 평균값을 구해야 하는 상황이 자주 생겨요. 그런데 단순히 AVERAGE 함수만 사용하다가 예상과 다른 결과가 나와서 당황한 적 있으신가요? 실제로 데이터의 성격에 따라 평균(AVERAGE)과 중앙값(MEDIAN)을 구분해서 사용해야 정확한 분석이 가능해요.
📌 핵심 포인트: MEDIAN은 극값의 영향을 받지 않는 안정적인 중심값을 제공하며, AVERAGE는 모든 데이터를 반영한 산술평균을 계산합니다.
🔍 AVERAGE 함수와 MEDIAN 함수 기본 이해
AVERAGE 함수 기본 설명
AVERAGE 함수는 산술평균을 계산하는 가장 기본적인 통계 함수예요. 모든 값을 더한 후 개수로 나누는 방식으로 작동합니다.
함수 구문
AVERAGE(number1, [number2], ...)
인수 설명
- number1: 평균을 구할 첫 번째 숫자, 셀 참조, 범위 (필수)
- number2: 추가 숫자, 셀 참조, 범위 (선택사항, 최대 255개)
📝 노트: 텍스트, 논리값, 빈 셀은 자동으로 무시되며, 0이 포함된 셀은 계산에 포함됩니다.
MEDIAN 함수 기본 설명
MEDIAN 함수는 중앙값을 구하는 함수로, 데이터를 크기 순으로 정렬했을 때 정 가운데 위치하는 값을 반환해요.
함수 구문
MEDIAN(number1, [number2], ...)
인수 설명
- number1: 중앙값을 구할 첫 번째 숫자, 셀 참조, 범위 (필수)
- number2: 추가 숫자, 셀 참조, 범위 (선택사항, 최대 255개)
📝 노트: 데이터 개수가 홀수면 정중앙 값, 짝수면 중앙 두 값의 평균을 반환합니다.
📊 실무 활용 예제 3가지
예제 1: 직원 급여 데이터 분석
데이터 (CSV 형식)
직원명,월급여
김철수,3500000
이영희,3200000
박민수,3800000
정수진,3400000
최대표,15000000
한과장,4200000
송부장,5800000
윤사원,2900000
장주임,3600000
노대리,4100000
임팀장,6200000
조사원,3100000
이 경우 최대표의 급여가 극값으로 작용해요.
- AVERAGE 결과: 약 4,900,000원
- MEDIAN 결과: 약 3,700,000원
실제 활용법
=AVERAGE(B2:B13) // 산술평균
=MEDIAN(B2:B13) // 중앙값
극값 때문에 평균값이 실제 직원들의 급여 수준을 제대로 반영하지 못하고 있어요. 이런 경우 MEDIAN이 더 현실적인 기준이 됩니다. 중앙값이 짝수 이기에 그 평균이 결과로 반환됩니다.
예제 2: 매장별 일일 매출 분석
데이터 (CSV 형식)
매장명,일일매출
강남점,2800000
홍대점,2100000
신촌점,1950000
잠실점,3200000
명동점,4500000
이태원점,1800000
성수점,2300000
건대점,2000000
노원점,1700000
분당점,2900000
일산점,2200000
수원점,2400000
분석 결과
=AVERAGE(B2:B13) // 평균: 약 2,490,000원
=MEDIAN(B2:B13) // 중앙값: 약 2,250,000원
이 데이터는 비교적 고른 분포를 보여서 평균과 중앙값이 크게 차이나지 않아요. 데이터가 정규분포에 가까울 때는 두 값이 비슷합니다.
예제 3: 학생 성적 분포 분석
데이터 (CSV 형식)
학생명,수학점수
김학생,85
이학생,92
박학생,78
정학생,88
최학생,15
한학생,90
송학생,82
윤학생,87
장학생,94
노학생,89
임학생,91
조학생,86
분석 결과
=AVERAGE(B2:B13) // 평균: 약 81점
=MEDIAN(B2:B13) // 중앙값: 약 88점
최학생의 15점이 극값으로 작용해서 평균을 크게 끌어내렸어요. 실제 학급의 전반적인 수준을 파악하려면 MEDIAN이 더 적절한 지표가 됩니다.
⚠️ 함수 사용 시 주의사항 및 오류 해결
주요 오류 유형
- 원인: 계산할 숫자 데이터가 없는 경우
- 해결: 범위에 숫자 데이터가 포함되어 있는지 확인
- 원인: 잘못된 참조나 데이터 형식 오류
- 해결: 셀 참조와 데이터 형식 확인
예상과 다른 결과
- 원인: 빈 셀, 텍스트, 0값 처리 방식 차이
- 해결: 데이터 정제 후 함수 적용
데이터 전처리 팁
실제 업무에서는 데이터가 완벽하지 않은 경우가 많아요. AVERAGEIF나 조건부 함수를 활용해서 더 정확한 분석을 할 수 있습니다.
=AVERAGEIF(B2:B13,">0") // 0보다 큰 값만 평균
=MEDIAN(IF(B2:B13>0,B2:B13)) // 0보다 큰 값만 중앙값
💡 언제 어떤 함수를 사용할까?
AVERAGE 함수 추천 상황
- 데이터가 정규분포에 가까울 때
- 모든 값이 의미가 있고 극값이 적을 때
- 총합을 기반으로 한 분석이 필요할 때
MEDIAN 함수 추천 상황
- 극값이나 이상치가 있을 때
- 데이터가 편향분포를 보일 때
- 실제적인 중간 수준을 파악하고 싶을 때
📚 컴활 시험 출제 포인트
컴퓨터활용능력 시험에서는 이 두 함수의 차이점과 적절한 활용법을 묻는 문제가 자주 출제돼요.
출제 유형
- 주어진 데이터에서 평균과 중앙값 계산
- 극값이 있는 상황에서 적절한 함수 선택
- 함수 구문 작성 및 결과 해석
학습 포인트
- 두 함수의 기본 개념 차이 숙지
- 실무 상황별 적용법 이해
- 함수 조합 활용 연습
🎯 마무리
AVERAGE와 MEDIAN 함수는 단순해 보이지만, 데이터의 성격을 이해하고 적절히 선택하는 것이 중요해요. 극값이 있는 데이터에서는 MEDIAN이, 균등한 분포의 데이터에서는 AVERAGE가 더 의미 있는 결과를 제공합니다.
데이터 분석의 첫걸음은 올바른 통계 함수 선택에서 시작돼요. 이제 여러분도 상황에 맞는 함수를 선택해서 더 정확한 분석을 해보세요!
이 글이 도움이 되셨다면 주변 동료들과 공유해주세요 📤
작성자: 마늘빵