[2025년] 엑셀 RSQ, CORREL, PEARSON 함수 비교분석: 이것 하나로 완벽 정리하고 데이터 분석 마스터하기!

 

안녕하세요, 엑셀로 데이터 분석의 세계에 첫발을 내디딘 여러분! 혹은 이미 실무에서 엑셀을 다루고 계시지만, 가끔 어떤 함수를 써야 할지 헷갈리는 분들을 위해 준비했어요. 😊

 

특히 통계 관련 함수들은 이름도 비슷하고 결과값도 유사해서 "이게 맞나?" 싶은 순간들이 있으셨을 텐데요. 오늘은 그중에서도 많은 분이 궁금해하시는 RSQ, CORREL, PEARSON 함수의 차이점과 사용법을 속 시원하게 파헤쳐 보겠습니다!

 

📌 핵심 요약: 엑셀의 대표적인 통계 함수 RSQ, CORREL, PEARSON! 이들의 차이점과 사용법을 명쾌하게 비교 분석해 드립니다.

 


📊 엑셀 통계 함수, 왜 중요할까요?

데이터는 이제 우리 업무에서 빼놓을 수 없는 존재가 되었죠? 엑셀은 이런 데이터를 단순히 정리하는 것을 넘어, 의미 있는 정보를 찾아내고 미래를 예측하는 데 도움을 주는 강력한 도구예요. 그중에서도 RSQ, CORREL, PEARSON 함수는 두 데이터 집합 간의 관계를 파악하는 데 아주 유용하게 사용된답니다. 자, 그럼 하나씩 자세히 알아볼까요?


 

📈 엑셀 CORREL 함수: 두 변수 간의 직선적 관계 강도를 알고 싶다면!

CORREL 함수는 두 데이터 범위(배열) 사이의 상관계수를 반환하는 함수예요. 여기서 상관계수란, 한 변수가 변할 때 다른 변수가 얼마나 일관되게 함께 변하는지를 나타내는 값이죠.

 

1. CORREL 함수 기본 설명

  • 두 변수 간의 선형적인 관계의 강도와 방향을 측정해요.
  • 결과값은 -1 에서 +1 사이로 나타납니다.
    • +1에 가까울수록: 강한 양의 선형 관계 (하나가 증가하면 다른 하나도 증가)
    • -1에 가까울수록: 강한 음의 선형 관계 (하나가 증가하면 다른 하나는 감소)
    • 0에 가까울수록: 선형 관계가 거의 없음 (두 변수 간에 뚜렷한 직선적 관계가 보이지 않음)

2. CORREL 함수 구문

CORREL(array1, array2)

3. CORREL 함수 사용 인수 설명

  • array1: 첫 번째 숫자 데이터 집합이 있는 셀 범위입니다. (필수)
  • array2: 두 번째 숫자 데이터 집합이 있는 셀 범위입니다. (필수)

4. 📝 주의할 점 (노트)

  • array1array2는 같은 수의 데이터 포인트(갯수)를 가져야 해요. 그렇지 않으면 #N/A 오류가 발생합니다!
  • 인수가 숫자가 아니거나, 텍스트, 논리값 등이 포함되어 있으면 해당 값은 무시돼요. (단, PEARSON 함수와는 달리 텍스트나 논리값 자체를 인수로 받으면 #VALUE! 오류를 반환할 수 있으니 숫자 데이터만 사용하는 것이 좋습니다.)
  • 배열이나 참조에 텍스트, 논리값 또는 빈 셀이 포함된 경우 해당 값은 무시됩니다. 하지만 0 값은 포함됩니다.

 

👨‍🔬 엑셀 PEARSON 함수: CORREL과 쌍둥이? 피어슨 곱적률 상관계수!

PEARSON 함수 역시 두 데이터 집합 간의 피어슨 곱적률 상관계수(r)를 반환합니다. 어? CORREL이랑 설명이 똑같다고요? 네, 맞아요! 대부분의 경우 PEARSON 함수와 CORREL 함수는 동일한 결과를 보여줍니다.

 

1. PEARSON 함수 기본 설명

  • CORREL 함수와 마찬가지로, 두 변수 간의 선형적인 관계의 강도와 방향을 측정합니다.
  • 결과값 범위도 -1 에서 +1 사이로 CORREL과 동일합니다.
  • 사실상 엑셀 내부적으로 CORREL 함수는 PEARSON 함수를 기반으로 계산될 가능성이 높아요.

2. PEARSON 함수 구문

PEARSON(array1, array2)

3. PEARSON 함수 사용 인수 설명

  • array1: 첫 번째 독립 변수 데이터 집합이 있는 셀 범위입니다. (필수)
  • array2: 두 번째 종속 변수 데이터 집합이 있는 셀 범위입니다. (필수)

4. 📝 주의할 점 (노트)

  • CORREL 함수와 동일하게 array1array2는 같은 수의 데이터 포인트(갯수)를 가져야 하며, 그렇지 않으면 #N/A 오류가 발생합니다.
  • array1 또는 array2가 비어 있거나, 표준 편차가 0인 데이터만 포함된 경우 #DIV/0! 오류가 발생할 수 있습니다.

"그럼 CORREL이랑 PEARSON은 왜 두 개나 있는 거죠?" 🤔

좋은 질문이에요! 역사적으로 보면 피어슨 상관계수가 통계학에서 널리 사용되는 용어이기 때문에 PEARSON이라는 이름의 함수가 존재하고, 좀 더 일반적인 용어인 '상관관계(Correlation)'를 나타내는 CORREL 함수도 함께 제공되는 것으로 이해할 수 있어요. 실무에서는 둘 중 어떤 것을 사용하셔도 무방합니다!

 

🎯 엑셀 RSQ 함수: 관계의 설명력, 결정계수(R-제곱)를 알고 싶다면!

RSQ 함수는 두 데이터 범위 사이의 결정계수(R-squared, R²) 값을 반환합니다. 결정계수는 상관계수의 제곱값으로, 한 변수의 변동 중 얼마나 많은 부분이 다른 변수에 의해 설명될 수 있는지를 나타내는 지표예요.

 

1. RSQ 함수 기본 설명

  • 종속 변수의 분산 중에서 독립 변수에 의해 설명되는 비율을 나타냅니다. 즉, 모델의 설명력을 의미해요.
  • 결과값은 0에서 1 사이로 나타납니다. (상관계수를 제곱했기 때문에 음수가 나올 수 없어요)
    • 1에 가까울수록: 독립 변수가 종속 변수의 변동을 매우 잘 설명함 (예: 광고비가 매출액 변동의 90%를 설명한다면 RSQ = 0.9)
    • 0에 가까울수록: 독립 변수가 종속 변수의 변동을 거의 설명하지 못함

2. RSQ 함수 구문

RSQ(known_y's, known_x's)

3. RSQ 함수 사용 인수 설명

  • known_y's: 종속 변수 데이터 포인트 배열 또는 범위입니다. (필수)
  • known_x's: 독립 변수 데이터 포인트 배열 또는 범위입니다. (필수)

4. 📝 주의할 점 (노트)

  • known_y'sknown_x's는 같은 수의 데이터 포인트를 가져야 합니다. 그렇지 않으면 #N/A 오류가 발생해요.
  • known_y's 또는 known_x's가 비어 있거나, 표준 편차가 0인 데이터만 포함된 경우 #DIV/0! 오류가 발생할 수 있습니다. (PEARSON과 동일)
  • 중요! RSQCORREL(또는 PEARSON) 함수의 결과값을 제곱한 것과 같습니다. 즉, RSQ(Y, X) = CORREL(Y, X)^2 와 같아요.

 

🔍 RSQ, CORREL, PEARSON 함수, 그래서 뭐가 다를까요? 핵심 비교!

특징 CORREL PEARSON RSQ
주요 기능 상관계수 계산 피어슨 상관계수 계산 결정계수 (R-제곱) 계산
결과값 범위 -1 ~ +1 -1 ~ +1 0 ~ 1
의미 두 변수 간 선형 관계의 강도와 방향 두 변수 간 선형 관계의 강도와 방향 한 변수가 다른 변수를 설명하는 정도 (설명력)
관계 PEARSON과 거의 동일 CORREL과 거의 동일 CORREL 또는 PEARSON의 제곱값 (CORREL(Y,X)^2)
언제 사용할까? "X가 증가할 때 Y는 증가할까, 감소할까? 얼마나 강하게?" "X가 증가할 때 Y는 증가할까, 감소할까? 얼마나 강하게?" "X의 변화가 Y의 변화를 얼마나 잘 설명해줄까?"

간단히 말해서,

  • CORRELPEARSON은 두 변수가 얼마나 '함께' 움직이는지, 그리고 그 방향(+ 또는 -)이 어떤지를 알려줘요.
  • RSQ는 한 변수의 움직임이 다른 변수의 움직임을 얼마나 '설명'할 수 있는지를 비율(%)로 알려준다고 생각하면 쉬워요.

 

💼 실무 예제로 함수 완벽 마스터하기!

자, 이제 실제 업무에서 어떻게 이 함수들을 활용할 수 있는지 예제를 통해 알아볼게요!

가상의 한 회사에서 지난 1년간의 월별 광고비 지출과 그에 따른 월 매출액 데이터를 가지고 있다고 가정해 봅시다.

 

📝 예제 데이터 (CSV 텍스트 형식)

월,광고비(만원),월 매출액(만원)
1월,100,500
2월,120,550
3월,150,620
4월,130,580
5월,160,650
6월,180,700
7월,200,750
8월,170,680
9월,190,720
10월,220,800
11월,210,780
12월,230,850

위 데이터를 엑셀 시트의 A1부터 C13까지 복사해서 붙여넣어 보세요.

(A열: 월, B열: 광고비(만원), C열: 월 매출액(만원))

 

예제: 엑셀 RSQ CORREL PEARSON 함수의 결과

 

🚀 CORREL 함수 사용 예제: 광고비와 매출액의 상관관계는?

광고비(B2:B13)와 월 매출액(C2:C13) 사이의 상관계수를 구해봅시다.

F2 셀에 다음과 같이 입력하세요:

=CORREL(B2:B13, C2:C13)

결과값은 약 0.9977가 나올 거예요. 이는 광고비와 월 매출액 사이에 매우 강한 양의 선형 관계가 있음을 의미합니다! 즉, 광고비를 많이 쓸수록 매출액도 증가하는 경향이 매우 뚜렷하다는 거죠. 👍

 

🚀 PEARSON 함수 사용 예제: 결과가 정말 같을까?

이번엔 PEARSON 함수로 동일한 계산을 해볼게요.

F3 셀에 다음과 같이 입력하세요:

=PEARSON(B2:B13, C2:C13)

결과값은 역시 약 0.9977로 CORREL 함수와 동일하게 나옵니다. 신기하죠? 😉

 

🚀 RSQ 함수 사용 예제: 광고비가 매출액 변동을 얼마나 설명할까?

그렇다면 광고비의 변화가 월 매출액 변화의 몇 퍼센트를 설명할 수 있을까요? RSQ 함수를 사용해 봅시다.

F4 셀에 다음과 같이 입력하세요:

=RSQ(C2:C13, B2:B13)

(주의! RSQ 함수는 known_y's (종속변수, 여기서는 매출액)를 먼저, known_x's (독립변수, 여기서는 광고비)를 나중에 입력합니다.)

결과값은 약 0.9955이 나올 거예요. 이는 광고비의 변동이 월 매출액 변동의 약 99.55%를 설명한다는 뜻입니다! 즉, 이 회사의 매출액 변화는 광고비 지출에 의해 상당 부분 예측 가능하다는 강력한 증거가 됩니다.

 

💡 잠깐! CORREL 결과 제곱해보기

G2 셀에 =F2^2 (CORREL 결과의 제곱) 또는 =F3^2 (PEARSON 결과의 제곱)을 입력해 보세요.

예제: 엑셀 CORREL 과 PEARSON 함수의 거듭제곱 값

RSQ 함수의 결과값(0.9955)과 거의 동일하게 나오는 것을 확인할 수 있습니다! (아주 미세한 차이는 부동소수점 연산 때문일 수 있지만, 이론적으로는 동일해요.)

 

⚠️ 함수 사용 시 발생할 수 있는 오류들

함수를 사용하다 보면 예상치 못한 오류 메시지를 만날 수 있어요. 당황하지 마시고 아래 내용을 참고하세요!

  1. #N/A 오류:
    • 원인: array1array2 (또는 known_y'sknown_x's)의 데이터 개수가 다를 때 발생합니다.
    • 해결: 두 범위의 데이터 개수가 동일한지 확인하고 수정하세요.
  2. #VALUE! 오류:
    • 원인: 인수 중 숫자로 변환할 수 없는 텍스트나 논리값이 직접 포함된 경우 (주로 CORREL에서 발생 가능). PEARSON이나 RSQ는 텍스트/논리값을 알아서 무시하는 경향이 있습니다.
    • 해결: 데이터 범위에 숫자만 있는지 확인하세요.
  3. #DIV/0! 오류:
    • 원인 (PEARSON, RSQ): 제공된 배열(array1 또는 array2, known_y's 또는 known_x's)이 비어 있거나, 모든 데이터 값이 동일하여 표준 편차가 0일 때 발생합니다. (분모가 0이 되는 상황)
    • 해결: 데이터 범위가 비어있지 않은지, 그리고 모든 값이 동일하지는 않은지 확인하세요. (예: 모든 광고비가 100만원으로 동일하면 이 오류가 발생할 수 있습니다.)

 

💡 컴활 자격증과의 연관성

컴퓨터활용능력(컴활) 1급 시험에서는 데이터 분석 작업이 중요하게 다뤄지는데요, 바로 이 CORREL, PEARSON, RSQ 함수들이 종종 출제되거나 응용될 수 있습니다! 출제빈도는 낮지만 추세선 분석이나 회귀 분석과 관련된 문제에서 이 함수들의 개념을 이해하고 있다면 문제 해결에 큰 도움이 될 거예요. 각 함수의 의미와 차이점, 그리고 언제 어떤 함수를 써야 하는지를 명확히 알아두는 것이 중요합니다. 컴활 시험을 준비 중이시라면 오늘 배운 내용을 꼭 기억해두세요! 🤓

 

✨ 마무리하며: 데이터 분석, 이제 어렵지 않아요!

오늘은 엑셀의 RSQ, CORREL, PEARSON 함수에 대해 자세히 알아봤습니다. 세 함수 모두 두 데이터 집합 간의 관계를 분석하는 데 유용하지만, CORREL과 PEARSON은 관계의 '방향과 강도'를, RSQ는 '설명력'을 알려준다는 핵심적인 차이가 있었죠! 이제 어떤 상황에서 어떤 함수를 써야 할지 감이 오시나요?

 

데이터 분석은 처음엔 조금 어렵게 느껴질 수 있지만, 이렇게 하나씩 함수를 정복해나가다 보면 어느새 데이터와 친해진 자신을 발견하게 될 거예요. 오늘 배운 내용이 여러분의 엑셀 활용 능력과 데이터 분석 역량을 한 단계 업그레이드하는 데 도움이 되었기를 바랍니다!

 

궁금한 점은 댓글로 남겨주시고, 이 글이 도움이 되셨다면 공감과 공유 부탁드려요! 😊 여러분의 데이터 분석 여정을 항상 응원하겠습니다!

 

 

작성자: 마늘빵