본문 바로가기
Sooin's Equipment/Probability & Statistics(확률과 통계)

[확률&통계] 회귀분석

by SOOIN'S STUDY 2024. 4. 3.

새롭게 출간된 명작으로..

 

 

 

 

 

회귀분석

왜 사용할까?

: 상관식을 분석하기 위해

 

회귀분석(regression analysis)란?

: 변수들간의 함수적 과련성을 규명하기 위해 어떤 수학적 모형을 가정하고

이 모형을 측정된 변수들의 자료로부터 추정하는 분석방법

 

회귀분석 = 직선의 방정식

(2점의 방정식 y= ax + b)

 

 

 

 

 

회귀분석과 상관분석의 차이점

상관분석은 두 변수간의 상관성에 대한 존재여부만 분석

회귀분석은 독립변수의 변화에 의해 종속변수의 값을 예측할 수 있음 (e.g. 머신러닝)

 

 

 

 

 

회귀분석의 종류

단순회귀분석

: 하나의 설명변수만을 갖는 회귀분석

 

다중회귀분석(중회귀분석)

: 설명변수가 2개 이상의 회귀분석

 

 

 

 

 

회귀분석 활용

1. 기업이 자사의 매출액을 예측하고자 할 때 매출액에 영향을 미칠 수 있는 변수를 자료를 통해 매출액을 예측

[ 매출액 = f (광고비, 점포수, 판매원 수) ]

 

2. 디자인에 대한 선호도로부터 매출액을 예측

[ 매출액 = f (디자인선호도) ]

 

3. 디자인 요소의 값으로부터 매출액(또는 선호도)를 예측

[ 매출액 (또는 선호도) = f (디자인 요소들) ]

 

4. 감성요인 점수로부터 매출액(또는 선호도)를 예측

[ 매출액 (또는 선호도) = f (감성요인 점수) ]

 

 

 

 

 

회귀분석의 목적

전통 통계학

: 출력변수와 예측변수들간의 관계를 설명

 

데이터마이닝

: 새로운 사례에 대해 출력값을 예측

 

 

설명모형 (Explanatory model)
: 전통적인 통계분야로서 데이터가 적은 모형
목적

- 모집단에서 가정하는 가설적 관계에 대한 정보를 최대한 반영할 수 있도록 전체 데이터 집합을 사용하여 최상의
적합모형을 추정


예측모형 (Predictive model)
: 데이터마이닝 분야로서 데이터가 충분한 모형
목적
- 적합화된 모형을 이용하여 알려지지 않은 데이터에 대한 예측