본문 바로가기
1️⃣ AI•DS/⚾ 계량경제•통계

계량경제학 강의_한치록_단순회귀 3장

by isdawell 2023. 5. 11.
728x90

 

 

👀 계량경제학 개인 공부용 포스트 글입니다. 

 

 

•  모수에 대응하는 숫자를 표본으로부터 구하는 것을 estimation 추정 이라고 한다. 추정 공식을 estimator (추정량) 이라고 하고, 공식을 실제 자료에 적용해 값을 구하면 추정값 (estimate) 라고 한다. 

 

 

 

3. 단순회귀 모형의 추정 


 

①  자료

 

•  (x1,y1), (x2,y2), ..., (xn,yn) → 관측된 표본 

 

 

 

②  직선 그리기 

 

•  회귀식을 추정하여 구한 기울기 추정값이 자동적으로 인과관계를 나타내지는 않는다는 점을 명심해야 한다. 

 

 

 

③  최소제곱법 

 

◯  최소제곱법

 

•  수직 방향거리를 제곱하여 합한 값을 가장 작게 만들도록 절편과 기울기를 결정한다. OLS 라고도 부른다. 각 점들로부터 직선까지 수직방향 거리를 구하고 이들을 모두 제곱해 합한 숫자를 계산한다. 

 

abline(lm(y~x, data = df), lty = 1)

 

 

④ Fitted value and Residual 

 

•  fitted value : 추정한 회귀식으로부터 얻어진 예측값 ⇨ yi_hat

•  residual : 잔차, 관측값 yi 에서 맞춘값 yi_hat 을 뺀 것 ui_hat 

•  yi = yi_hat + ui_hat 

 

 

•  Σ ui_hat = 0 : 잔차들의 합은 0이다. 

•  Σ xi•ui_hat = 0  : 잔차와 설명변수의 곱의 합은 0이다. 

⇨ 두 식이 만족되지 않으면 회귀계수들은 최소제곱 추정값이 아니다. 

 

•  fitted value 가 추정하는 값 

↪  가령 모집단 내 X의 값이 16인 개체들을 따로 모아 Y값의 평균을 구한 것은 E(Y|X=16) 으로 표시하는데, 선형모형에 따르면 β0 + β1•16 이다. β_hat0 + β_hat1•16 이면 E(Y|X=16) 의 추정값이 된다. 

 

 

 

 

 

⑤ 종속변수가 로그일 때 계수 추정값의 해석 

 

•  종속변수가 로그형태가 아니라면, 여러가지 표현이 가능하다. 가령 Y_hat = 13 + 31•X 라면, X의 계수추정값 31에 대해 다음과 같은 해석들이 가능하다. 

 

↪  여타 모든 요소들 (u) 을 고정할 때, X의 한 단위 증가는 Y를 31 단위 증가시킬 것으로 추정된다. 

↪  X가 한 단위 증가할 때, Y의 평균은 31.2단위 증가할 것으로 추정된다. 

↪  X가 한 단위 증가할 때, Y의 예측값은 31.2단위 증가한다. 

↪  X가 한 단위 증가할 때, Y는 31.2 단위 증가할 것으로 예측된다. 

 

⇨  E(Y|X) = β0 + β1•X 이기 때문이다. 

 

 

•  반면, 종속변수가 log 형태를 취하고 있다면, "X가 한단위 증가할 때, log(Y) 가 평균 약 β1 증가하는 것으로 추정된다" 라는 표현은 옳지만, "X가 한단위 증가할 때, Y가 평균 약 β1•100 % 증가하는 것으로 추정된다" 라고 해석하는 것은 엄밀히 말하면 옳지 않다. 

 

•  모형이 logY = β0 + β1•X + u 이고 만약 β1 의 참값이 0.01 이라고 하면, 여타 모든 요소 u가 고정된 채 X가 한 단위 증가하면 logY 는 0.01 증가하고 이는 Y가 약 1% 증가하는 것과 같다. 

 

 

 

⑥  제곱합 

 

SST = SSE + SSR

 

•  SST : 표본 내 종속변수 값들의 차이를 측정한다. SST 가 0이면 종속변수의 관측값들이 모두 동일함을 나타낸다. 표본 내 개체별로 종속변수의 값들이 크게 다르면 SST 값도 크다. 

•  SSE : 종속변수 값 중 독립변수에 의해 설명된 부분이 얼마나 큰 차이가 있는지 나타낸 것. y_hat_i 가 서로 모두 동일하면 값이 0이되고, 개체 간에 y_hat_i 의 값에 큰 차이가 있다면 SSE 값도 크다. 

•  SSR : 설명변수들에 의해 설명되지 않은 나머지 부분의 차이의 크기를 나타낸 것.

 

 

 

 

⑦ 모형의 설명력 : R-sqaured 

 

•  R-squared = SSE/SST = 1 - (SSR/SST)

•  √R-squared = cor(x,y)

 

 

 

 

 

⑧ 측정단위의 변환 

 

•  변수들의 측정단위를 바꿀 때, 기울기의 단위가 변화하긴 하겠지만, 해석에 있어선 어떠한 실질적인 변화도 생기면 안된다. 계수추정값들은 단위 변환에 맞추어서 적절히 바뀌고, R제곱은 전혀 영향을 받지 않는다. 

•  로그 변수의 경우에는, 측정 단위를 변환하더라도 기울기에는 아무런 변화가 생기지 않는다. 

 

 

 

728x90

댓글