👀 계량경제학 개인 공부용 포스트 글입니다.
• 모수에 대응하는 숫자를 표본으로부터 구하는 것을 estimation 추정 이라고 한다. 추정 공식을 estimator (추정량) 이라고 하고, 공식을 실제 자료에 적용해 값을 구하면 추정값 (estimate) 라고 한다.
3. 단순회귀 모형의 추정
① 자료
• (x1,y1), (x2,y2), ..., (xn,yn) → 관측된 표본
② 직선 그리기
• 회귀식을 추정하여 구한 기울기 추정값이 자동적으로 인과관계를 나타내지는 않는다는 점을 명심해야 한다.
③ 최소제곱법
◯ 최소제곱법
• 수직 방향거리를 제곱하여 합한 값을 가장 작게 만들도록 절편과 기울기를 결정한다. OLS 라고도 부른다. 각 점들로부터 직선까지 수직방향 거리를 구하고 이들을 모두 제곱해 합한 숫자를 계산한다.
abline(lm(y~x, data = df), lty = 1)
④ Fitted value and Residual
• fitted value : 추정한 회귀식으로부터 얻어진 예측값 ⇨ yi_hat
• residual : 잔차, 관측값 yi 에서 맞춘값 yi_hat 을 뺀 것 ⇨ ui_hat
• yi = yi_hat + ui_hat
• Σ ui_hat = 0 : 잔차들의 합은 0이다.
• Σ xi•ui_hat = 0 : 잔차와 설명변수의 곱의 합은 0이다.
⇨ 두 식이 만족되지 않으면 회귀계수들은 최소제곱 추정값이 아니다.
• fitted value 가 추정하는 값
↪ 가령 모집단 내 X의 값이 16인 개체들을 따로 모아 Y값의 평균을 구한 것은 E(Y|X=16) 으로 표시하는데, 선형모형에 따르면 β0 + β1•16 이다. β_hat0 + β_hat1•16 이면 E(Y|X=16) 의 추정값이 된다.
⑤ 종속변수가 로그일 때 계수 추정값의 해석
• 종속변수가 로그형태가 아니라면, 여러가지 표현이 가능하다. 가령 Y_hat = 13 + 31•X 라면, X의 계수추정값 31에 대해 다음과 같은 해석들이 가능하다.
↪ 여타 모든 요소들 (u) 을 고정할 때, X의 한 단위 증가는 Y를 31 단위 증가시킬 것으로 추정된다.
↪ X가 한 단위 증가할 때, Y의 평균은 31.2단위 증가할 것으로 추정된다.
↪ X가 한 단위 증가할 때, Y의 예측값은 31.2단위 증가한다.
↪ X가 한 단위 증가할 때, Y는 31.2 단위 증가할 것으로 예측된다.
⇨ E(Y|X) = β0 + β1•X 이기 때문이다.
• 반면, 종속변수가 log 형태를 취하고 있다면, "X가 한단위 증가할 때, log(Y) 가 평균 약 β1 증가하는 것으로 추정된다" 라는 표현은 옳지만, "X가 한단위 증가할 때, Y가 평균 약 β1•100 % 증가하는 것으로 추정된다" 라고 해석하는 것은 엄밀히 말하면 옳지 않다.
• 모형이 logY = β0 + β1•X + u 이고 만약 β1 의 참값이 0.01 이라고 하면, 여타 모든 요소 u가 고정된 채 X가 한 단위 증가하면 logY 는 0.01 증가하고 이는 Y가 약 1% 증가하는 것과 같다.
⑥ 제곱합
SST = SSE + SSR
• SST : 표본 내 종속변수 값들의 차이를 측정한다. SST 가 0이면 종속변수의 관측값들이 모두 동일함을 나타낸다. 표본 내 개체별로 종속변수의 값들이 크게 다르면 SST 값도 크다.
• SSE : 종속변수 값 중 독립변수에 의해 설명된 부분이 얼마나 큰 차이가 있는지 나타낸 것. y_hat_i 가 서로 모두 동일하면 값이 0이되고, 개체 간에 y_hat_i 의 값에 큰 차이가 있다면 SSE 값도 크다.
• SSR : 설명변수들에 의해 설명되지 않은 나머지 부분의 차이의 크기를 나타낸 것.
⑦ 모형의 설명력 : R-sqaured
• R-squared = SSE/SST = 1 - (SSR/SST)
• √R-squared = cor(x,y)
⑧ 측정단위의 변환
• 변수들의 측정단위를 바꿀 때, 기울기의 단위가 변화하긴 하겠지만, 해석에 있어선 어떠한 실질적인 변화도 생기면 안된다. 계수추정값들은 단위 변환에 맞추어서 적절히 바뀌고, R제곱은 전혀 영향을 받지 않는다.
• 로그 변수의 경우에는, 측정 단위를 변환하더라도 기울기에는 아무런 변화가 생기지 않는다.
'1️⃣ AI•DS > ⚾ 계량경제•통계' 카테고리의 다른 글
계량경제학 강의_한치록_단순회귀 4장 (0) | 2023.05.12 |
---|---|
계량경제학 스터디 Lecture 3. Matching (0) | 2023.05.12 |
계량경제학 강의_한치록_단순회귀 2.5~2.7장 (1) | 2023.05.10 |
계량경제학 스터디 Lecture 2. Regression (1) | 2023.05.10 |
R 강좌 : 정책효과 분석 : 이중차분법 DiD, 삼중차분법 DDD (0) | 2023.05.09 |
댓글