👀 계량경제학 개인 공부용 포스트 글입니다.
9. 다중회귀 추정량의 성질
① 모형의 구성항목들에 대한 가정
• 설명변수 관측값들 (xij) 에 대한 가정
↪ 설명변수 표본값 고정 : 설명변수의 관측값들은 반복추출 시 변하지 않는다.
↪ 비특이성 : 설명변수들의 관측값들 간에 선형종속의 관계가 존재하지 않는다.
• 오차항의 값들 (u1,..,un) 에 대한 가정
↪ 오차평균 0 : E(u | X1,...,Xk) = 0
↪ 동일분산 : var(u | X1,...,Xk) , i 별로 상이한 고정된 값에 의존하지 않고 상수이면 성립
↪ 독립추출 : 관측치들의 오차값들은 서로 독립적으로 추출된다.
↪ 정규분포 : 관측치들의 오차값들은 정규분포를 갖는 모집단으로부터 추출된다.
② 변수를 누락시킬 때
• EX. log(임금) = β0 + β1•학력 + β2•경력 + u
↪ 경력이 동일한 사람들만 모은 상태에서 학력이 1년 길면 임금은 평균 약 100β1 % 높다.
↪ 만약 경력 변수가 누락된다면, β1 대신에 β1 + δ•β2 가 추정된다.
• X1의 총 효과 = X1의 직접효과 + X2를 경유한 간접효과
▸ 직접효과 : X2 를 통제한 상태에서 X1이 변할 때 Y가 평균적으로 영향을 받는 정도
▸ 간접효과 : X1의 변화가 X2의 변화와 물려 Y를 평균적으로 변화시키는 정도
• β1~ = β1^ + β2^•δ1~
↪ δ1 은 X2를 좌변에두고 X1을 우변에 둔 상태에서 최소제곱을 추정하여 나온 기울기 추정값이다.
• 통제하고자 하는 변수가 종속변수에 별도의 영향을 미치지 않거나 여타 설명변수와 무관하면 누락시켜도 OLS 추정량은 여전히 비편향이다.
• 모형의 설명변수들과 무관하거나 Y에 별도의 영향을 미치지 않는 변수들은 우변에 포함시켜 추가로 통제하더라도 OLS 추정량은 여전히 비편향이다.
③ 최소제곱 추정량의 분산
• r_i1 : X1 을 다른 모든 설명변수로 회귀시킨 후 나온 잔차
• var(βj) = σ^2 / Σ r_ij^2
④ 가우스 마코프 정리
• 설명변수 표본값들이 표본추출 반복시행 시 변화하지 않고, 특이성이 없으며, 오차평균0, 동분산, 독립추출의 가정 하에서 OLS 추정량보다 더 분산이 작은 선형 비편향 추정량은 없다. 즉, OLS 추정량은 가장 좋은 선형 비편향 추정량 (BLUE) 이다.
⑤ 설명변수의 추가 도는 누락과 추정량의 분산
• Y에 별도의 영향을 미치지 않으면서 X1과 연관된 변수를 우변에 추가하면, 추가된 변수의 통제 이후 남은 X1 변수 내 정보가 삭감되어 X1 계수 추정량의 표집분산이 커지고 정확도가 떨어진다.
• Y에 대한 별도의 설명력을 가지면서도 X1과 상관되지 않은 변수를 통제하면 설명불가능 요인들(오차항) 의 변동성이 줄면서도 X1 내의 정보가 삭감되지 않아 다중회귀가 단순회귀보다 더 효율적인 추정량을 제공한다.
※ 신뢰구간 : 다중회귀모형의 경우에는 자유도가 n-k-1 이 된다.
'1️⃣ AI•DS > ⚾ 계량경제•통계' 카테고리의 다른 글
계량경제학 스터디 Lecture 7. DiD (0) | 2023.05.19 |
---|---|
계량경제학 강의_한치록_다중회귀 10장 (1) | 2023.05.19 |
계량경제학 스터디 Lecture 6. Panel Data (1) | 2023.05.16 |
계량경제학 강의_한치록_다중회귀 8장 (0) | 2023.05.16 |
계량경제학 스터디 Lecture 5. Instrumental variables (0) | 2023.05.15 |
댓글