👀 계량경제학 개인 공부용 포스트 글입니다.
14. 오차의 자기상관
① 클러스터로 묶이는 자료
• 가령, 여러 가구들에 소속된 개인들로 구성된 데이터라면, 가구라는 클러스터로 구성되어 있을 수 있으며, 동일 클러스터에 속하는 사람들은 동일한 경험을 공유할 것으로 보이며, 오차항에 공통의 요소가 포함될 것이다. 동일 가구 내의 개인들의 오차항은 서로 연관되어 있을 가능성이 높다.
• 이처럼 오차항이 클러스터 내에서는 임의로 연관되어 있고, 클러스터 간에는 서로 독립인 상황이 있을 수 있다. 이럴 때, 동분산과 독립추출을 가정한 통상적인 표준오차를 구하거나 독립추출만을 가정하는 HC 표준오차를 구하면 잘못된 추론을 할 수 있다.
• 클러스터 구조를 감안해 분산을 추정해야 하며, 이 경우 분산 추정량을 cluster covariance estimator 라고 한다. CC0
• 이러한 CC0 가 잘 동자가려면 전체 관측치의 개수가 아니라 클러스터의 개수가 커야 한다. 클러스터 개수가 너무 작다면, 클러스터 분산 추정량은 매우 나쁠 수 있다. (대부분의 관측치에 대해 오차항의 자기상관이 매우 높다는 것을 의미하므로)
• 클러스터마다 단 하나의 관측치만 존재하는 상황은, 오차항이 이분산적이며 상호독립된 상황과 같다.
• R코드
library(multiwayvcov)
coeftest(ols, vcov = cluster.vcov, cluster = ~region, df_correction = F)
② 클러스터의 개수에 따른 조정
• 클러스터의 개수가 많을 때 CC0 표준오차는 잘 동작하나, 개수가 그리 많지 않다면 CC0 값은 매우 작은 경향이 있다. 따라서 CC1 방법을 도입한다. 교정값을 곱해 자유도를 조정하는 방법이다. R에선 df_correction 옵션을 TRUE 로 설정하면 된다.
③ 시계열자료
• 개별 독립성이나 클러스터 간 독립성은 모든 자료에서 다 성립되진 않는다. 예를 들어 관측치의 단위가 개인이 아니라 시간이라고 했을 때, 이를 시계열 변수라고 하고, 가까운 시점들 간에 서로 관련되기 쉽다. 이를 auto-correlation 이라고 한다. 시계열 분석의 목적은, 어떤 변수의 현재값이 과거의 정보에 의해 어떻게 설명되고 예측되는지 보는 것이다.
• 시계열 분석은 그 자체로 독립적인 주제이다.
④ 오차의 시계열 상관
• EX. 제품가격t = β0 + β1•환율t + β2•원유가격t + β3•평균임금t + ut
↪ 10년동안 월별 제품 가격과 환율, 원유가격, 제조업 평균 임금의 자료 (n=120)
↪ t 첨자 : 월
↪ ut : 우변에 나열된 변수 이외의 모든 요소들의 영향으로, 설명변수들로부터 독립이지만, 시간에 걸쳐 독립은 아니다.
• ut 들이 t에 걸쳐 상관될 때 가우스 마코프 가정의 중요한 항목이 위배되며, OLS 는 BLUE 가 아니게 된다. 더불어 통상적인 OLS 표준오차는 잘못되며 이를 이용하는 통상적인 t검정, F검정이 타당하지 않게 된다.
⑴ 오차항에 시계열 상관이 있을 때 OLS 를 이용한 추론
• Newey-West 분산 추정량 : 오차항에 이분산성과 시계열 상관이 있어도 견고한 분산추정량 (HAC)
library(sandwich)
coeftest(ols, vcov = vcovHAC)
⑵ 오차항에 시계열 상관이 있을 때 GLS
• 오차항에 시계열 상관이 있을 때 OLS 는 BLUE 가 아니다. 이때 GLS 를 하려면 시계열 상관이 어떤 식으로 이루어졌는지 가정한 후, 가정에 맞는 모형을 추정해 적절한 방식으로 관측치들을 변환시켜 OLS 를 해야 한다. ut 가 시간에 걸쳐 상관되어 있긴 한데, 특정한 방식으로 상관되어 있다고 하면, 이때 특정한 방식이란 ut = ρ•u_t-1 + εt 이고 εt 가 시간에 걸쳐 독립이고 분산이 σ_ε ^2 라는 것이다 (1계 자기회귀). 이에 입각해 적절하게 변형하면 오차항은 모두 동일분산을 갖고 서로 비상관을 가질 수 있다.
• Prais-Winsten 추정량, Cocharane-Orcutt 추정량
• 1계 자기회귀와 다른 방식으로 오차의 시계열 상관에 대한 모형을 세울 수도 있다.
⑶ 시계열 상관의 검정
• 오차항에 시계열 상관이 있는지 검정하는 방법
• 표본의 크기가 크다면, OLS 추정을 하여 잔차 (ut^) 을 구하고 ut^ 을 u_t-1^ 에 대해 OLS 회귀한 후 그 계수가 0인지 검정하면 된다. 이는 DW test 로 가능하다.
set.seed(101)
x <- rep(c(-1,1),50)
u <- rnorm(100)
y <- 1+x+u
library(lmtest)
dwtest(y~x)
# p-value : 0.36
p-value 에 따르면 오차항에 시계열 상관이 없어 보인다. (귀무가설 : 오차항에 시계열 상관이 없다 : 채택)
• DW 검정방법은 우변에 종속변수의 과거 값에 관련된 변수가 있다면 검정의 크기에 맞지 않아 사용할 수 없다.
• 원래 회귀식의 우변에 종속변수의 과거값이 포함되어도 잘 작동되는 검정 방법 : Breusch-Godfrey
bgtest(y~x)
bgtest(y~x, order = 3) # ut_hat 을 xt, u_t-1, u_t-2, u_t-3 hat 에 대해 회귀한다
'1️⃣ AI•DS > ⚾ 계량경제•통계' 카테고리의 다른 글
계량경제학 강의_한치록_내생적인 설명변수 16장 (1) | 2023.05.24 |
---|---|
계량경제학 강의_한치록_내생적인 설명변수 15장 (0) | 2023.05.24 |
계량경제학 강의_한치록_가정의 현실화 13장 (1) | 2023.05.22 |
계량경제학 강의_한치록_가정의 현실화 12장 (1) | 2023.05.22 |
계량경제학 강의_한치록_다중회귀 11장 (0) | 2023.05.21 |
댓글