본문 바로가기
1️⃣ AI•DS/⚾ 계량경제•통계

계량경제학 강의_한치록_가정의 현실화 14장

by isdawell 2023. 5. 23.
728x90

 

👀 계량경제학 개인 공부용 포스트 글입니다. 

 

 

 

 

 

 

14.  오차의 자기상관 


 

①  클러스터로 묶이는 자료 

 

•  가령, 여러 가구들에 소속된 개인들로 구성된 데이터라면, 가구라는 클러스터로 구성되어 있을 수 있으며, 동일 클러스터에 속하는 사람들은 동일한 경험을 공유할 것으로 보이며, 오차항에 공통의 요소가 포함될 것이다. 동일 가구 내의 개인들의 오차항은 서로 연관되어 있을 가능성이 높다. 

•  이처럼 오차항이 클러스터 내에서는 임의로 연관되어 있고, 클러스터 간에는 서로 독립인 상황이 있을 수 있다. 이럴 때, 동분산과 독립추출을 가정한 통상적인 표준오차를 구하거나 독립추출만을 가정하는 HC 표준오차를 구하면 잘못된 추론을 할 수 있다. 

 

•  클러스터 구조를 감안해 분산을 추정해야 하며, 이 경우 분산 추정량을 cluster covariance estimator 라고 한다. CC0 

•  이러한 CC0 가 잘 동자가려면 전체 관측치의 개수가 아니라 클러스터의 개수가 커야 한다. 클러스터 개수가 너무 작다면, 클러스터 분산 추정량은 매우 나쁠 수 있다. (대부분의 관측치에 대해 오차항의 자기상관이 매우 높다는 것을 의미하므로) 

 

•  클러스터마다 단 하나의 관측치만 존재하는 상황은, 오차항이 이분산적이며 상호독립된 상황과 같다. 

 

 

•  R코드 

 

library(multiwayvcov) 
coeftest(ols, vcov = cluster.vcov, cluster = ~region, df_correction = F)

 

 

②  클러스터의 개수에 따른 조정 

 

•  클러스터의 개수가 많을 때 CC0 표준오차는 잘 동작하나, 개수가 그리 많지 않다면 CC0 값은 매우 작은 경향이 있다. 따라서 CC1 방법을 도입한다. 교정값을 곱해 자유도를 조정하는 방법이다. R에선 df_correction 옵션을 TRUE 로 설정하면 된다. 

 

 

③  시계열자료 

 

•  개별 독립성이나 클러스터 간 독립성은 모든 자료에서 다 성립되진 않는다. 예를 들어 관측치의 단위가 개인이 아니라 시간이라고 했을 때, 이를 시계열 변수라고 하고, 가까운 시점들 간에 서로 관련되기 쉽다. 이를 auto-correlation 이라고 한다. 시계열 분석의 목적은, 어떤 변수의 현재값이 과거의 정보에 의해 어떻게 설명되고 예측되는지 보는 것이다. 

 

•  시계열 분석은 그 자체로 독립적인 주제이다. 

 

 

 

④  오차의 시계열 상관 

 

•  EX. 제품가격t = β0 + β1•환율t + β2•원유가격t + β3•평균임금t + ut

↪  10년동안 월별 제품 가격과 환율, 원유가격, 제조업 평균 임금의 자료 (n=120) 

↪  t 첨자 : 월 

↪  ut : 우변에 나열된 변수 이외의 모든 요소들의 영향으로, 설명변수들로부터 독립이지만, 시간에 걸쳐 독립은 아니다. 

 

•  ut 들이 t에 걸쳐 상관될 때 가우스 마코프 가정의 중요한 항목이 위배되며, OLS 는 BLUE 가 아니게 된다. 더불어 통상적인 OLS 표준오차는 잘못되며 이를 이용하는 통상적인 t검정, F검정이 타당하지 않게 된다. 

 

 

⑴  오차항에 시계열 상관이 있을 때 OLS 를 이용한 추론 

 

•  Newey-West 분산 추정량 : 오차항에 이분산성과 시계열 상관이 있어도 견고한 분산추정량 (HAC) 

 

library(sandwich) 
coeftest(ols, vcov = vcovHAC)

 

 

⑵  오차항에 시계열 상관이 있을 때 GLS 

 

•  오차항에 시계열 상관이 있을 때 OLS 는 BLUE 가 아니다. 이때 GLS 를 하려면 시계열 상관이 어떤 식으로 이루어졌는지 가정한 후, 가정에 맞는 모형을 추정해 적절한 방식으로 관측치들을 변환시켜 OLS 를 해야 한다. ut 가 시간에 걸쳐 상관되어 있긴 한데, 특정한 방식으로 상관되어 있다고 하면, 이때 특정한 방식이란 ut = ρ•u_t-1 + εt 이고 εt 가 시간에 걸쳐 독립이고 분산이 σ_ε ^2 라는 것이다 (1계 자기회귀). 이에 입각해 적절하게 변형하면 오차항은 모두 동일분산을 갖고 서로 비상관을 가질 수 있다. 

 

•  Prais-Winsten 추정량, Cocharane-Orcutt 추정량 

•  1계 자기회귀와 다른 방식으로 오차의 시계열 상관에 대한 모형을 세울 수도 있다. 

 

 

⑶  시계열 상관의 검정 

 

•  오차항에 시계열 상관이 있는지 검정하는 방법 

•  표본의 크기가 크다면, OLS 추정을 하여 잔차 (ut^) 을 구하고 ut^ 을 u_t-1^ 에 대해 OLS 회귀한 후 그 계수가 0인지 검정하면 된다. 이는 DW test 로 가능하다. 

 

set.seed(101) 
x <- rep(c(-1,1),50) 
u <- rnorm(100) 
y <- 1+x+u 
library(lmtest) 
dwtest(y~x) 

# p-value : 0.36

 

p-value 에 따르면 오차항에 시계열 상관이 없어 보인다. (귀무가설 : 오차항에 시계열 상관이 없다 : 채택) 

 

•  DW 검정방법은 우변에 종속변수의 과거 값에 관련된 변수가 있다면 검정의 크기에 맞지 않아 사용할 수 없다. 

 

 

 

•  원래 회귀식의 우변에 종속변수의 과거값이 포함되어도 잘 작동되는 검정 방법 : Breusch-Godfrey 

 

bgtest(y~x) 

bgtest(y~x, order = 3) # ut_hat 을 xt, u_t-1, u_t-2, u_t-3 hat 에 대해 회귀한다

 

 

 

 

 

728x90

댓글