본문 바로가기
1️⃣ AI•DS/⚾ 계량경제•통계

계량경제학 스터디 CH11,12,13,14,15정리

by isdawell 2023. 4. 9.
728x90

 

👀 계량경제학 개인 공부용 포스트 글 입니다. 

 

 

 

 

 

CH11. Endogeneity and Instrumental variables estimation 


 

①   Linear Regression with the random regressors

 

•  E(ei | xi) = 0 의 의미는 같은말로 Cov(e,x) = 0 : e 와 x의 공분산이 0 (상관관계가 없다) 

 

 

•  내생성과 외생성 

 

 

↪  내생성 : x 와 e 가 상관관계가 있다. 

↪  외생성 : x와 e 가 상관관계가 없다. E(xe) = 0 

 

 

 

 

②   When x and e are correlated (the case of endogeneity) 

 

•  x와 e가 연관되어있을 때 : 내생성 

 

예시1. 내생성 

 

 

 

• 예시2. 외생성 

 

 

 

• 예시3. 내생성

 

 

• 예시4. 내생성 : simultaneity 

 

 

 

•  외생성 조건이 깨지는 경우 

 

⇨ 1. Omitted variable 변수 누락 

 

 

누락된 변수로 인해, Cov(x,u) 가 0이 되지 않으며 내생성이 발생한다. 

 

 

 

⇨ 2. Measurement errors 측정오차 

 

 

측정오차로 인해, Cov(x,u) 가 0이 아니게 되며, OLS estimator b2 또한 biased (inconsistent) 된다.

 

 

⇨ 3. Lagged dependent variables model (time series) 

 

 

 

 

 

③   IV estimation 

 

•  E(xe) 가 0이 아닐때, bias 없이 어떻게 β를 estimation 할까 ⇨ e 와 correlation 이 없는 외생변수 z 를 찾아보자 ⇨ z 는 instrumental variable 

 

 

•  도구변수 조건 

↪ 1. E(ze) = 0 : e 와 correlation 이 없다. 

↪ 2. Corr(z,x) as high as possible : x와 z의 상관성은 높다. 

 

 

•  도구변수로 구한 β estimation : IV estimator 

 

 

 

 

 

④   Two-stage LS estimator 

 

•  IV 가 하나의 regressor 에 대해 다수로 존재할 수 있다. 도구변수는 많을수록 좋다. 

•  도구변수 생성 방법 

   ↪ 횡단면 자료 : Cov(z,e) = 0 , Cov(x,z) >> 0 

   ↪ 시계열 자료 : 주로 X Lag 를 많이 사용한다. (Xt, Xt-1, ...) 

 

 

[1단계] 외생적인 요인 추출 : regressor 에 대하여 외생변수 (k개) 에 대해 회귀분석을 돌려 내생변수를 만든다. 

 

 

 

 

[2단계] exogenous components  에 대한  y 의 회귀분석을 진행한다. x^ 은 z에 대한 정보만을 포함하고 있으며, v 와 상관관계가 없다. 

 

 

 

•  example 1

 

 

 

•  example 2

 

 

•  example 3

 

 

 

 

•  시계열 자료에서의 도구변수

 

 

 

 

 

 

⑤   Efficiency of IV estimator 

 

• 도구변수를 사용했을 때의 estimator 의 분산은, OLS 의 estimator 분산보다 항상 크다. 즉, b_IV 가 덜 효율적이다. 

 

 

 

• 도구변수가 x 변수와 강한 상관관계를 가질 때, strong IV 라고 부른다. 

• 도구변수가 strong 한지 weak 한지 t-test (for one IV) 혹은 F-test (for multiple IVs) 한지를 검정할 수 있다. 

 

 

 

 

 

 

 

 

CH12. Volatility ARCH models 


 

 

 

출처

 

 

①   ARCH 

 

•  AutoRegressive Conditional Heteroskedasticity 시차를 가지는 조건부 이분산성 

•  Volatility = 변동성 = 분산 : 금융경제학에서 매우 중요한 지표 중 하나다. 시계열에서 변동성을 예측하는 것에 관해 다룬다. 

 

•  shock (충격) e 는 unpredictable 하다. 따라서 우리는 e의 분산을 예측하는데 집중한다. 

 

조건부분산

 

  Volatility 는 다양한 방식으로 모델링 될 수 있는데, 여기서는 ARCH 모델에 대해 배워보려고 한다. 

 

 

 

  ARCH 

 

 

 

↪ error 에 대한 가정들 : E(et) = 0 , E(et∙e_t-j) = 0, 동분산성, E(et | I_t-1) = 0 예측불가능성, E(et^2 | I_t-1) = ht 

 

↪ Volatility Clustering 군집현상 

 

 

 

 

 

②   ARCH(1) process equals to AR(1) process for squared errors 

 

 

 

• ARCH(1) 모델은 AR(1) 모델로 작성해볼 수 있다. 

 

 

 

 

 

③   Testing for ARCH 

 

• ARCH 를 만드는 term 이 존재하는지 안하는지에 대한 검정 

 

 

 

 

 

 

④   GARCH 

 

• Generalized ARCH 

 

 

 

Summary 

 

 

 

 

 

 

 

 

CH13. Multiple time series and VAR (Vector Autoregression) models 


 

다변수 시계열, AR 을 vector 로 확장 Vector auto regression 

 

 

 

 

①  Structural and reduced from models 

 

 

•  x와 y 의 2개의 시계열 변수 

 

•  SF : structural form 

x 와 y 변수를 벡터형태로 표현한 Zt 변수에 대해 풀어서 적으면 AR(1) form 을 만족한다. 

 

VAR form 에서 error ut 는 correlated 되어있다. 

 

 

 

 

•  structural model 에서 미지수의 개수 

 

 

 

 

 

 

 

 

 

②   Estimating VAR model and Impulse response analysis 

 

• VAR(1) 

 

 

 

•  충격반응분석 : 모형으로부터 도출된 이동평균모형으로 경제에 예상치 못한 변화 (충격) 이 주어졌을 때, 모형내 모든 변수들이 시간의 흐름에 따라 어떻게 각 충격에 반응하는가를 나타내주는 것. 간단하게 얘기하면 한 변수에 충격이 가해졌을 때, 다른 변수들에 어떠한 영향이 있는지를 살펴보는 분석이다. 

 

 

⇨ 충격반응 분석이 의미있으려면, 충격들 사이에 상관관계가 없어야 한다. 즉, Ut 를 서로 uncorrelated 하게 만들어야 한다 ⇨ Cholesky Decompositions:

 

 

•  Cholesky Decompositions : Steps to obtain orthogonalized(uncorrelated) shocks

 

 

 

 

•  촐레스키 분해 이후 충격반응 분석 

 

 

 

 

③   Application of VAR model : Granger-Causality 

 

• 인과관계보단, 예측의 의미로 봐야한다. 

 

•  y의 영향은 없다. y does not G-cause over x 

 

 

 

  Granger-Causality between the two series  

 

 

 

 

 

CH14. Regression with Panel data 


 

①   Introduction 

 

•  패널 데이터를 사용하는 이유 : 모형 설정 차원에서 관측되지 않는 이질성을 살펴볼 수 있다. 변수누락편향을 줄일 수 있다. 

 

•  패널 데이터 

 

 

패널 모델을 사용하여, 관측되지 않는 영향을 제거하여 unbiased 된 estimator 를 구할 수 있다. 

 

 

 

 

 

 

 

②   Unobserved heterogeneity and Fixed Effects panel model 

 

•  example of panel data 

 

 

•  Panel model 

 

 

 

 

•  Fixed effects or Random effects 

 

αi 부분을 어떻게 접근할 것인지에 따라 Panel 모델은 2가지로 나뉠 수 있다. 

 

 

•  FE model 

 

 

•  RE model 

 

 

 

•  FE model 을 선택해야 할까 RE model 을 선택해야 할까 

 

(ex1). 임금과 사원연수 

 

 

 

(ex2). 특허권과 연구개발비용 

 

 

(ex3). 고속도로 차사고 사망률

 

 

 

•  Estimation 방법

 

(1) First-Difference Approach : 서로 다른 t 시점의 값을 이용해, 차분을 통해 α 부분을 제거한다. 

 

 

 

(2) Demeaned Regression : 원래 값과, 평균 값의 차분을 통해 α 를 제거한다. 

 

 

 

 

 

③   Random effects model 

 

• RE 모델의 경우, 이분산성이 발생하기 때문에 OLS estimate 가 아닌 GLS 로 추정을 진행해야 한다. 

 

 

④   Specification Tests  : Hausman test 

 

 

•  따라서 Cov 를 직접 구하기 보단, FE 의 beta 추정값과 RE 의 beta 추정값의 차이를 기준으로 가설검정을 진행한다. 

 

 

 

 

⑤   Time Effects Model 

 

• 시간효과 : 시간에 따라서만 변하는 변수가 있을 수 있음 → demeaned model 로 관측불가능한 해당 변수를 제거 

 

 

 

 

⑥   IV estimations in panel models 

 

• 내생성 문제를 패널 모델에 적용해볼 수 있다. 

 

 

 

 

 

⑦   Policy analysis using panel data 

 

• DID model → using panel data 

 

 

 

 

 

 

CH15. Models with discrete choice variables 


 

①   Binary Choice Models 

 

 

• 조건부 평균은 조건부 확률값이 된다. 

 

 

• 이때 F function 은 선형으로 모델링 하면 안된다 ⇨ Probit model 을 사용하여 F 결과를 0~1사이의 값으로 나오도록 해야 한다. 

 

 

 

 

 

②   Probit model 

 

• 누적분포함수 cdf 를 사용해 F(x,β) 를 0과 1사이의 값이 나오는 함수가 되도록 모델링 한다. 

 

 

 

 

 

 

 

728x90

댓글