본문 바로가기
1️⃣ AI•DS/⚾ 계량경제•통계

계량경제학 스터디 CH3,4,5,6 정리

by isdawell 2023. 3. 19.
728x90

 

👀 계량경제학 개인 공부용 포스트 글 입니다. 

 

 

 

 

 

Ch3. Interval estimation and hypothesis testing in a Linear Regression Model 


 

① Interval estimation 

 

• 95% confidence interval for the paramter β2

 

 

• σ^2을 모른다면 → t-test 

 

 

 

 

Confidence interval (CI) : 신뢰구간은 좁을수록 좋다. 더 정확한 추론을 할 수 있기 때문! 

↪ t 분포는 대칭적이기 때문에 CI 또한 대칭적이다. 

↪ 유의성 α 는 가설검정을 위해 주어진다. 

 

 

표준오차 se 와 표준편차의 차이 

↪ 두 값 모두 분산에 sqrt 를 씌운 형태이지만 

↪ 표준오차는 estimate 한 값을 포함하고, 표준편차는 데이터 그대로를 사용한다. 

 

 

 

② Hypothesis Testing 

 

•  Null hypothesis H0 : β=c 

 

example

 

 

•  Alternative hypothesis H1 

 

↪ beta 에 대한 정보를 전혀 가지고 있지 않다면, 양측검정을 진행하고, beta 에 대한 정보를 어느정도 가지고 있다면 단측검정을 진행한다. 

 

 

 

•  Test Statistic : 귀무가설 하에서의 분포 

↪ 양측검정이라면 t(α/2) 값과 비교해야 되고, 단측검정이면 t(α) 값과 비교해야 한다. 

 

 

 

•  Type error 

 

type 1 error : null 가설이 참임에도 불구하고 기각하는 오류 α

↪ type 2 error : null 가설이 거짓임에도 불구하고 채택하는 오류 β

 

 

 

•  p values

 

↪ pvalue 가 작다 : t 통계량이 critical value 보다 크다 : H0 기각 → 회귀계수가 유의한 설명변수에 해당한다. 

↪ pvalue 가 크다 : t 통계량이 critical value 보다 작다 : H0 수용 → 회귀계수가 유의하지 않은 설명변수에 해당한다. 

 

 

 

 

 

 

 

 

 

 

Ch4. Goodness of fit (model specifications) and some modeling Issues 


 

① Measuring Goodness of fit (adequacy of the model) 

 

•  선형모형의 적합도 

 

양변제곱

 

 

결론,

 

 

 

•  measure of goodness 

 

 

↪ SSR=0 이라는 것은 b2=0 이라는 것과 동일하다. (y = b1 + b2x + e 모델에서) 

↪ R^2 은 설명변수의 개수가 증가할 수록, 설명력에 관계없이 R^2 값은 증가한다 → adjusted R^2 를 사용 

 

 

•  Correlation Coefficient 

 

 

 

 

② Modeling issue 

 

•  Marginal effect (한계효과) : independent variable 에 변화가 발생했을 때, dependent variable 이 어떻게 변하는지를 보여준다. 

 

 

•  Popular models used in economic modeling

 

a. log-log model 

elastic of y with respect to x : 탄력성이란, 독립변수가 1% 변했을 때 종속변수가 변하는 비율(%)을 나타내는 지표이다. 종속변수가 얼마나 민감하게 반응하는지를 나타내는 지표라고도 할 수 있겠다.

↪ x의 1% 변화가 y의 b% 변화를 이끌어낸다. 

 

b. log-linear 

c. linear-log 

 

 

•  Scaling the data 

↪ t통계량은 스케일링을 거쳐도 변하지 않는다. 

 

 

③ Testing for Normality 

 

• error term 에 정규성을 가정한다면 : e ~ N(0,σ^2) 

↪ 정규성을 확인하는 방법

    1) distribution plot 을 그려봄

    2) skewness 를 계산해봄 : 정규분포라면 값이 0 

    3) kurtosis (꼬리의 두께) 를 계산해봄 : 정규분포라면 값이 정확히 3 

 

 

 

 

 

 

 

 

Ch5. Multiple Regression Model 


 

① Introduction 

•  다중회귀 : 설명변수가 2개 이상인 경우 

 

•  다중회귀에서 한계효과 

 

↪ 특정 설명 변수와 y에 대한 한계효과를 관측하기 위해서는, 다른 설명변수는 고정되어 있어야 한다. 

 

 

 

② Econometric model 

 

 

•  다중선형회귀의 특징 

 

a. Linear model

b. Regression function 

c. Homoskedasticity : 등분산 가정 

 

d. Uncorrelatedness 

 

e. No perfect multicollinearity 

 

↪ example of multicollinearity 

 

 

 

 

③ Estimating the parameters 

 

 

 

 

 

 

④ Sampling properties of the LS estimator 

 

•  Central limit theorem 

 

•  Variance of the estimator 

 

 

 

 

⑤ Multiple Hypothesis 

 

•  모수를 2개 이상 검정하는 것 (모수에 대한 제약을 2개 이상 설정) 

 

•  R : restriction matrix 

 

 

•  주의 : 제약갯수가 1개인 상황 

 

 

 

 

•  모수에 대한 제약사항이 여러개일 때, t-test 를 한번에 하나씩 진행해야 하는 것일까? 👉 NO 

 

근거

 

 

 

 

 

Ch6. Further inference in multiple regression model Hypothesis testinig and model specification 


 

① F-test : Joint tests 

 

•  Joint test : 다항회귀에서 가설검정을 하는 방법 (제약이 한 개 이상일때) 

 

 

SSE_U

 

 

↪ SSE_R

 

↪ F-test : 두 오차의 비율 

귀무가설이 맞다면 F 통계량의 값은 매우 작을것

 

 

 

 

 

 

② Single restriction test 

 

• 여러개의 설명변수를 다루지만, 결국 하나의 제약조건을 담고있는 귀무가설이라면, t-test 로도 접근이 가능하다. 

↪ H0 : β2 = β3

 

 

 

③ Testing for the significance of the model 

 

• 모델의 유의성(적합성)

 

 

•  F-test 

 

 

 

 

④ Testing some economic hypotheses

 

•  sales model : F-test

 

 

•  sales model : 한계효과 검증 

 

 

 

 

⑤ Model specifications : Omitted variable bias 

 

•  변수누락에 의한 bias : 포함되어야 할 변수를 빠트리면 bias가 생긴다. 

 

 

 

•  bias 종류

↪ Positive bias : 원래의 β 보다 값을 크게 추정하는 과다추정의 경우 

↪ Negative bias : 과소추정의 경우 

 

example 1.

 

example 2.

 

 

 

⑥ Model specifications : RESET (regression specification error test) 

 

•  모델 설정에 관한 연구 (게량경제에서 많이 다뤄진 분야) : 선형모형에 대한 가정이 올바른가

 

 

 

 

 

 

728x90

댓글