👀 계량경제학 개인 공부용 포스트 글 입니다.
Ch3. Interval estimation and hypothesis testing in a Linear Regression Model
① Interval estimation
• 95% confidence interval for the paramter β2
• σ^2을 모른다면 → t-test
• Confidence interval (CI) : 신뢰구간은 좁을수록 좋다. 더 정확한 추론을 할 수 있기 때문!
↪ t 분포는 대칭적이기 때문에 CI 또한 대칭적이다.
↪ 유의성 α 는 가설검정을 위해 주어진다.
• 표준오차 se 와 표준편차의 차이
↪ 두 값 모두 분산에 sqrt 를 씌운 형태이지만
↪ 표준오차는 estimate 한 값을 포함하고, 표준편차는 데이터 그대로를 사용한다.
② Hypothesis Testing
• Null hypothesis H0 : β=c
• Alternative hypothesis H1
↪ beta 에 대한 정보를 전혀 가지고 있지 않다면, 양측검정을 진행하고, beta 에 대한 정보를 어느정도 가지고 있다면 단측검정을 진행한다.
• Test Statistic : 귀무가설 하에서의 분포
↪ 양측검정이라면 t(α/2) 값과 비교해야 되고, 단측검정이면 t(α) 값과 비교해야 한다.
• Type error
↪ type 1 error : null 가설이 참임에도 불구하고 기각하는 오류 α
↪ type 2 error : null 가설이 거짓임에도 불구하고 채택하는 오류 β
• p values
↪ pvalue 가 작다 : t 통계량이 critical value 보다 크다 : H0 기각 → 회귀계수가 유의한 설명변수에 해당한다.
↪ pvalue 가 크다 : t 통계량이 critical value 보다 작다 : H0 수용 → 회귀계수가 유의하지 않은 설명변수에 해당한다.
Ch4. Goodness of fit (model specifications) and some modeling Issues
① Measuring Goodness of fit (adequacy of the model)
• 선형모형의 적합도
양변제곱
결론,
• measure of goodness
↪ SSR=0 이라는 것은 b2=0 이라는 것과 동일하다. (y = b1 + b2x + e 모델에서)
↪ R^2 은 설명변수의 개수가 증가할 수록, 설명력에 관계없이 R^2 값은 증가한다 → adjusted R^2 를 사용
• Correlation Coefficient
② Modeling issue
• Marginal effect (한계효과) : independent variable 에 변화가 발생했을 때, dependent variable 이 어떻게 변하는지를 보여준다.
• Popular models used in economic modeling
a. log-log model
↪ x의 1% 변화가 y의 b% 변화를 이끌어낸다.
b. log-linear
c. linear-log
• Scaling the data
↪ t통계량은 스케일링을 거쳐도 변하지 않는다.
③ Testing for Normality
• error term 에 정규성을 가정한다면 : e ~ N(0,σ^2)
↪ 정규성을 확인하는 방법
1) distribution plot 을 그려봄
2) skewness 를 계산해봄 : 정규분포라면 값이 0
3) kurtosis (꼬리의 두께) 를 계산해봄 : 정규분포라면 값이 정확히 3
Ch5. Multiple Regression Model
① Introduction
• 다중회귀 : 설명변수가 2개 이상인 경우
• 다중회귀에서 한계효과
↪ 특정 설명 변수와 y에 대한 한계효과를 관측하기 위해서는, 다른 설명변수는 고정되어 있어야 한다.
② Econometric model
• 다중선형회귀의 특징
a. Linear model
b. Regression function
c. Homoskedasticity : 등분산 가정
d. Uncorrelatedness
e. No perfect multicollinearity
↪ example of multicollinearity
③ Estimating the parameters
④ Sampling properties of the LS estimator
• Central limit theorem
• Variance of the estimator
⑤ Multiple Hypothesis
• 모수를 2개 이상 검정하는 것 (모수에 대한 제약을 2개 이상 설정)
• R : restriction matrix
• 주의 : 제약갯수가 1개인 상황
• 모수에 대한 제약사항이 여러개일 때, t-test 를 한번에 하나씩 진행해야 하는 것일까? 👉 NO
Ch6. Further inference in multiple regression model Hypothesis testinig and model specification
① F-test : Joint tests
• Joint test : 다항회귀에서 가설검정을 하는 방법 (제약이 한 개 이상일때)
↪ SSE_U
↪ SSE_R
↪ F-test : 두 오차의 비율
② Single restriction test
• 여러개의 설명변수를 다루지만, 결국 하나의 제약조건을 담고있는 귀무가설이라면, t-test 로도 접근이 가능하다.
↪ H0 : β2 = β3
③ Testing for the significance of the model
• 모델의 유의성(적합성)
• F-test
④ Testing some economic hypotheses
• sales model : F-test
• sales model : 한계효과 검증
⑤ Model specifications : Omitted variable bias
• 변수누락에 의한 bias : 포함되어야 할 변수를 빠트리면 bias가 생긴다.
• bias 종류
↪ Positive bias : 원래의 β 보다 값을 크게 추정하는 과다추정의 경우
↪ Negative bias : 과소추정의 경우
example 1.
example 2.
⑥ Model specifications : RESET (regression specification error test)
• 모델 설정에 관한 연구 (게량경제에서 많이 다뤄진 분야) : 선형모형에 대한 가정이 올바른가
'1️⃣ AI•DS > ⚾ 계량경제•통계' 카테고리의 다른 글
Difference-in-Difference (DiD) (0) | 2023.04.03 |
---|---|
계량경제학 스터디 CH7,8,9,10정리 (0) | 2023.03.31 |
계량경제학 스터디 CH1,2 정리 (1) | 2023.03.13 |
Introduction to statistical learning - ch2 (0) | 2022.08.02 |
Mathematical Statistics with application : chapter 2 (0) | 2022.07.20 |
댓글