👀 계량경제학 개인 공부용 포스트 글입니다.
1. 준비
① 계량경제학 근본 문제
• 모집단 : 관심의 대상이 되는 집단
• 모집단 전체를 관측할 수 없는 대신, 모집단으로부터 추출된 일부 관측값들 자료 (데이터) 를 가지고 있다.
• 모집단에 관심을 가지면서도 모집단을 분석하지는 못하고 극히 일부 자료만을 분석하고 그 결과에 의존하여 모집단에 대한 추론을 해야 한다는 것이 계량경제학의 근본문제이다.
② 인과관계
• 계량경제학은 흔히 인과적 영향에 관심을 갖는다.
• 인과적 영향이란 "다른 조건이 같고 ceteris paribus 하나의 요소만 다를 때의 차이" 를 의미한다.
• 인과적 영향은 다른 면은 모두 동일하고 해당 요인만 다른 완벽한 쌍둥이를 비교함으로써 측정할 수 있을 것이다. 자연과학이나 공학에서는 실험으로써 어느정도 인과적 영향을 측정하는 것이 가능하나, 인간 혹은 인간의 활동을 대상으로 하는 연구는 그렇지 않다.
• 사회과학은 인간의 행동과 관련되어 있기 때문에 통제된 상태의 실험을 하기가 매우 어렵다. 그러나 어느정도 범위 내에서 인과관계를 측정할 수 있으며 이는 계량경제학의 가장 중요한 주제 중 하나이다.
• 실제 응용연구에서 무엇까지 통제할지에 대한 통용되는 답은 없다. 관심사가 무엇인지 명확히하고 관심사에 맞추어 계량경제 분석을 수행할 능력을 갖추어야 한다.
• 한 변수 X 가 다른 변수 Y에 미치는 인과적 영향을 측정하기 위해서는 X를 제외한 여타 요소는 모두 고정시키고 X만을 변화시킬 때 Y가 변하는 정도를 측정하면 된다.
③ 통계학의 기초
◯ 모집단, 표본, 자료
• 모집단 : 관심을 갖는 집단
• 표본 : 모집단으로부터 임의로 추출해 구하는 개체들의 집단
• 표본크기 : 개체들의 수
• dataset : 관측한 값들의 집합
• 표본의 관측을 '반복' 하면 dataset 이 달라질 것이며, 현재 가지고 있는 dataset 은 어쩌다보니 실현된 우연의 산물이다.
◯ 상수, 변수, 확률변수
• 값이 변하지 않으면 상수, 값이 변할 수 있으면 변수, 특히 모집단으로부터 추출을 반복할 때 값이 매번 변할 수 있으면 확률변수라 한다.
• 퇴화된 확률변수 (degenerated) : 가령 여성으로만 이루어진 모집단이라면, 성별은 원래 변수여야 하는데, 모집단에 여성밖에 없기 때문에 성별변수는 퇴화되었다고 볼 수 있다.
• Xi 가 확률변수라는 말은 X1,..,Xn 이 서로 간에 다름을 의미하는 것이 아니라, X1 도 확률변수이고, X2 도 확률변수이고 ,,, 나머지도 각각이 확률변수라는 뜻이다.
• 표본평균
◯ 확률
• 주어진 모집단으로부터 한 번 추출하여 관측하는 값은 확률변수이다. 추출할 때마다 값이 달라지기 때문
• 모집단과 확률변수에 대해 어떤 사건이 일어날 확률 : 모집단으로부터 한 값을 임의로 추출해 해당 사건이 일어나는지 확인하는 행위를 독립적으로 무한반복 실행할 때, 전체 시행 횟수 중 해당 사건이 일어날 궁극적인 비율 = 사건의 확률
◯ 분포
• 집합 A에 속하는 사건이 발생할 확률과 같이, X와 관련된 모든 사건에 대해 확률을 구하면 X의 확률분포 또는 분포라고 한다.
◯ 모수
• 모집단의 분포를 특징적으로 나타내는 수 = 모수, 파타미터
• 모수는 모집단의 속성이므로 표본추출 반복시행 시 변하지 않는다.
◯ 통계량
• statistics 는 확률변수다.
계량경제학의 근본적인 문제는 모집단에 관심이 있지만, 그 일부인 표본밖에 사용하지 못한다는 것이다. 관심있는 모수가 있을 때 이를 추정하기 위하여 어떤 통계량을 사용할지 아는 것이 계량경제학의 핵심 중 하나이다.
④ 계산과 생각
• 생각 → 계산 → 생각
• 모형 설정 → 추정 → 추론 : 모집단에 대한 생각
2. 단순 선형회귀 모형과 그 해석
① 선형모형
• 계량경제학의 주된 관심사는 다른 조건이 동일할 때 하나의 변수 값에 차이가 있으면 핵심 변수가 어떻게 영향을 받는지에 대한 인과관계 문제이다.
• 임금 = a + bx학력 + 여타 요소들의 영향 ⇨ 선형모형
② 회귀
• 어떤 변수들이 다른 변수에 영향을 미치는 것을 나타내는 방정식 : 회귀식
• 임금 = a + bx학력 + u
↪ 학력 : 영향을 미치는 변수
↪ 임금 : 영향을 받는 변수
↪ u : 임금에 영향을 미치는 모든 여타 요소들의 총효과
↪ u 가 고정될 때, 학력의 1 단위 변화는 임금을 b만큼 증가시킨다.
③ 단순 선형 회귀 모형
• Y = a + bX + u : 단순선형회귀모형
↪ 우변 마지막 항인 u 는 Y에 영향을 미치는 요소들 중 X를 제외한 나머지 모든 요소들의 총영향을 의미한다. X가 Y 에 미치는 인과적 영향을 파악하고자 할 때, 우리가 고정시키고자 하는 요소들의 총 영향이다.
↪ (X,Y) 관측값들은 우리가 볼 수 있는 값이지만, u 는 관측하지 못한다.
• Y : 결과, X에 의해 설명되는 변수
• X : 원인, Y를 설명하는 변수
• u : X와 Y의 관계를 교란하는 항 (교란항, 오차항)
• Y = β0 + β1•X + u
↪ β1 : X 가 Y에 미치는 인과적 영향을 나타내는 모수
↪ u 로 인해 X와 Y간에 정확한 관계가 성립되지 않는다.
• 인과관계를 알기 위해, 다른 요소들을 고정시킬 때, "다른 요소" 들의 범위가 불분명할 수 있다. u 를 통제할 여타요소들이라고 하는 것은 직관적이고 이해에 도움이 된다. 그러나 계량경제학은 결국 E(Y|X) = β0 + β1•X 와 같은 조건부 평균 함수를 추정하는 것이다.
④ 인과적 영향 대 평균의 차이
• β1 : 여타 모든 요소들의 영향 (u) 이 고정될 때, X의 한 단위 증가가 Y에 미치는 영향 (인과적 영향)
• X와 Y의 결합확률분포를 알면 E(Y|X) 를 알 수 있다.
↪ 각 X값에 해당하는 구획에 대해 Y의 평균을 구한다. 이 구획별 평균을 '조건부 평균', E(Y|X) 라고 한다.
• E(Y|X) = α0 + α1•X
• Y = β0 + β1•X + u
↪ α1 = β1 이 될 때 : E(u|X) = 0 일때
↪ u 는 관측불가능하다는 사실을 기억
↪ E(u|X) 는 0이 아니어도 된다. X에 의존하지만 않는 다면 어떤 상수값을 가져도 괜찮다.
• X값에 따라 모집단을 구획할 때 모든 구획에서 u의 평균이 동일하면, E(u|X) 가 상수이면 평균상의 차이와 인과적 영향은 동일하다.
'1️⃣ AI•DS > ⚾ 계량경제•통계' 카테고리의 다른 글
계량경제학 스터디 Lecture 2. Regression (1) | 2023.05.10 |
---|---|
R 강좌 : 정책효과 분석 : 이중차분법 DiD, 삼중차분법 DDD (0) | 2023.05.09 |
계량경제학 스터디 Lecture 1. Introduction (0) | 2023.05.08 |
계량경제학 스터디 CH11,12,13,14,15정리 (0) | 2023.04.09 |
Difference-in-Difference (DiD) (0) | 2023.04.03 |
댓글