본문 바로가기
1️⃣ AI•DS/⚾ 계량경제•통계

계량경제학 강의_한치록_단순회귀 1장~2.4장

by isdawell 2023. 5. 9.
728x90

 

👀 계량경제학 개인 공부용 포스트 글입니다. 

 

 

 

 

 

1. 준비 


 

①  계량경제학 근본 문제 

 

•  모집단 : 관심의 대상이 되는 집단 

•  모집단 전체를 관측할 수 없는 대신, 모집단으로부터 추출된 일부 관측값들 자료 (데이터) 를 가지고 있다. 

•  모집단에 관심을 가지면서도 모집단을 분석하지는 못하고 극히 일부 자료만을 분석하고 그 결과에 의존하여 모집단에 대한 추론을 해야 한다는 것이 계량경제학의 근본문제이다. 

 

 

 

②  인과관계 

 

•  계량경제학은 흔히 인과적 영향에 관심을 갖는다. 

•  인과적 영향이란 "다른 조건이 같고 ceteris paribus 하나의 요소만 다를 때의 차이" 를 의미한다. 

•  인과적 영향은 다른 면은 모두 동일하고 해당 요인만 다른 완벽한 쌍둥이를 비교함으로써 측정할 수 있을 것이다. 자연과학이나 공학에서는 실험으로써 어느정도 인과적 영향을 측정하는 것이 가능하나, 인간 혹은 인간의 활동을 대상으로 하는 연구는 그렇지 않다. 

•  사회과학은 인간의 행동과 관련되어 있기 때문에 통제된 상태의 실험을 하기가 매우 어렵다. 그러나 어느정도 범위 내에서 인과관계를 측정할 수 있으며 이는 계량경제학의 가장 중요한 주제 중 하나이다. 

•  실제 응용연구에서 무엇까지 통제할지에 대한 통용되는 답은 없다. 관심사가 무엇인지 명확히하고 관심사에 맞추어 계량경제 분석을 수행할 능력을 갖추어야 한다. 

 

•  한 변수 X 가 다른 변수 Y에 미치는 인과적 영향을 측정하기 위해서는 X를 제외한 여타 요소는 모두 고정시키고 X만을 변화시킬 때 Y가 변하는 정도를 측정하면 된다. 

 

 

 

 

③  통계학의 기초 

 

 

◯  모집단, 표본, 자료 

 

•  모집단 : 관심을 갖는 집단 

•  표본 : 모집단으로부터 임의로 추출해 구하는 개체들의 집단 

•  표본크기 : 개체들의 수 

•  dataset : 관측한 값들의 집합 

•  표본의 관측을 '반복' 하면 dataset 이 달라질 것이며, 현재 가지고 있는 dataset 은 어쩌다보니 실현된 우연의 산물이다. 

 

 

◯  상수, 변수, 확률변수 

 

•  값이 변하지 않으면 상수, 값이 변할 수 있으면 변수, 특히 모집단으로부터 추출을 반복할 때 값이 매번 변할 수 있으면 확률변수라 한다. 

•  퇴화된 확률변수 (degenerated) : 가령 여성으로만 이루어진 모집단이라면, 성별은 원래 변수여야 하는데, 모집단에 여성밖에 없기 때문에 성별변수는 퇴화되었다고 볼 수 있다. 

•  Xi 가 확률변수라는 말은 X1,..,Xn 이 서로 간에 다름을 의미하는 것이 아니라, X1 도 확률변수이고, X2 도 확률변수이고 ,,, 나머지도 각각이 확률변수라는 뜻이다. 

•  표본평균 

 

 

◯  확률

 

•  주어진 모집단으로부터 한 번 추출하여 관측하는 값은 확률변수이다. 추출할 때마다 값이 달라지기 때문

•  모집단과 확률변수에 대해 어떤 사건이 일어날 확률 : 모집단으로부터 한 값을 임의로 추출해 해당 사건이 일어나는지 확인하는 행위를 독립적으로 무한반복 실행할 때, 전체 시행 횟수 중 해당 사건이 일어날 궁극적인 비율 = 사건의 확률 

 

 

◯  분포

 

•  집합 A에 속하는 사건이 발생할 확률과 같이, X와 관련된 모든 사건에 대해 확률을 구하면 X의 확률분포 또는 분포라고 한다. 

 

 

◯  모수 

 

•  모집단의 분포를 특징적으로 나타내는 수 = 모수, 파타미터 

•  모수는 모집단의 속성이므로 표본추출 반복시행 시 변하지 않는다. 

 

 

◯  통계량 

 

•  statistics 는 확률변수다. 

 

 

계량경제학의 근본적인 문제는 모집단에 관심이 있지만, 그 일부인 표본밖에 사용하지 못한다는 것이다. 관심있는 모수가 있을 때 이를 추정하기 위하여 어떤 통계량을 사용할지 아는 것이 계량경제학의 핵심 중 하나이다. 

 

 

 

 

④ 계산과 생각 

 

•  생각 → 계산 → 생각 

•  모형 설정 → 추정 → 추론 : 모집단에 대한 생각 

 

 

 

 

2. 단순 선형회귀 모형과 그 해석 


 

①  선형모형 

 

•  계량경제학의 주된 관심사는 다른 조건이 동일할 때 하나의 변수 값에 차이가 있으면 핵심 변수가 어떻게 영향을 받는지에 대한 인과관계 문제이다. 

 

•   임금 = a + bx학력 + 여타 요소들의 영향  ⇨ 선형모형 

 

 

 

②  회귀

 

•  어떤 변수들이 다른 변수에 영향을 미치는 것을 나타내는 방정식 : 회귀식 

•  임금 = a + bx학력 + u 

   ↪ 학력 : 영향을 미치는 변수 

   ↪ 임금 : 영향을 받는 변수 

   ↪ u : 임금에 영향을 미치는 모든 여타 요소들의 총효과 

   ↪ u 가 고정될 때, 학력의 1 단위 변화는 임금을 b만큼 증가시킨다. 

 

 

 

③  단순 선형 회귀 모형 

 

•  Y = a + bX + u  : 단순선형회귀모형 

   ↪ 우변 마지막 항인 u 는 Y에 영향을 미치는 요소들 중 X를 제외한 나머지 모든 요소들의 총영향을 의미한다. X가 Y 에 미치는 인과적 영향을 파악하고자 할 때, 우리가 고정시키고자 하는 요소들의 총 영향이다. 

   ↪ (X,Y) 관측값들은 우리가 볼 수 있는 값이지만, u 는 관측하지 못한다. 

 

•  Y : 결과, X에 의해 설명되는 변수 

•  X : 원인, Y를 설명하는 변수 

•  u : X와 Y의 관계를 교란하는 항 (교란항, 오차항) 

 

 

•  Y = β0 + β1•X + u 

   ↪ β1 : X 가 Y에 미치는 인과적 영향을 나타내는 모수 

   ↪ u 로 인해 X와 Y간에 정확한 관계가 성립되지 않는다. 

 

•  인과관계를 알기 위해, 다른 요소들을 고정시킬 때, "다른 요소" 들의 범위가 불분명할 수 있다. u 를 통제할 여타요소들이라고 하는 것은 직관적이고 이해에 도움이 된다. 그러나 계량경제학은 결국 E(Y|X) = β0 + β1•X 와 같은 조건부 평균 함수를 추정하는 것이다. 

 

 

 

④ 인과적 영향 대 평균의 차이 

 

•  β1 : 여타 모든 요소들의 영향 (u) 이 고정될 때, X의 한 단위 증가가 Y에 미치는 영향 (인과적 영향) 

•  X와 Y의 결합확률분포를 알면 E(Y|X) 를 알 수 있다. 

   ↪ 각 X값에 해당하는 구획에 대해 Y의 평균을 구한다. 이 구획별 평균을 '조건부 평균', E(Y|X) 라고 한다. 

 

•  E(Y|X) = α0 + α1•X

•  Y = β0 + β1•X +

   ↪ α1 = β1 이 될 때 : E(u|X) = 0 일때 

   ↪ u 는 관측불가능하다는 사실을 기억 

   ↪ E(u|X) 는 0이 아니어도 된다. X에 의존하지만 않는 다면 어떤 상수값을 가져도 괜찮다. 

 

•  X값에 따라 모집단을 구획할 때 모든 구획에서 u의 평균이 동일하면, E(u|X) 가 상수이면 평균상의 차이와 인과적 영향은 동일하다. 

 

 

 

 

 

 

 

728x90

댓글