👀 계량경제학 개인 공부용 포스트 글입니다.
2. 단순 선형회귀 모형과 그 해석
⑤ 기울기에 대한 자세한 설명
• Y = β0 + β1•X + u
• E(u|X) = 0 이면 β1 은 X가 1 단위 높을 때 Y가 평균 얼마만큼 높은지 나타낸다.
• 가령 X가 교육연수, Y가 임금 (만원단위) 라고 했을 때, 교육연수가 1년 차이나는 두 집단 간에는 평균 β1 만원 만큼의 임금차이가 있다고 해석해볼 수 있다. 만일 β1=0 이라면 교육연수는 임금에 평균적으로 어떤 영향도 미치지 않는다.
• 반면 X가 이진변수일 때, 에를들어 자가용 이용여부 (1:자가용 이용, 0: 대중교통이용) 이고 Y가 출근에 걸린 시간 (단위 1시간) 이라고 한다면, X가 0에서 1로 증가할 때 (대중교통으로 출근하다 자가용으로 출근하면), 이 사람의 출근시간은 평균잡아 β1 만큼 증가한다. β1 이 양수면 자가용을 이용할 때 평균적으로 출근시간이 더 많이 걸리고 음수라면 평균적으로 더 짧은 시간이 걸리는 것이다. β1 = 0 이라면 자가용을 이용하나 대중교통을 이용하나 평균 출근시간은 동일하다 해석할 수 있다.
• 모든 X에 대해 E(u|X) = 0 이라면 평균에 미치는 효과는 인과적 영향과 동일하다.
⑥ 로그와 증가율
◯ 로그 증가율
• log(x) 가 0.01 만큼 증가했다 ≈ x가 1% 증가했다.
• log(x) 의 변화분이 0.01 이나 0.05 처럼 아주 작으면 log(x) 가 d만큼 증가한다는 것은 x의 증가율이 d라는 것, 즉 x가 100d%만큼 증가한다는 것과 비슷하다.
• log(x) 가 크게 증가하면 로그함수의 모양이 직선에서 많이 벗어나기 때문에 근사적인 표현이 틀리게 되어 정확한 계산이 필요하다. 정확한 증가율은 100x(e^d - 1)% 로 계산해야 하고, 이때 d는 log(x) 가 a에서 a+d 로 d만큼 증가했을 때 x의 증가율을 의미한다.
• 정리하자면, log(x) 의 변화폭이 작을 때, log(x) 가 d만큼 증가한 것은 x가 100d% 만큼 증가한 것과 비슷하다.
• 로그값이 약간 증가하면 비율 증가는 로그값 증가와 유사하지만, 실제 비율 증가는 로그값 증가분보다 항상 더 크다. 이는 로그함수의 기울기가 점점 작아지기 때문이다.
• 로그값이 증가하면 실제 증가율은 로그 증가분보다 더 크고 로그값이 감소하면 실제 변화율 절댓값은 로그 변화분의 크기보다 더 작다.
• log(임금) = β0 + β1•학력 + u 라는 모형이 있다면, 여타 요소들이 동일할 때 학력이 1단위 높을 때 log(임금) 은 β1 만큼 높으므로 임금이 약 100β1 % 높다는 결과를 얻는다. (단, β1 의 크기가 작을 때)
◯ 4가지 모형
1. (수준-수준) 모형
↪ Y = β0 + β1•X + u
↪ 다른 요인이 고정되었을 때, X의 한 단위 증가는 Y의 β1 증가를 가져온다.
2. (수준-로그) 모형
↪ Y = β0 + β1•log(X) + u
↪ 다른요인이 고정되었을 때, X의 10% 증가는 Y의 약 0.1*β1 단위 증가를 가져온다.
3. (로그-수준) 모형
↪ log(Y) = β0 + β1•X + u
↪ X의 1 단위 증가는 Y 가 약 100β1% 증가하도록 한다. 그러나 이러한 해석이 가능하려면 β1 의 값이 작아 β1X의 변화 정도가 작아야 한다.
4. (로그-로그) 모형
↪ log(Y) = β0 + β1•log(X) + u
↪ log(X) 가 0.01 만큼 증가하면 log(Y) 가 0.01*β1 단위만큼 증가한다.
↪ X의 1% 증가는 Y의 약 β1 % 증가를 가져온다. 다만 여기서도 0.01*β1 크기가 작아야만 이러한 근사적 해석이 타당하다.
• X변수가 1% 증가할 때 y변수가 a% 증가하면, a를 X에 대한 Y의 탄력성이라고 한다.
◯ 로그와 측정단위
• 로그는 측정단위의 변화를 무력화시킨다. 곱의 로그가 로그의 합으로 표현되어 측정단위의 변화가 (즉, scaling 이) 모형의 절편만 변화시키기 때문이다.
◯ 로그 변환을 적용할 변수를 선택하는 방법
• 0이나 음의 값을 가질 수 있으면 로그를 취할 수 없다. 가령 물가상승률, 경제성장률.
• 한 단위 변화의 크기가 기저값 수준과 무관하게 비슷하게 보이면 로그를 취하지 않는다. 가령 '나이' 변수는 20세에서 21세로 한 살 증가하는 것과 30세에서 31세로 한 살 증가하는 것은 비슷한 정도이다.
• 가격, 금액, 수량처럼 동일한 백분율 변화가 동일한 변화로 느껴지는 변수는 로그변환을 한다. 가령 100원에서 10원 상승한 것과 10,000 원에서 10원 상승한 것은 동일한 상승으로 느껴지지 않는다. 100원에서 10% 상승하여 110원이 된 것과 10,000원에서 10% 상승하여 11,000원이 된 것이 서로 비슷한 증가 변화라 볼 수 있다.
• 비율변수의 경우에는 때에 따라 로그변환의 효과가 다르므로 모두 분석해보고 결과가 견고한지 살펴본다.
⑦ 백분율의 변화와 변화율
• 변수의 측정단위가 비율이나 백분율이면 해석이 까다로울 수 있다.
• 단위가 비율인 경우 "포인트" 라는 말을 적절히 사용하면 된다. 비율로 측정한 변수가 a단위만큼 높은 경우, 해당 비율이 'a포인트' 만큼 더 높다고 표현한다.
• 100을 곱하지 않은 비율의 0.01 포인트 차이는 "1 퍼센트 포인트" 차이에 해당한다.
↪ 가령 100을 곱하지 않은 비율을 의미하는 무역개방도 (GDP 대비 교역량 비율) 에서 값이 0.2 차이가 있으면, "무역 개방도에 0.2 포인트 차이가 있다" 고 하거나 "무역 개방도에 20 퍼센트 포인트 차이가 있다" 고 한다.
• 변수에 로그를 취하면, 해당 변수에 대한 해석은 증가율에 관한 것으로 바뀐다. 로그를 취하지 않은 변수는 포인트, 로그를 취한 변수는 퍼센트로 말하면 된다.
※ 퍼센트 포인트
EX. 점유율이 30% 에서 15%로 감소하였다면,
• 잘못된 표현 : 점유율이 15% 감소하였다 → X : 만약 점유율이 15% 줄어들었다면, 기존 점유율의 85% 가 되었다는 뜻으로 점유율은 30x(1-0.15) = 25.5% 로 바뀌었다는 뜻이다.
• 올바른 표기 : 50% 감소하였다. 혹은 15%P 감소하였다.
'1️⃣ AI•DS > ⚾ 계량경제•통계' 카테고리의 다른 글
계량경제학 스터디 Lecture 3. Matching (0) | 2023.05.12 |
---|---|
계량경제학 강의_한치록_단순회귀 3장 (0) | 2023.05.11 |
계량경제학 스터디 Lecture 2. Regression (1) | 2023.05.10 |
R 강좌 : 정책효과 분석 : 이중차분법 DiD, 삼중차분법 DDD (0) | 2023.05.09 |
계량경제학 강의_한치록_단순회귀 1장~2.4장 (0) | 2023.05.09 |
댓글