본문 바로가기
1️⃣ AI•DS/⚾ 계량경제•통계

계량경제학 강의_한치록_단순회귀 2.5~2.7장

by isdawell 2023. 5. 10.
728x90

 

👀 계량경제학 개인 공부용 포스트 글입니다. 

 

 

 

2. 단순 선형회귀 모형과 그 해석 


 

⑤  기울기에 대한 자세한 설명 

 

 Y = β0 + β1•X + u  

•  E(u|X) = 0 이면 β1 은 X가 1 단위 높을 때 Y가 평균 얼마만큼 높은지 나타낸다. 

•  가령 X가 교육연수, Y가 임금 (만원단위) 라고 했을 때, 교육연수가 1년 차이나는 두 집단 간에는 평균 β1 만원 만큼의 임금차이가 있다고 해석해볼 수 있다. 만일 β1=0 이라면 교육연수는 임금에 평균적으로 어떤 영향도 미치지 않는다. 

 

•  반면 X가 이진변수일 때, 에를들어 자가용 이용여부 (1:자가용 이용, 0: 대중교통이용) 이고 Y가 출근에 걸린 시간 (단위 1시간) 이라고 한다면, X가 0에서 1로 증가할 때 (대중교통으로 출근하다 자가용으로 출근하면), 이 사람의 출근시간은 평균잡아 β1 만큼 증가한다. β1 이 양수면 자가용을 이용할 때 평균적으로 출근시간이 더 많이 걸리고 음수라면 평균적으로 더 짧은 시간이 걸리는 것이다. β1 = 0 이라면 자가용을 이용하나 대중교통을 이용하나 평균 출근시간은 동일하다 해석할 수 있다. 

 

•  모든 X에 대해 E(u|X) = 0 이라면 평균에 미치는 효과는 인과적 영향동일하다. 

 

 

 

 

⑥  로그와 증가율 

 

 

로그 증가율 

 

•   log(x) 가 0.01 만큼 증가했다x가 1% 증가했다. 

 

•   log(x) 의 변화분이 0.01 이나 0.05 처럼 아주 작으면 log(x) 가 d만큼 증가한다는 것은 x의 증가율이 d라는 것, 즉 x가 100d%만큼 증가한다는 것과 비슷하다. 

•   log(x) 가 크게 증가하면 로그함수의 모양이 직선에서 많이 벗어나기 때문에 근사적인 표현이 틀리게 되어 정확한 계산이 필요하다. 정확한 증가율은 100x(e^d - 1)% 로 계산해야 하고, 이때 d는 log(x) 가 a에서 a+d 로 d만큼 증가했을 때 x의 증가율을 의미한다. 

 

•   정리하자면, log(x) 의 변화폭이 작을 때, log(x) 가 d만큼 증가한 것은 x가 100d% 만큼 증가한 것과 비슷하다. 

•   로그값이 약간 증가하면 비율 증가는 로그값 증가와 유사하지만, 실제 비율 증가는 로그값 증가분보다 항상 더 크다. 이는 로그함수의 기울기가 점점 작아지기 때문이다. 

 

•   로그값이 증가하면 실제 증가율은 로그 증가분보다 더 크고 로그값이 감소하면 실제 변화율 절댓값은 로그 변화분의 크기보다 더 작다. 

 

•   log(임금) = β0 + β1•학력 + u 라는 모형이 있다면, 여타 요소들이 동일할 때 학력이 1단위 높을 때 log(임금) 은 β1 만큼 높으므로 임금이 약 100β1 % 높다는 결과를 얻는다. (단, β1 의 크기가 작을 때) 

 

 

 

◯  4가지 모형 

 

1. (수준-수준) 모형 
↪  Y = β0 + β1•X + u 
↪  다른 요인이 고정되었을 때, X의 한 단위 증가는 Y의 β1 증가를 가져온다. 

2. (수준-로그) 모형 
↪  Y = β0 +  β1•log(X) + u 
↪  다른요인이 고정되었을 때, X의 10% 증가는 Y의 약 0.1*β1 단위 증가를 가져온다. 

3. (로그-수준) 모형 
↪  log(Y) = β0 +  β1•X + u 
↪  X의 1 단위 증가는 Y 가 약 100β1% 증가하도록 한다. 그러나 이러한 해석이 가능하려면 β1 의 값이 작아 β1X의 변화 정도가 작아야 한다. 

4. (로그-로그) 모형 
↪  log(Y) = β0 +  β1•log(X) + u 
↪  log(X) 가 0.01 만큼 증가하면 log(Y) 가 0.01*β1 단위만큼 증가한다. 
↪  X의 1% 증가는 Y의 약 β1 % 증가를 가져온다. 다만 여기서도 0.01*β1 크기가 작아야만 이러한 근사적 해석이 타당하다. 

 

•   X변수가 1% 증가할 때 y변수가 a% 증가하면, a를 X에 대한 Y의 탄력성이라고 한다. 

 

 

◯  로그와 측정단위 

 

•   로그는 측정단위의 변화를 무력화시킨다. 곱의 로그가 로그의 합으로 표현되어 측정단위의 변화가 (즉, scaling 이) 모형의 절편만 변화시키기 때문이다. 

 

 

◯  로그 변환을 적용할 변수를 선택하는 방법 

 

•   0이나 음의 값을 가질 수 있으면 로그를 취할 수 없다. 가령 물가상승률, 경제성장률. 

•   한 단위 변화의 크기가 기저값 수준과 무관하게 비슷하게 보이면 로그를 취하지 않는다. 가령 '나이' 변수는 20세에서 21세로 한 살 증가하는 것과 30세에서 31세로 한 살 증가하는 것은 비슷한 정도이다. 

•   가격, 금액, 수량처럼 동일한 백분율 변화가 동일한 변화로 느껴지는 변수는 로그변환을 한다. 가령 100원에서 10원 상승한 것과 10,000 원에서 10원 상승한 것은 동일한 상승으로 느껴지지 않는다. 100원에서 10% 상승하여 110원이 된 것과 10,000원에서 10% 상승하여 11,000원이 된 것이 서로 비슷한 증가 변화라 볼 수 있다. 

•   비율변수의 경우에는 때에 따라 로그변환의 효과가 다르므로 모두 분석해보고 결과가 견고한지 살펴본다.  

 

 

 

⑦  백분율의 변화와 변화율 

 

•  변수의 측정단위가 비율이나 백분율이면 해석이 까다로울 수 있다. 

•  단위가 비율인 경우 "포인트" 라는 말을 적절히 사용하면 된다. 비율로 측정한 변수가 a단위만큼 높은 경우, 해당 비율이 'a포인트' 만큼 더 높다고 표현한다. 

 

•  100을 곱하지 않은 비율의 0.01 포인트 차이는 "1 퍼센트 포인트" 차이에 해당한다.

↪ 가령 100을 곱하지 않은 비율을 의미하는 무역개방도 (GDP 대비 교역량 비율) 에서 값이 0.2 차이가 있으면, "무역 개방도에 0.2 포인트 차이가 있다" 고 하거나 "무역 개방도에 20 퍼센트 포인트 차이가 있다" 고 한다. 

 

•  변수에 로그를 취하면, 해당 변수에 대한 해석은 증가율에 관한 것으로 바뀐다. 로그를 취하지 않은 변수는 포인트, 로그를 취한 변수는 퍼센트로 말하면 된다. 

 

 

 

퍼센트 포인트 

 

EX. 점유율이 30% 에서 15%로 감소하였다면, 

 

•  잘못된 표현 : 점유율이 15% 감소하였다 →  X : 만약 점유율이 15% 줄어들었다면, 기존 점유율의 85% 가 되었다는 뜻으로 점유율은 30x(1-0.15) = 25.5% 로 바뀌었다는 뜻이다. 

•  올바른 표기 : 50% 감소하였다. 혹은 15%P 감소하였다. 

 

 

 

728x90

댓글