👀 계량경제학 개인 공부용 포스트 글 입니다.
① 이중차분 등장배경
• 두 개의 프로모션의 성과 (매출액) 가 있을 때, 프로모션 A에 대해 평가를 진행해보고자 한다. 이때 2가지 접근이 가능할 것이다.
1. 2019년 7월의 시점에서 프로모션 B와 비교해볼 때, A가 10억이 많다. B에 비해 A의 성과가 높았다고 말할 수 있다.
2. 2018년 7월과 2019년 7월을 비교했을 때, A의 효과가 40억 떨어졌다. A의 효과가 작년보다 좋지 않았다고 보고할 수 있다.
💡 정보가 2개의 차원으로 주어졌을 때, 어떻게 해석해야 좋을까 ⇨ 이중차분법 !
② 이중차분 개념
• DID 는 특정 사건 전후로 treatment group 과 control group 의 차이를 비교 (시간의 흐름에 따른 변화량을 비교) 하기 위해 주로 사용된다.
• treatment group 과 동질적인 control group 을 설정해 전후관계를 비교하여, 시간에 따라 변하는 관측 불가능한 요인이 제거되어 인과효과 추정값을 식별할 수 있다.
• 이중차분 추정량으로 인과효과를 분석하려면 treatment group 의 사건 시행 이후와 이전, control group 의 사건 시행 이후와 이전 자료 총 4개의 집단에 대한 자료를 활용해야 한다.
• 횡단면 차분 (그룹 자체의 시간에 따른 변화)
↪ Ta - Tb : treatment 그룹의 시간에 따른 변화
↪ Ca - Cb : control 그룹의 시간에 따른 변화
• 종단면 차분 (그룹 간의 차이)
↪ Ta - Ca : treatment 이후 (after) 에 두 그룹의 차이
↪ Tb - Cb : treatment 이전 (before) 에 그룹의 차이
• DiD 는 횡단면 차분 값에서 종단면 차분 값을 빼는 두 번의 차분을 구하는 방식이다.
• DID estimator = (Ta - Tb) - (Ca - Cb) = (Ta - Ca) - (Tb - Cb) ⇨ Treatment group 이 가지는 순수한 효과를 살펴볼 수 있다. 이중으로 차분하면 두 집단 간의 차이 (종단면) 을 제거하고 시점에 따른 결과 변수의 변화 (횡단면) 이 얼마나 다르게 일어나는지 확인 가능
• DiD 의 주요 가정 : Parallel Trend Assumption
↪ Treatment/intervention 이 없다면 각 그룹간 시간에 따른 변화량 차이가 일정해야 한다는 가정
↪ 처치를 받은 그룹이 만약 처치를 받지 않았다면 나타났을 결과 변수의 트렌드 변화는, 통제 그룹의 결과 변수의 트렌드 변화와 같다는 가정
↪ 즉, 두 비교 그룹 간 결과 변수 크기의 차이는 존재하나 시간에 따른 변화는 동일할 것이라는 것
⇨ 인과 효과를 추론하기 위해, 처지 시점 전/후로 처치를 받은 그룹과 통제 그룹의 트렌드 변화가 얼마나 다르게 나타나는지를 측정한다.
③ 이중차분 측정방법 - 회귀분석
• 데이터 요구사항
↪ 1. 처치 여부에 따른 두 그룹을 구분할 더미변수
↪ 2. 처치 전/후를 구분할 더미변수
• 회귀모형을 이용한 측정
↪ 회귀분석을 통해 이중차분 값과 그 유의성을 측정해볼 수 있다.
↪ Td : 처치여부 (1 : treatment, 0 : control)
↪ Pt : 시간에 따른 변화 (1 : 처치 이후, 0 처치 이전)
↪ TdPt : 교차항
⇨ 0 : control 그룹의 처치 전/후, treatment 그룹의 처치 전
⇨ 1 : treatment 그룹의 처치 이후
⇨ β : 그룹 간 차이
⇨ γ : 시간에 따른 결과 변수의 변화
⇨ δrDD : 이중차분 값 (처치에 대한 인과효과)
④ 이중차분 데이터 분석 예시
• 근로장려세제(EITC) 예제
↪ EITC : 소득 기준으로 특정 계층 이하에 대해, 일을 했을 경우 소득에 부과되는 세금을 돌려주는 제도
↪ EITC 의 자격조건 중 자녀 유무가 존재하는 경우가 많다.
↪ Research Question : 기혼 여성 노동자의 경우 EITC 가 노동 공급을 늘릴까?
• Experiment design
↪ Treatment group : 자녀가 있는 집단 (1)
↪ Control group : 자녀가 없는 집단 (0)
↪ Treatment : ETIC 가 94년도 실행됬으므로, 93년 이후와 이전 시점
⇨ work : 취업여부 (1 : 취업함, 0 : 취업못함)
⇨ children : 자녀의 수 → 자녀의 유무에만 관심이 있으므로 더미변수로 처리
⇨ δ : DID 추정치 : 자녀가 있고 (1) , 94년부터 ETIC 의 대상이 되는 집단 (1)
⇨ β1 : EITC 가 시작되기 전후의 차이를 나타냄 (시간에 따른 결과 변수의 변화)
⇨ β2 : 자녀 유무의 차이 (그룹 간 차이)
⇨ 마지막 계수가 통계적으로 유의하다. 계수의 크기는 0.0469 으로, 즉 EITC 로 인한 기혼 여성의 고용이 증가한 효과는 약 4.7% 라 볼 수 있다.
※ 예제 참고
실험없이 이벤트 효과를 추정할 수 있을까? - Difference in Differences
'1️⃣ AI•DS > ⚾ 계량경제•통계' 카테고리의 다른 글
계량경제학 스터디 Lecture 1. Introduction (0) | 2023.05.08 |
---|---|
계량경제학 스터디 CH11,12,13,14,15정리 (0) | 2023.04.09 |
계량경제학 스터디 CH7,8,9,10정리 (0) | 2023.03.31 |
계량경제학 스터디 CH3,4,5,6 정리 (0) | 2023.03.19 |
계량경제학 스터디 CH1,2 정리 (1) | 2023.03.13 |
댓글