본문 바로가기
1️⃣ AI•DS/⚾ 계량경제•통계

Difference-in-Difference (DiD)

by isdawell 2023. 4. 3.
728x90

 

👀 계량경제학 개인 공부용 포스트 글 입니다. 

 

 

 

① 이중차분 등장배경 


 

https://danbi-ncsoft.github.io/study/2019/08/13/causality-part4-DID.html

 

 

 

•  두 개의 프로모션의 성과 (매출액) 가 있을 때, 프로모션 A에 대해 평가를 진행해보고자 한다. 이때 2가지 접근이 가능할 것이다. 

 

1. 2019년 7월의 시점에서 프로모션 B와 비교해볼 때, A가 10억이 많다. B에 비해 A의 성과가 높았다고 말할 수 있다. 

2. 2018년 7월과 2019년 7월을 비교했을 때, A의 효과가 40억 떨어졌다. A의 효과가 작년보다 좋지 않았다고 보고할 수 있다. 

 

 

 

💡  정보가 2개의 차원으로 주어졌을 때, 어떻게 해석해야 좋을까 ⇨  이중차분법 ! 

 

 

 

 

 

 

 

 

 

 

 

 

 

② 이중차분 개념


 

•  DID 는 특정 사건 전후로 treatment group 과 control group 의 차이를 비교 (시간의 흐름에 따른 변화량을 비교) 하기 위해 주로 사용된다.   

•  treatment group 과 동질적인 control group 을 설정해 전후관계를 비교하여, 시간에 따라 변하는 관측 불가능한 요인이 제거되어 인과효과 추정값을 식별할 수 있다. 

•  이중차분 추정량으로 인과효과를 분석하려면 treatment group 의 사건 시행 이후와 이전, control group 의 사건 시행 이후와 이전 자료 총 4개의 집단에 대한 자료를 활용해야 한다. 

 

 

 

 

•  횡단면 차분 (그룹 자체의 시간에 따른 변화) 

    ↪ Ta - Tb : treatment 그룹의 시간에 따른 변화 

    ↪ Ca - Cb : control 그룹의 시간에 따른 변화 

 

•  종단면 차분 (그룹 간의 차이) 

    ↪ Ta - Ca : treatment 이후 (after) 에 두 그룹의 차이 

    ↪ Tb - Cb : treatment 이전 (before) 에 그룹의 차이 

 

•  DiD 는 횡단면 차분 값에서 종단면 차분 값을 빼는 두 번의 차분을 구하는 방식이다.

•  DID estimator = (Ta - Tb) - (Ca - Cb)  = (Ta - Ca) - (Tb - Cb) ⇨ Treatment group 이 가지는 순수한 효과를 살펴볼 수 있다. 이중으로 차분하면 두 집단 간의 차이 (종단면) 을 제거하고 시점에 따른 결과 변수의 변화 (횡단면) 이 얼마나 다르게 일어나는지 확인 가능 

 

 

•  DiD 의 주요 가정 : Parallel Trend Assumption 

    ↪ Treatment/intervention 이 없다면 각 그룹간 시간에 따른 변화량 차이가 일정해야 한다는 가정 

    ↪ 처치를 받은 그룹이 만약 처치를 받지 않았다면 나타났을 결과 변수의 트렌드 변화는, 통제 그룹의 결과 변수의 트렌드 변화와 같다는 가정

    ↪ 즉, 두 비교 그룹 간 결과 변수 크기의 차이는 존재하나 시간에 따른 변화는 동일할 것이라는 것 

 

 

 

 

 

 

 

 

⇨ 인과 효과를 추론하기 위해, 처지 시점 전/후로 처치를 받은 그룹과 통제 그룹의 트렌드 변화가 얼마나 다르게 나타나는지를 측정한다. 

 

 

 

 

 

 

 

 

③ 이중차분 측정방법 - 회귀분석 


 

•  데이터 요구사항

↪  1. 처치 여부에 따른 두 그룹을 구분할 더미변수 

↪  2. 처치 전/후를 구분할 더미변수 

 

 

 

 

•  회귀모형을 이용한 측정 

 

↪  회귀분석을 통해 이중차분 값과 그 유의성을 측정해볼 수 있다. 

↪  Td : 처치여부 (1 : treatment, 0 : control) 

↪  Pt : 시간에 따른 변화 (1 : 처치 이후, 0 처치 이전) 

↪  TdPt : 교차항

     ⇨ 0 : control 그룹의 처치 전/후, treatment 그룹의 처치  전

     ⇨ 1 : treatment 그룹의 처치 이후 

 

 

 ⇨  β : 그룹 간 차이 

 ⇨  γ : 시간에 따른 결과 변수의 변화 

 ⇨  δrDD : 이중차분 값 (처치에 대한 인과효과) 

 

 

 

 

 

 

 

④ 이중차분 데이터 분석 예시 


 

•  근로장려세제(EITC) 예제 

    ↪  EITC : 소득 기준으로 특정 계층 이하에 대해, 일을 했을 경우 소득에 부과되는 세금을 돌려주는 제도 

    ↪  EITC 의 자격조건 중 자녀 유무가 존재하는 경우가 많다. 

    ↪  Research Question : 기혼 여성 노동자의 경우 EITC 가 노동 공급을 늘릴까? 

 

 

•  Experiment design 

    ↪  Treatment group : 자녀가 있는 집단 (1)

    ↪  Control group : 자녀가 없는 집단 (0) 

    ↪  Treatment : ETIC 가 94년도 실행됬으므로, 93년 이후와 이전 시점 

 

 

⇨ work : 취업여부 (1 : 취업함, 0 : 취업못함) 

⇨ children : 자녀의 수 → 자녀의 유무에만 관심이 있으므로 더미변수로 처리 

 

 

추정할 회귀식

 

 

  δ : DID 추정치 : 자녀가 있고 (1) , 94년부터 ETIC 의 대상이 되는 집단 (1) 

  β1 : EITC 가 시작되기 전후의 차이를 나타냄 (시간에 따른 결과 변수의 변화)

  β2 : 자녀 유무의 차이 (그룹 간 차이) 

 

 

회귀분석 결과

 

 

  마지막 계수가 통계적으로 유의하다. 계수의 크기는 0.0469 으로, 즉 EITC 로 인한 기혼 여성의 고용이 증가한 효과는 약 4.7% 라 볼 수 있다. 

 

 

 

 

 

 

 

※ 예제 참고


 

실험없이 이벤트 효과를 추정할 수 있을까? - Difference in Differences

 

EITC 의 고용증가 효과

 

이중차분법 예제

 

 

 

 

 

728x90

댓글