μΈκ³ΌμΆλ‘ μ λ°μ΄ν° κ³Όν - μ€μ€ν λΆμ λ°©λ²λ‘
μ°Έκ³ μμ : Bootcamp 3-2. μ€μ€ν λΆμ λ°©λ²λ‘
1. Counterfactual and methods
β― Counterfactual revisited
• μ°λ¦¬μκ² νμν건, treatment group μμ treat λ₯Ό λ°μ§ μμλλΌλ©΄ μ΄λ€ κ²°κ³Όλ₯Ό 보μλμ§μ λν counterfactual β¨ νμ€μμ κ΄μ°° λΆκ°λ₯νκΈ° λλ¬Έμ κ°μ₯ λΉμ·ν control group μ μ°Ύλ κ²μ΄ κ΄κ±΄μ΄λ€.
• Causal experiment method: control group μ νμ©ν΄ μ΄λ»κ² counterfactual μ μ μΆν μ μμμ§μ λν λ°©λ² β¨ Research design and apply method
• μ°λ¦¬κ° μ€μ λ°μ΄ν°λ₯Ό ν΅ν΄ μΆμ νλ κ²μ, treatment group μ λν ATE μΈ ATET μ΄λ€. μλ°ν λ§νλ©΄, control group μμ λ§μ½ treatment κ° μμμΌλ©΄ μ΄λ νμμ§ λνλ΄λ ATEU λ λ°μ΄ν°λ₯Ό ν΅ν΄ μΆμ νκ³ μ νλ λμμ μλκ³ , μκ΄κ³κ° μ±λ¦½νκΈ° μν΄ treatment group μ control group μ΄ κ΅μ₯ν λΉμ·ν΄μ, μλ‘ μν μ λ°κΏλ κ²°κ³Όκ° λμΌν κ²μ΄λΌλ κ°μ νμμ ATEU κΉμ§λ μΆμ νλ κ²μ΄λ€. μ΄λ₯Ό μ’ ν©ν΄ μ 체 μνμμ ATE λ₯Ό ꡬνλ€.
• [μ 리] Causal inference method λ λΉκ΅ κ°λ₯ν control group μ νμ©ν΄ counterfactual μ approximation νκ² λ€λ μ κ·Όμ΄κ³ , μ°λ¦¬κ° μ€μ λ‘ κ·Έλ¬ν method λ₯Ό ν΅ν΄μ μΆμ ν μ μλ κ²μ ATET μ΄λ€. ATE λ₯Ό ꡬνκ³ μ νλ€λ©΄, μκ΄κ³ μ±λ¦½μ΄λΌλ κ°μ μ΄ μΆκ°λμ΄μΌ νλ€.
2. Data structure from the perspective of Counterfactual
β― Data structure
• λΉκ΅ κ°λ₯ν λμμ ν΅ν΄ counterfactual μ approximate
• counterfactual μ time-invariant outcome κ³Ό time-varying outcome μΌλ‘ λΆλ₯λ μ μλ€.
• μκ°μ λ°λΌ λ³νμ§ μλ counterfactual μ treatment κ° μ€μ λ‘ μμμ λ μμλ κ³Όκ±°μ κ°μ κ±°μ λμΌν κ²μ΄λ€. μκ°μ λ°λΌ λ³νμ§ μλ μμΈμ, κ³Όκ±° λ°μ΄ν°λ‘ μ½κ² μ μΆν μ μλ€.
• treatment μ νμ λ°μ΄ν°λ₯Ό κ΄μ°°ν μ μλ longitudinal data κ°, treatment λ₯Ό λ°μ μ΄νμ νΉμ μμ μ λ°μ΄ν°λ§ μλ cross-sectional data λ³΄λ€ μΈκ³ΌμΆλ‘ κ΄μ μμλ ν¨μ¬ λ μ 리νλ€.
• μκ°μ λ°λΌ λ³νλ counterfactual λ§ μκ°ν΄λ³΄λ©΄ λλ€.
• counterfactual μ approximation νλ€λ μΈ‘λ©΄μμ treatment μ νμ λ°μ΄ν°κ° λͺ¨λ μμΌλ©΄ ν¨μ¬ λ μ 리ν μΈ‘λ©΄μ΄ μλ€.
• treatment group μμλ§ μ ν λ°μ΄ν°κ° μλ κ²½μ°κ° μκ³ (time-series data) , control group μ μ ν λ°μ΄ν°κΉμ§ μλ κ²½μ° (panel data) κ° μλ€. Panel data ννκ° time-series λ³΄λ€ ν¨μ¬ μ 리νλ€κ³ λ³Ό μ μλ€.
• [μμ]
βͺ ν μΈμΏ ν°μ΄ μ§κΈλμκ³ , λ΄κ° μ΄λ²μ£Όμ μ°μ°μ ꡬ맀νλ€. μ΄λ, μΏ ν° μ§κΈμ΄ μ ν κ΅¬λ§€λ‘ μ΄μ΄μ‘λμ§μ λν΄ μΈκ³ΌμΆλ‘ μ μ§νν΄λ³΄κ³ μ νλ€. μ§λμ£Όμλ λ μ¨κ° νμ°½νλ€κ³ κ°μ ν΄λ³Έλ€λ©΄, μ§λμ£Όμλ μ°μ°μ ꡬ맀νμ§ μμμ΄λ λμκΈ° λλ¬Έμ, μ§λμ£Όμ νλλ§ κ°μ§κ³ μ΄λ²μ£Όμ νλμ μμΈ‘νλ€λ©΄ counterfactual λ‘ "μΏ ν°μ΄ μμλ€λ©΄ μ΄λ²μ£Όμ μ°μ°μ ꡬ맀νμ§ μμμ κ²μ΄λ€" λΌκ³ μμΈ‘ν κ°λ₯μ±μ΄ λλ€. κ·Έλ¬λ, μ€μ λ‘λ μ°μ°μ ꡬ맀νκΈ° λλ¬Έμ μ΄λ° κ²½μ°μλ μΏ ν°μ μΈκ³Όμ μΈ ν¨κ³Όκ° ν¬κ² λνλ¬μ κ²μ΄λ€.
βͺ λ°λ©΄, μ΄λ²μ£Όμ λΉκ° μ€κΈ° λλ¬Έμ μΏ ν°μ λ°μ§ μμμ§λ§ μ°μ°μ ꡬ맀ν λ€λ₯Έ μΉκ΅¬λ€ control group μ κ³ λ €ν΄μ counterfactual μ μμν΄λ³Έλ€λ©΄, μΏ ν°μ΄ μμλλΌλ μ°μ°μ ꡬ맀νμ κ°λ₯μ±μ΄ ν¬λκΉ, μΏ ν°μ ν¨κ³ΌλΌκ³ λ³Ό μ μμ κ²μ΄λ€.
• [μ 리]
1. treatment μ νλ‘ λ°μ΄ν°κ° λͺ¨λ μλ κ²μ΄ μ’λ€.
2. control group μμλ μ ν λ°μ΄ν°κ° λͺ¨λ μλ κ²μ΄ μΈκ³ΌμΆλ‘ κ΄μ μμ λ§€μ° μ 리νλ€.
3. What's your research design and data structure
1. λ΄κ° κ°μ§κ³ μλ λ°μ΄ν°μ νΉμ±μ΄ 무μμΈμ§
2. λ°μ΄ν°λ₯Ό κ°μ§κ³ μ΄λ»κ² λΆμν μ§
β― Research Design μ ν λ¨κ³
[λ¨κ³ μ€λͺ ]
• β . μΈκ³ΌμΆλ‘ μ λͺ©μ μΌλ‘ νλκ² λ§λμ§, 무μμ λ°°μ μ΄ κ°λ₯νμ§ μ²΄ν¬
• β‘.
(a) β λ²μ΄ λ§μ‘±λλ€λ©΄ RCT κ° κ°λ₯νλ€λ©΄, RCT λ₯Ό νμ©
(b) RCT κ° λΆκ°λ₯νλ©΄ treatment group μ control group μ΄ μ΄λ»κ² μ νλλμ§μ λν λ©μ»€λμ¦ μκ°νκΈ° : Quasi-experiment design κ³Ό κ°μ research design κ³ λ €νκΈ°
• β’.
(a) research design μ μ°Ύμ μ μλ€κ³ νλ€λ©΄ treatment group μ control group μ μ°ΎκΈ°
β¨ a-1. controlμ κ΄μ°° λΆκ°λ₯ : longitudinal data (treatment μ νλ‘ κ΄μΈ‘ κ°λ₯νμ§ λ³΄κΈ°) : interrupted time series analysis
β¨ a-2. controlμ κ΄μ°° κ°λ₯ : treatment μ control μμ μκ°μ λ°λ₯Έ λ³νκ° μΌλ§λ λΉκ΅ κ°λ₯νμ§μ λν κ°μ (parallel trend assumption) μ΄ λ§μ‘±νλμ§ λ°μ Έλ³΄κΈ° → λ§μ‘±νλ€λ©΄ DID , λ§μ‘±νμ§ μλλ€λ©΄ Matching μμ νμ DID λ₯Ό μ μ©νκ±°λ, Synthetic control μ΄λΌλ λ°©λ²μ νμ©ν΄λ³Ό μ μλ€.
(b) control μ κ΄μ°° κ°λ₯νλ°, treatment μ νμ λ°μ΄ν°κ° μλ κ²½μ° : treatment κ° μμμ threshold μ μν΄ λλ κ²μΈμ§ λ°λ €λ³΄κ³ , λ§μ½ κ·Έλ λ€λ©΄ regression discontinuity λΌλ λ°©λ²μ νμ©ν μ μκ³ , κ·Έκ²μ΄ μλλΌλ©΄, treatment λ₯Ό λ°μ μ μλ μΈλΆ μμΈμ΄ μλμ§ μ°Ύμ보μμΌ νλ€ (β£).
• β£. λꡬλ³μ
(a) λꡬλ³μκ° μλ€λ©΄ : local average treatment effect λΆμμ ν μ μκ³ , control function μ΄λ selection model μ νμ©ν΄λ³Ό μ μλ€.
(b) λꡬλ³μλ κ³ λ €ν΄λ³Ό μ μλ€λ©΄ : Matching/weighting μ΄λ regression μ λ΅μ κ³ λ €ν΄λ³Ό μ μλ€.
4. Overview of methods
• λͺ©μ : control group μ νμ©ν΄μ treatment group μμμ counterfactual ꡬνκΈ°
β― DID
• 쑰건 : treatment μ control group μ΄ μ΄λ»κ² λλλμ§ μμμΌ νκ³ , treatment group κ³Ό control group λͺ¨λ treatment μ νμ λ°μ΄ν°κ° μ‘΄μ¬ν΄μΌ νκ³ , treatment κ° μλ μν©μμ treatment group μμμ μκ°μ λ°λ₯Έ λ³νμ control group μμ μκ°μ λ°λ₯Έ λ³νκ° νννλ parallel trend assumption μ΄ μ±λ¦½ν΄μΌ νλ€.
• μκ°μ λ°λΌ λ³νμ§ μλ λ³μ, μ±λ³, μ§μ, μ·¨ν₯ λ±μ μμΈλ§ κ³ λ €ν μ μμ΄λ μλΉν λ§μ λΆλΆμ 컀λ²ν μ μλ€. λ°λΌμ κ³Όκ±° λ°μ΄ν°κ° μ€μνλ€.
• treatment κ° μλ μν©μμ μκ°μ λ°λΌ λ³νμ counterfactual λ§ λ¨μ → control group μμμ μκ°μ λ°λΌ λ³νλ μ λλ₯Ό κ°μ§κ³ μΆμ νλ€. κ°λ Ή μμ μμμ²λΌ, control group μμ potential outcome μ΄ "νκ· "μ μΌλ‘ 0.5 μ¦κ°νκΈ° λλ¬Έμ counterfactual μ μΆμ ν λμλ 0.5μ© μ¦κ°μν¨λ€.
• DID λ₯Ό μ μ©νλλ° μμ΄μ parallel trend assumption μμ treatment group κ³Ό control group μ΄ λ€ λΉμ·ν νμλ μκ³ , μκ°μ λ°λΌ λ³νλ μ λλ§ λΉκ΅ κ°λ₯νλ©΄ λκΈ° λλ¬Έμ κΈ°μ‘΄ λΆμλ³΄λ€ λ€μ λμ¨ν κ°μ μ ν΄λΉνλ€. λ§μ½ μ΄λ¬ν κ°μ μ΄ μμ λ§μ‘±λμ§ μλλ€λ©΄ matching λ±μ λ°©λ²μ μ¬μ©νλ©΄ λλ€.
• DID λ₯Ό ν΅ν΄ ꡬν μ μλ κ²μ ATET μ΄λ€. ATET λ₯Ό ꡬνκΈ° μν΄μλ μκ°μ λ°λΌ λ³νλ μΆμΈλ§ λΉμ·νλ©΄ λλ€. κ·Έλ¬λ μ΄λ₯Ό ATE λ‘ νμ₯μν€λ €λ©΄ μ’ λ κ°ν κ°μ μ΄ νμνλ€. ATE λ‘ νμ₯νλ €λ©΄ treatment μ control μ΄ λͺ¨λ λ©΄μμ λΉμ·ν΄μ μμΌλ‘ λμμ λ°κΏλ (control μμ treat λ₯Ό λ°μλ€κ³ νμλ) μ±λ¦½νλ μν©μ΄ μ±λ¦½λμ΄μΌ νλ€. ATETμ ATE λ₯Ό ꡬλΆνλ κ²λ μ€μνλ€. μ°κ΅¬ λͺ©μ μ λ°λΌ ATET λ§ λ΄λ μΆ©λΆν μ μλ€.
β― Synthetic control
• κΈ°λ³Έ μμ΄λμ΄ : control group μ combination μ ν΅ν΄ treatment group μ counterfactual μ μμνκΈ°
• DID μ λͺ©μ μ λμΌνλ€.
• parallel trend κ°μ μ΄ λ§μ‘±λμ§ μμλ, control unit μ μ μ‘°ν©ν΄μ treatment unit μ μ μμΈ‘ν΄λΌ μ μλ€.
β― Synthetic control vs DID
• κ°κ°μ Firm 2~5 λ treatment μ λΉκ΅ κ°λ₯ν κ²μ΄ νλλ μλ€. (DID λ§μ‘±X)
• λ°λ©΄, Firm 2μ Firm3 λ₯Ό μ μ ν μ‘°ν©νλ©΄, λΉκ΅ κ°λ₯ν κ°μμ ν΅μ μ§λ¨μ λ§λ€ μ μλ€.
β― Interrupted Time series analysis
• 쑰건 : control group λ°μ΄ν°κ° μκ³ , treatment group μ μ ν λ°μ΄ν°λ§ μλ κ²½μ°
• treatment group μμμ κ³Όκ±° λ°μ΄ν°λ§μ κ°μ§κ³ λ―Έλλ₯Ό μμΈ‘ : time-series forecasting
• ex. μκ°μ νλ¦μ λ°λΌ 1μ© μ¦κ°νλ κ²½ν₯μ 보μ΄λ―λ‘, λ€μ outcome λ +1μ κ²°κ³Όλ₯Ό κ°μ§ κ²μ΄λ€.