์ฐธ๊ณ ์์ : Bootcamp 4-3. ํ๊ท ๋ถ์ฐ์
1. RD
โฏ Regression Discontinuity
• Discontinuous ๊ฐ ๋ฐ์ํ๋ฉด ๊ทธ๊ฒ์ ๊ธฐ์ ์ผ๋ก ์ธ๊ณผ์ถ๋ก ์ ์งํํ๋ ๋ฐฉ๋ฒ
• Running variable = assignment variable = Forcing variable : Discontinuity ๊ฐ ๋ฐ์ํ๋ ๋ณ์
• RD ์์์ counterfactual : running variable ์ด ์์์ ๋๋ฅผ ๊ฐ์ ํ ์ถ์ด (์ ์ )
• counterfactual (์ ์ )๊ณผ treatment ๋ฅผ ๋ฐ์์ ๋์จ (์ค์ ) ์ฐจ์ด๊ฐ causal effect ์ด๋ค.
โฏ Example of discontinuity
• ์์ฃผ์ ๊ฑด๊ฐ/์ฌ๋ง ์ฌ์ด์ ์ธ๊ณผํจ๊ณผ
• ๋ฏธ๊ตญ์์๋ ๋ฒ์ ์ผ๋ก 21์ธ๋ฅผ ๊ธฐ์ค์ผ๋ก ์์ฃผ๋ฅผ ํ์ฉํ๋ค. 21์ธ ์ง์ ์ ์ฌ๋๋ค, 21์ธ ์งํ์ ์ฌ๋๋ค์ ํน์ฑ์ ๋น์ทํ ๊ฒ์ด๋ค. ๊ทธ๋ฌ๋ 21์ธ๋ฅผ ๊ธฐ์ ์ผ๋ก ์ด์ ์ฌ๊ณ ์ฌ๋ง๋ฅ ์ด jump ๋ฅผ ๋ณด์ด๊ณ ์๋ค. ๋ฐ๋ผ์ ์์ฃผ๊ฐ ์ด์ ์ฌ๊ณ ์ ์ฌ๋ง๋ฅ ์ ์ธ๊ณผ์ ์ธ ํจ๊ณผ๊ฐ ์๋ค๊ณ ๋ณผ ์ ์์ ๊ฒ์ด๋ค.
โฏ RD Estimation strategies
• Discontinuity ๊ฐ ์์ ๋์ running variable ์์์ ์ถ์ธ๋ฅผ ๊ฐ์ง๊ณ , discontinuity ๊ฐ ์์ ๋๋ก extrapolate ๋ฅผ ํด์ counterfactual ์ ๊ตฌํ๋ค. ๊ตฌํ๋ ๋ฐฉ๋ฒ์ ์ฌ๋ฌ๊ฐ์ง์ด๋ค.
• Bandwidth : Discontinuity ์ฃผ๋ณ์ผ๋ก ์ด๋ ๋ฒ์๊น์ง ๊ณ ๋ คํ๋๋
โช ์ ์ฒด ๊ตฌ๊ฐ(global) ์ ๋ชจ๋ ํ์ฉํ ์๋ ์๊ณ , ํน์ ๊ตฌ๊ฐ (local) ๋ง์ ๋ณผ ์๋ ์๋ค. ์ด์ ์ ์์ฃผ ๊ด๋ จ ์ธ๊ณผ์ถ๋ก ์์ ๊ทธ๋ํ์ ๊ฒฝ์ฐ์๋ 19์ธ๋ถํฐ 23์ธ๊น์ง์ ํน์ ๊ตฌ๊ฐ๋ง์ ๊ณ ๋ คํ๊ณ ์๋ค.
• Modeling of running variable: running variable ์ ์ด๋ป๊ฒ ๋ชจ๋ธ๋ง ํ ๊ฒ์ธ๊ฐ
โช Parametric : functional form ์ ๊ฐ์ (regression ์ ํตํ ๋ชจ๋ธ๋ง)
โช Non-parametric : ๊ฐ๋ น ๊ธฐ์ค treatment ์ด์ ๊ณผ ์ดํ์ ํ๊ท ๊ฐ์ ํตํด ์ธ๊ณผ์ถ๋ก ์ ํ๋ ๊ฒฝ์ฐ
• bandwidth โจ cut-off ์ฃผ๋ณ์ ๋ฒ์๋ฅผ ์ค์ฌ์ ๋ถ์ํ๋ฉด ์ ๋ฆฌํ ๊ฒ์ด๋ค. discontinuity ๋ฅผ ๊ธฐ์ค์ผ๋ก treatment ์ control ์ด ๋๋๋๋ฐ, ๋ฒ์๋ฅผ ์ค์ผ์๋ก discontinuity cut off ๋ฅผ ์ค์ฌ์ผ๋ก ํน์ฑ์ด ๋น์ทํด์ง ๊ฒ์ด๋ค. ๋ฒ์๋ฅผ ๋๋ฆด์๋ก ํน์ฑ์ด ๋น์ทํด์ง์ง ์์ ์ ์๋ค. ๊ฐ๋ น ์ด์ ์ ์์ฃผ ๊ด๋ จ ์ธ๊ณผ์ถ๋ก ์์ ๊ทธ๋ํ์์ ๊ณ ์กธ~๋ํ์ ์ฌ์ด (ex. MZ ์ธ๋) ์ ์ฌ๋๋ค์ ํน์ฑ์ ๋น์ทํ๋ค. ๊ทธ๋ฌ๋ bandwidth ๋ฅผ ์ค์ด๋ ๊ฒ์ ๋ฌธ์ ๋, sample size ๊ฐ ๋๋ฌด ์์์ง๋ค๋ ๊ฒ์ด๋ค.
• selection bias ๊ฐ ์๋ค๋ ๊ฒ์ ์ธ์ ํ๊ณ , running variable ์ ๋ฐ๋ผ ์ด๋์ ๋ ๋ณํ ์ง ์ถฉ๋ถํ ์์ธก ๊ฐ๋ฅํ๋ค๋ฉด parametric (linear, 2์ฐจ์..) ๋ถ์์ ์งํํ๋ค. Global ํ๊ฒ ๋ถ์ํ๋ค๊ณ ํ๋ฉด ๊ฑฐ์ parametric ๋ฐฉ๋ฒ์ ์ฌ์ฉํด์ผ ํ๋ค. Global experiment (๊ฐ๋ น ์์ฃผ ์์์์ 0์ธ~100์ธ ๋ฅผ ๋ฒ์๋ก ํ๋ค๊ณ ํ๋ฉด, 21์ธ ์ด์ ์ ํ๊ท ์ฌ๊ณ ํ์์ 21์ธ ์ดํ ์ฌ๋๋ค์ ํ๊ท ์ฌ๊ณ ํ์๋ฅผ ๋น๊ตํ๋ ๊ฒ์ make sense ํ์ง ์๋ค)
• selection bias ์ sample size ๊ฐ์ trade-off ๊ฐ ์กด์ฌํ๊ธฐ ๋๋ฌธ์ ์ด๋ฅผ ๊ณ ๋ คํด ์ ์ ํ ๋ฐฉ๋ฒ์ ์ ํํด์ผ ํ๋ค.
โช ์์์ local nonparametric (๋นจ๊ฐ ์ง์ ๋ฒ์) ๋ก ๋ณธ๋ค๋ฉด, discontinuity ๊ฐ ์๋ค๊ณ ๊ฐ์ ํ์ ๋ ์ง์ ์ด ๊ณ์ ์ผ์ ํ ์์๊ฐ์ ๊ฐ์ง ์ ์์ ๊ฒ์ด๋ผ ์์ธกํ ์ ์์ผ๋ฏ๋ก ๊ฒ์ ์ ๊ตต์ ์ง์ ๋ค ๊ฐ์ ์ฐจ์ด๊ฐ causal effect ๊ฐ ๋ ์ ์๊ณ , Global nonparamtric (๋ฒ์ ์ ์ฒด) ๋ก ๋ณธ๋ค๋ฉด, ์ญ์ discontinuity ๊ฐ ์๋ค๊ณ ๊ฐ์ ํ์ ๋ ์ง์ ์ด ๊ณ์ ์ผ์ ํ ์์๊ฐ์ ๊ฐ์ง ์ ์์ ๊ฒ์ด๋ผ ์์ธกํ ์ ์์ผ๋ฏ๋ก ๊ฒ์ ์ ์ค์ ๋ค ๊ฐ์ ์ฐจ์ด๊ฐ causal effect ๊ฐ ๋๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ๊ฒฝ์ฐ์๋ ์ฐจ์ด๊ฐ ์ปค์ง๊ธฐ ๋๋ฌธ์ sensitive ํ ์ ์๋ค.
โช selection bias ๋ฅผ ์ด๋ ํ function ์ผ๋ก ๋ณด์ ํด์ฃผ๋ parametric ํ ๋ฐฉ๋ฒ์ผ๋ก, ์์ ์์์ฒ๋ผ local ํ ๊ตฌ๊ฐ์์ linear function ์ผ๋ก ๋ชจ๋ธ๋ง ํ๋ฉด, ๋ง์ฝ discontinuity ๊ฐ ์์์ ๋์ cutoff ๋ฅผ ๊ธฐ์ค์ผ๋ก ์ผ์ชฝ ์ค์ ์ด ๊ณ์ ์ง์ ์ผ๋ก ์ด์ด์ง ์ ์๊ณ , ์ด๋ฅผ discontinuity ๊ฐ ์์์ ๋์์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ ๊ฒ์ด causal effect ๊ฐ ๋ ์ ์๋ค. Global parametric ๋ ๋ง์ฐฌ๊ฐ์ง!
โจ Local/Global, Prametric/Non-parametric ๋ฐฉ๋ฒ์ ๋ฐ๋ผ regression discontinuity ๊ฒฐ๊ณผ๋ ๋ง์ด ๋ฌ๋ผ์ง ์ ์๋ค.
[์ฐธ๊ณ ]
โฏ RD ์ DID
• Discontinuity ๊ฐ ์๋ค๊ณ ํด์ ๋ฌด์กฐ๊ฑด regression discontinuity ๋ก ๋ถ์ํด์ผ ํ๋ ๊ฒ์ ์๋๋ค.
• Discontinuity ๊ฐ ์ ์ฉ๋ ํน์ treatment shock ์ด ์์ด์, treament ๊ฐ ํน์ ์์ ์ ์์ด์ treament ์ ํ์ ๋ฐ์ดํฐ๊ฐ ๊ด์ฐฐ ๊ฐ๋ฅํ๋ค๋ฉด DID ๋ฅผ ์ ์ฉํ๋ ๊ฒ์ด ๋ ์ ์ ํ๋ค.
• ์ฐ๋ฆฌ๋๋ผ ๊ฒ์ ์ ง๋ค์ด์ ์ ์ฉ (16์ธ ๋ฏธ๋ง) : 16์ธ๋ฅผ ๊ธฐ์ค์ผ๋ก 3๋ ์ฉ ์ดํด๋ด์ 13์ธ~15์ธ๋ฅผ ๊ฒ์ ์ ง๋ค์ด์ ์ ์ํฅ์ ๋ฐ๋ treatment group, ๊ทธ ์ดํ 16์ธ~19์ธ๋ฅผ control group ์ผ๋ก ๋๋ ๋ณผ ์ ์๋ค.
• RD sample ์ ๊ตฌ์ฑํ๊ณ DID ๋ก ๋ถ์
• ๋ง์ฝ RD ์ DID ๋ฅผ ๋ชจ๋ ์ฌ์ฉ ๊ฐ๋ฅํ ์กฐ๊ฑด์ด๋ผ๋ฉด, ์ด๋ ํ ๋ฐฉ๋ฒ๋ก ์ด ๊ฐ์ ์ ์ ์ฆํ๊ธฐ ๋ ์ฌ์ด์ง๋ฅผ ํ๋จํด์ ๊ณ ๋ฅด๋ฉด ๋๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ์ธก๋ฉด์์ DID ๊ฐ ๋ ์ข๋ค. DID ์ parallel assumption ์ด causal experiment ์ค์ ๊ฐ์ฅ ์ ์ฆํ๊ธฐ ์ฌ์ด ๊ฒ์ ์ด๊ธฐ ๋๋ฌธ์ด๋ค. ์๊ฐํ ํน์ ํต๊ณ์ ๊ธฐ๋ฒ (relative time model ๋ฑ) ์ผ๋ก ๊ฒ์ฆ๊ฐ๋ฅํ๋ค.
2. Identification assumption for RD
โฏ ๊ฐ์
• discontinuity ์ ํ๋ก ํน์ฑ์ด ๋น์ทํด์ผ extrapolate ํ ์ ์๋ค.
• Non-parametric ์์์ ๊ฐ์ : cutoff ๋ฅผ ์ ํ๋ก treatment group ๊ณผ control group ์ด ์ผ๋ง๋ treatment ๋ฅผ ์ ์ธํ๊ณ ๋น๊ต ๊ฐ๋ฅํ์ง (Ceteris paribus) ๋ฐ์ ธ๋ณด๊ธฐ. ์ด๋ฌํ ๊ฐ์ ์ ๋ง์กฑ์ํค๊ธฐ ์ํด bandwidth ๋ฅผ ์ค์ด๊ธฐ๋ ํ๋ค.
• Parametric ์์์ ๊ฐ์ : Ceteris paribus ๋ฅผ ์ถฉ์กฑ์ํค๋ ๊ฒ์ ๋ฐ๋ผ๋ ๊ฑด ์๋๋ค. ์ฐจ์ด๊ฐ ์์ ์ ์๋ค๋ ๊ฒ์ ์ธ์ ํ๋ค. ๊ทธ๋ฌ๋ discontinuity ์ ํ์ ์ฐจ์ด๊ฐ running variable ์ ๋ํ function ์ผ๋ก ์ ๋ถ๋ค ์ค๋ช ํ ์ ์์ด์ผ ํ๋ค. function ์ ์ด๋ค๊ฑธ ์ ํํ๋๋์ ๋ฐ๋ผ casual effect ํฌ๊ธฐ๊ฐ ๋ฌ๋ผ์ง ์ ์๊ธฐ ๋๋ฌธ์ sensitive ํ๋ค. ๋ํ ์ด๋ค ๊ฒ์ด true model ์ธ์ง ์๊ธฐ๋ ์ฝ์ง ์๋ค. ๋ฐ๋ผ์ ์ฌ๋งํ๋ฉด RD์ DID ๋๋ค ์ ์ฉ ๊ฐ๋ฅํ ์ํฉ์ด๋ผ๋ฉด DID ๋ฅผ ์ ์ฉํ๋๊ฒ ์ข๋ค.
โฏ Parametric assumption ์์ true functional model ์ ์ฐพ๋ ๋ฐฉ๋ฒ : sensitivity test
• ๊ฐ๋ฅํ ๋๋ถ๋ถ์ functional form ์ ๋ํด test ๋ฅผ ํด์, ๊ฐ์ฅ robust ํ ๊ฒฐ๊ณผ๋ฅผ ์ ํ
• r_i : running variable, Y_i : outcome
• ๋์ผํ ๋ฐ์ดํฐ์ ๋ฐ๋ผ์ r,y ๋ฅผ ์ด๋ป๊ฒ ๋ชจ๋ธ๋ง์ ํ๋์ ๋ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ ๋ฌ๋ผ์ง๋ค. bandwidth ๋ฅผ ์ด๋ป๊ฒ ์ฐ๋๋๋ ์ํฅ์ ๋ฏธ์น๋ค. ๋๋ฌด ์ค๋ฒํผํ ๋๊ฒ ๊ณ ์ฐจ์์ ๋ชจ๋ธ์ ๋ํด์ test ๋ฅผ ํ์ง ์๋๋ค.
3. Example of regression discontinuity
โฏ ๋ ธ๋์กฐํฉ์ด ์ ํ ํ์์จ์ ๋ฏธ์น๋ ์ธ๊ณผ์ ์ธ ํจ๊ณผ
โ strategy 1 : Global/Local parametric, Binary
• ๋ ธ๋์กฐํฉ ๊ฒฐ์ฑ์ ๋ํ ํฌํ ๊ฒฐ๊ณผ์ ์ํ ๋ ธ๋ ์กฐํฉ์ ๊ธฐ์ ์ฐธ์ฌ์จ์ธ (0~100%) UnionWin_i,t ๋ฅผ running variable ๋ก ํ์ฉํ๊ณ ์๋ค. 50% ๋ฅผ ๊ธฐ์ค์ผ๋ก discontinuity ๊ฐ ๋ฐ์ํ๋ค.
• Industry dummy, year dummy ์ ๊ฐ์ control variable ์ ์ํด Parametric ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ค.
• ๋ชจ๋ ๊ฒฝ์ฐ๋ฅผ (0~100%) ๋ค ๋ถ์ํ๋ ๊ฒ์ด Global ์ด๊ณ , ๋ฐ๋ฉด (42.5%, 57.5%) ์ ๊ฐ์ด bandwidth ๋ฅผ ์ขํ์ ๋ถ์ํ๋ ๊ฒ์ด Local ์ด๋ค. ์ด๋ค bandwidth ๊ฐ ๊ฐ์ฅ ์ ์ ํ์ง ์ฌ๋ฌ ๊ตฌ๊ฐ์ ๊ฐ์ง๊ณ ๋ชจ๋ธ๋ง์ ํด๋ณด๋ ๊ฒ์ด ์ผ๋ฐ์ ์ด๋ค.
• Imbens and Kalyanaraman ๋ ผ๋ฌธ → optimal ํ bandwidth ๋ฅผ ์ฐพ์ ์ ์๋ ๋ฐฉ๋ฒ์ ์ ์
โก strategy 2 : Global parametric, Linear & Quadratic
• ๋จ์ํ binary ๋ก discontinuity ๋ฅผ ๋๋๊ธฐ์๋ ํน์ฑ์ด ๋ค๋ฅผ ์ ์๋ค. ๋ ธ๋ ์กฐํฉ ๊ฒฐ์ฑ์ ํฌํํ๋๋ฐ 10% ๋ง ์ฐฌ์ฑํ ๊ธฐ์ ๊ณผ 90%๋ง ์ฐฌ์ฑํ ๊ธฐ์ ์ ํน์ฑ์ด ๋ค๋ฅผ ์ ์๋ค. ๋จ์ํ binary ๋ก ํ๊ท ์ ๋น๊ตํ๋ ๊ฒ์ด ์๋๊ณ , functional form ์ผ๋ก modeling ์ ํ๊ณ ์๋ค.
• P(pv, c) : running variable ๊ณผ outcome ๊ฐ์ ๊ด๊ณ๋ฅผ polynomial ๋ก ๋ชจ๋ธ๋ง ํ ๊ฒฐ๊ณผ
โช Linear fit example (์ผ์ชฝ) : γโPโV
โช Quadratic fit example (์ค๋ฅธ์ชฝ) : γ1โPโV + γ1โPโV^2
4. Imperfect compliance : Fuzzy RD
โฏ Fuzzy RD
• ํฌํ์จ์ด 50% ๊ฐ ๋์ผ๋ฉด ๋ฌด์กฐ๊ฑด ๋ ธ๋์กฐํฉ์ด ๊ฒฐ์ฑ๋๋ค. binary = 1 โจ sharp RD
• ๊ทธ๋ฌ๋ ํ์ค์์๋ ์์ ์์์ฒ๋ผ ๊น๋ํ๊ฒ ๋๋์ด์ง๋ RD ๊ฐ ๊ฑฐ์ ์๋ค.
• Fuzzy RD : discontinuity ์ ์ํด treatment ์ control ์ด ๋ฑ ๋๋ ์ง๋ ๊ฒ์ด ์๋๊ณ , treatment ๊ฐ ๋ ํ๋ฅ ์ด ๋ณํ๋ ๊ฒฝ์ฐ๋ฅผ ๋งํ๋ค. ํ์ค์์๋ Fuzzy RD ์ธ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. (ex. ๊ฒ์ ์ ง๋ค์ด์ ๊ฐ 16์ธ ๋ฏธ๋ง์ ์์ด๋ค์๊ฒ ์ ์ฉ๋๋ ๊ฑด ์ฌ์ค์ด์ง๋ง ์ด treatment ๊ฐ ๋ชจ๋ ์์ด๋ค์๊ฒ ๋์ผํ ๊ฐ์ค์น๋ก ์ ์ฉ๋๋ ๊ฒ์ ์๋ ์ ์๋ค. ์ด๋ค ์์ด๋ค์ ์๋ฒฝ๊น์ง ๊ฒ์์ ์ํ๋ ์์ด๋ค์ด ์์ ์ ์๊ณ , ์ด๋ค ์์ด๋ค์ ํธ๋ฒ์ ์จ์ ๊ฒ์์ ํ๋ ์์ด๋ค์ด ์์ ์ ์๋ค)
โฏ Fuzzy RD ๋ LATE ๋ถ์์ด๋ค.
โ EX.1
• running variable ์์์ cutoff ๋ฅผ ๋๊ตฌ๋ณ์๋ก ๋ณด๊ณ LATE ๋ฅผ ์ํํ๋ ๊ฒ์ด๋ค.
• First stage : discontinuity ๋ฅผ ํ์ฉํด์ treatment ๋ฅผ ๋ฐ์ ํ๋ฅ ์ ์์ธก
• Second stage : ์์ธก๊ฐ์ ํ์ฉํด์ second stage ์์๋ global/local , parametric/non-parametric ๋ถ์์ ์งํํ๋ ๊ฒ์ด๋ค.
• ๊ฐ๋ น ๊ฒ์ ์ ง๋ค์ด์ ์์์ฒ๋ผ, 16์ธ ์ดํ์ ๋ชจ๋ ์ฌ๋๋ค์ ๋ํด ์ ์ฉ๋๋ ๊ฒ์ ๋ถ์ํ๊ณ ์ ํ๋ ๊ฒ์ด ์๋๋ผ, LATE ๋ถ์์ด๊ธฐ ๋๋ฌธ์, ์ฆ compliers ์ ๋ํ ๋ถ์์ด๊ธฐ ๋๋ฌธ์ ๊ฒ์์ ง๋ค์ด์ ๊ฐ ์คํ๋์ด์ ๊ฒ์์ ๋ ํ๊ฒ ๋๋ ๊ฒฝ์ฐ์ ๋ํ ์ธ๊ณผ์ถ๋ก ์ ํด์ํด๋ณผ ์ ์๋ค.
• Sharp RD ๋ 100% compliers ์ ๋ํ ๋ถ์์ด๋ค.
โก EX2.
โข EX3.
๐ RD ๋ ๋๊ตฌ๋ณ์ ๋ถ์๊ณผ ํจ๊ป ๊ฐ๋ค.
'1๏ธโฃ AIโขDS > ๐ฅ Casual inference' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ์ธ๊ณผ๊ทธ๋ํ (0) | 2023.04.28 |
---|---|
์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ํต์ ํจ์์ ์ ํ๋ชจํ (0) | 2023.04.26 |
์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ์ธ๊ณผ์ถ๋ก ๊ด์ ์์์ ๋๊ตฌ๋ณ์ (1) | 2023.04.25 |
์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๋๊ตฌ๋ณ์ (0) | 2023.04.25 |
์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๊ฐ์์ ํต์ ์ง๋จ (0) | 2023.04.25 |
๋๊ธ