์ฐธ๊ณ ์์ : Bootcamp 2-4. ๋งค์นญ๊ณผ ์ญํ๋ฅ ๊ฐ์ค์น
1. Matching
• Regression ์ control variable๊ณผ selection bias์ ๋ํด linear form์ผ๋ก ๊ฐ์ ํ๊ณ , control variable์ conditioning ํจ์ผ๋ก์จ ํน์ฑ์ ์ ์ฌํ๊ฒ ๋ง๋ค์๋ค๋ฉด matching ์ functional form ์์ด ๋จ์ํ control variable์์ ํน์ฑ์ด ์ ์ฌํ ๊ฒ๋ค์ ์ง์ ์ ์ผ๋ก ๋งค์นญํ๋ ๋ฐฉ๋ฒ์ด๋ค. ํจ์ฌ ๋ ์ง๊ด์ ์ธ ๋ฐฉ๋ฒ์ด๋ผ ๋ณผ ์ ์๋ค. Flexible ํ ํํ์ด๋ค.
• ์ฆ, ํ๊ท๋ถ์๊ณผ Matching ์ functional form ์ ๊ฐ์ ํ๋๋ ์ ํ๋๋์ ์ฐจ์ด๋ง ์กด์ฌํ๋ค.
• Matching ์ ํ๋ ๋ฐฉ๋ฒ์ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์๋๋ฐ, ๊ฐ์์์๋ 2๊ฐ์ง๋ง ์๊ฐํ๊ฒ ๋ค!
2. Matching Method : PSM
โฏ Propensity score matching
• Propensity score matching ์ฑํฅ๋ ์ ์ ๋งค์นญ
• control variable ์ด ์ฃผ์ด์ง ์ํ์์ treatment๋ฅผ ๋ฐ์ ํ๋ฅ
• Propensity score ๋ฅผ ๊ธฐ์ค์ผ๋ก treatment์์์ score์ control์์์ score ๊ฐ ๋น์ทํ ๋ฐ์ดํฐ๋ค๋ผ๋ฆฌ ์๋ก ๋งค์นญํ๋ค.
• logit ์ด๋ probit regression์ ํ์ฉํด์, treatment๋ฅผ ๋ฐ์ ๊ฑด์ง ์ฌ๋ถ๊ฐ y ๊ฐ ๋๊ณ , control variable์ x๋ก ๋์ด์ 0~1 ์ฌ์ด์ ๊ฐ์ ๊ฐ๋ ๊ฒฝํฅ์ ์๋ฅผ ์ป์ ์ ์๋ค.
• selection on observable ์ ๋ต์ ๊ฐ์ ํ๋ ๋ฐฉ๋ฒ๋ก : propensity score ๋ฅผ ๊ณ์ฐํ๊ธฐ ์ํ ๋ณ์๋ค์ ๋ชจ๋ ์๊ณ ์์ด์ผ ํ๋ ๊ฒ์ด ์ ์ โจ ๊ต์ฅํ ๊ฐํ ๊ฐ์
• propensity score ๊ฐ ์ ์ฌํ ๋ฐ์ดํฐ๋ง ๋จ๋๋ค. ์ด๋ค์ ํตํด ์ธ๊ณผ์ถ๋ก ์ ์งํํด ๋ณผ ์ ์๋ค.
• ๋งค์นญ๋ control group ๊ณผ treatment group์ ํ๊ท ์ ๋จ์ ๋น๊ตํด๋ ๋๋ค.
โฏ Matching Method : Propensity score stratification
• ์์ ๋ง์ฐฌ๊ฐ์ง๋ก propensity score ๋ฅผscore๋ฅผ ๊ตฌํ ๋ค์์, ์ด score๋ฅผ ์ผ์ ๊ตฌ๊ฐ์ผ๋ก ๋๋์ด์, ๊ฐ ๊ตฌ์ญ ๋ด์์ control group๊ณผ treatment group์ ๋น๊ตํ๋ค. ๋ชจ๋ ๊ตฌ๊ฐ์ ๋ํด ํ๊ท ์ ๋ด๋ ๋ฐฉ์์ผ๋ก ์ต์ข ๊ฒฐ๊ณผ๋ฅผ ์ป๋๋ค.
• ๊ทธ๋ฌ๋ ์ฑํฅ์ ์๋งค์นญ์์ ์ฑํฅ์ ์๊ฐ ์ ํํ๊ฒ ๊ตฌํด์ง๋์ง ์์ฒด์ ๋ํด ๋ถํ์ค์ฑ (logit , probit ์ ๋์ ํด์ ๊ตฌํ๋ ๊ฒ์ด ๊ณผ์ฐ ์ณ์๊ฐ) ์ด ๋ง๋ค. ์ต๊ทผ์๋ ๋์์ผ๋ก CEM ์ด ๋ง์ด ์ฌ์ฉ๋๋ค.
3. CEM
• Coarsened Exact Matching : ์ด๋ ํ ํจ์๋ ๊ฐ์ ํ์ง ์๊ณ ์ง๊ด์ ์ธ ๋ฐฉ๋ฒ์ด๋ค. ์ฑํฅ์ ์๋ฅผ ๊ตฌํ๋ ๊ฒ๋ ์๋๊ณ , probit ๊ฐ์ ๋ชจ๋ธ์ ๊ฐ์ ํ๋ ๊ฒ๋ ์๋๋ค. ๋จ์ํ control variable ์ด ๋น์ทํ ๊ฒ๋ผ๋ฆฌ ๋งค์นญ์ํค๋ ๊ฒ์ด๋ค. (A : ๋จ์, 175cm) - (B : ๋จ์, 175cm) ๋งค์นญ์ฒ๋ผ control variable ์ด ์ง์ ์ ์ผ๋ก ๊ฐ์ ์ฌ๋๋ค๋ผ๋ฆฌ ๋งค์นญํ๋ ๊ฒ์ด๋ค.
• ๋ณ์๊ฐ ์ฌ๋ฌ ๊ฐ๋ฉด ๋ชจ๋ ๋ณ์๊ฐ ์ ํํ๊ฒ ๊ฐ์ ๊ฒฝ์ฐ๋ ๊ฑฐ์ ์์ ๊ฒ์ด๋ค. Control variable ์ ๋ช ๊ฐ์ bin์ผ๋ก ๋์จํ๊ฒ ๋๋์ด, ๊ทธ ๊ตฌ๊ฐ ๋ด์์ ์๋ก ๋งค์นญ์ ํ๋ค. ๊ฐ์ ๊ตฌ๊ฐ ๋ด์ ์๋ ๊ฐ๋ค์ ๋งค์นญํจ์ผ๋ก์จ Exact matching ์ด๊ธด ํ์ง๋ง ์กฐ๊ธ ๋์จํ๊ฒ ๋งค์นญํ์ฌ ์ฌ๋ฌ ๊ฐ์ ๋งค์นญ ๋ฐ์ดํฐ๋ฅผ ์ป๋๋ค.
• ์ด๋ ํ ๊ฐ์ ์ ์์กดํ์ง ์๊ธฐ ๋๋ฌธ์, ์ง์ ์ ์ผ๋ก ์ ์ฌํ๊ฒ ๋ง๋ค ์ ์๋ค. ๊ทธ๋ฌ๋ ๊ตฌ๊ฐ์ ๋ํ ๋งค์นญ์ ํ๋๋ผ๋, ๋ชจ๋ ๋ณ์๋ค์ ๋ํด ๊ฐ ๋ณ์ ๋ณ๋ก ๊ตฌ๊ฐ์ด ๊ฐ์์ผ ํ๋๊น ๋งค์นญ๋๋ ๋ฐ์ดํฐ์ ๊ฐ์๋ ์ฌ์ ํ ์ ๋ค. ๊ทธ๋์ ์์ง๊น์ง๋ PSM, CEM ์ค์ ๋ฌด์์ด ๋ ์ฐ์ํ๋ค๊ณ ๊ฒฐ๋ก ๋ด๋ฆฌ๊ธฐ๋ ์ด๋ ต๋ค. ํ์ฌ ์ฐ๊ตฌ์์๋ ์ด 2๊ฐ์ง๋ฅผ ๋ชจ๋ ํ์ฉํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
4. Weighting
โฏ Weighting
• Matching ์ด ์ฌ์ฉ๋์ง ๋ชปํ๋ ๊ฒฝ์ฐ์๋, Weighting ์ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค.
• Weighting ์ propensity score ์ ์ญ์๋งํผ์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค. treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ด ์์ ๊ทธ๋ฃน์๋ ๋ ๋ง์ weight์ ์ฃผ์ด์ ํ๋ฅ ์ ๋ ํค์ฐ๊ณ , treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ด ํฐ ๊ทธ๋ฃน์๋ weight๋ฅผ ์๊ฒ ์ฃผ์ด์ ํ๋ฅ ์ ๋ฎ์ถ๋ค. treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ ๋น์ทํ๊ฒ ๋ง๋ค์ด ์ฃผ๊ฒ ๋ค๋ ๊ฒ weighting ๋ฐฉ๋ฒ์ด๋ค.
• Treatment ๋ฅผ ๋ฐ์ ํ๋ฅ ์ ์ญ์ ๊ฐ์ ์ด์ฉํ๊ธฐ ๋๋ฌธ์ "IPW : Inverse probability (=propensity score) weighting"๋ผ๊ณ ๋ ๋ถ๋ฅธ๋ค.
• ์ฑ์ธ๋จ์ฑ์ด treatment ๋ฅผ ๋ฐ์ ํ๋ฅ ์ 1/5์ด๊ณ , ๋ฐ์ง ๋ชปํ ํ๋ฅ ์ 4/5์ด๋ค. treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ด ์ฐจ์ด๊ฐ ๋๋ฏ๋ก, ์ด์ ์ญ์๋ฅผ ์ทจํด์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ๊ฐ์ค๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด, treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ 5/10, ๋ฐ์ง ์์ ํ๋ฅ ๋ 5/10๋ก ๋์ผํด์ง๋ค โจ ๋์ ๋์ง๊ธฐ์ ๋น์ทํ ์ธํ ์ด ๋๋ค.
โฏ Inverse Probability Weighting
• C : confounder, control variable (selection bias ๋ฅผ ์ผ๊ธฐํ๋ ๋ณ์) โจ Binary ํํ๋ก ๊ฐ์
• X : ์์ธ๋ณ์ โจ Binary ํํ๋ก ๊ฐ์ , Y : ๊ฒฐ๊ณผ๋ณ์
• 100๊ฐ์ ์ํ ์ค, C=1 ์ธ ๊ฒ์ 60๊ฐ, 0์ธ ๊ฒ์ 40๊ฐ โจ ๊ฐ C์ ์กฐ๊ฑด ์์์ X (treatment)๊ฐ ๋ฌ๋ผ์ง : selection bias
• X ๊ฐ Y ์ ๋ฏธ์น๋ ์ธ๊ณผ์ ์ธ ํจ๊ณผ : P(Y | X=1) - P(Y | X=0) โจ ๊ทธ๋ฌ๋ ์์ ์์์์๋ Control variable ์ ํต์ ํ์ง ์์ ์ํฉ์ด๋ผ ์ธ๊ณผํจ๊ณผ๋ผ๊ณ ๋งํ ์ ์๋ค.
• Control variable ์ด selection bias ๋ฅผ ๋ชจ๋ ์ค๋ช ํ ์ ์๋ค๊ณ ๊ฐ์ ํด๋ณด๋ฉด, C๋ผ๋ ๋ณ์๊ฐ selection bias ๋ฅผ ์ ๋ถ ์ค๋ช ํ๋ฏ๋ก, C๋ฅผ control ํ๋ฉด selection bias ๋ฅผ ์์จ ์ ์๋ค. ๊ทธ๋ฌ๋ฏ๋ก C=1 ์ธ ๊ฒฝ์ฐ ๋ด์์ ๋น๊ตํ๊ณ , C=0 ์ธ ๊ฒฝ์ฐ ๋ด์์ ๋น๊ต๊ฐ ๊ฐ๋ฅํ ๊ฒ์ด๋ค. Control group ์ด ๊ฐ์ ๊ทธ๋ฃน ๋ด์์๋ Counterfactual ์ ๋์ฒดํ ์ ์๋ค.
• Counterfactual ์ ๋์ฒดํ ํ ์ด๋ธ์ ์์ ๊ฐ๋ค. ์ด๋ฅผ Pseudo-Population ์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค. ํ๋์ ์ซ์๋ง ์๋ฅผ๋ค์ด ์ค๋ช ํด๋ณด์๋ฉด, (C=0 , X=0) ์ธ ๊ฒฝ์ฐ์๋, (C=0, X=1) ์ธ ๊ฒฝ์ฐ์์ Y ๊ฐ 7:3 ์ ๋น์จ์ ํ์ฑํ๊ณ ์์ผ๋ฏ๋ก Counterfactual ์ ๋์ฒด๋ฅผ 7, 3 ์ผ๋ก ํ ์ ์๋ ๊ฒ์ด๋ค.
• Counterfactual ๋ก ๋์ฒดํ๋ค๋ ๊ฒ์ ์๋ฏธ : control variable ์ด ์ฃผ์ด์ง ์ํ์์์ treatment ๋ฅผ ๋ฐ์ ํ๋ฅ ์ ์ญ์๋ฅผ ๊ณฑํ๊ณ , treatment ๋ฅผ ๋ฐ์ง ์์ ํ๋ฅ ์ ์ญ์๋ฅผ ๊ณฑํ๋ ๊ฑฐ์ ์ ํํ ๋์ผํ ์ ๊ทผ์ด๋ค.
• ๊ด์ฐฐํ ์ ์๋ counterfactual ์ control variable ์ด ๋์ผํ ๋ค๋ฅธ ์ง๋จ์ ๊ฐ์ผ๋ก ์นํํ๋ ๊ฐ๋ ์ด treatment group ์์๋ propensity score ์ ์ญ์๋ฅผ ๊ณฑํ๊ณ control group ์์๋ (1 - propensity score) ์ ์ญ์๋ฅผ ๊ณฑํ๋ ๊ฒ๊ณผ ๋๊ฐ๋ค.
• C์ ๊ด๊ณ์์ด X๋ฅผ ๋ฐ์ ํ๋ฅ ์ 50:50์ด ๋๋ค. random assignment ์ ๋์ผํด์ง๋ค โจ Control variable ์ independent ํ๊ฒ ์์ ํ random assignment ๋๋ค.
5. Weighting vs Regression/Matching
• ๊ธฐ์กด์ regression ์์ control variable ์ ํต์ ํ ๋๋, control variable ์ ๊ณ ์ ์์ผฐ๋ค. Matching ์์๋ control variable ์ ๊ฐ์ด ๊ฐ๋๋ก ๊ณ ์ ํ๋ค. ์ด ๋ ๋ฐฉ๋ฒ ๋ชจ๋ control variable ์ด selection bias ๋ฅผ ๋ชจ๋ ์ค๋ช ํด์ค๋ค๋ ๊ฐ์ ํ์์ control variable ์ ๊ฐ์ ํต์ ํจ์ผ๋ก์จ selection bias ๋ฅผ ์์ ๋ ์ ๋ต์ด๋ค. ๋ฐ๋ฉด weighting ์ selection bias ๋ฅผ ์ผ๊ธฐํ๋ control variable ์ independent ํ๊ฒ ์ฒ์น๋ฐ์ ํ๋ฅ ์ 50:50, ์ฆ random assignment ์ ๊ฐ๊น๊ฒ ๋ง๋ ๋ค.
• Conditioning ์ ํ ์ ์๋ ๊ฒฝ์ฐ๋ผ๋ฉด ์ ์ผํ๊ฒ ์ธ ์ ์๋ ๊ฒ์ weighting ๋ฐฉ๋ฒ์ด๋ค. ๊ทธ๋ฌ๋ weighting ๋ฐฉ๋ฒ์ด ํญ์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋ ๊ฒ์ ์๋๋ค. propensity score ๋ฅผ ์ ํํ๊ฒ ๊ณ์ฐ๋์ด์ผ ํ๋ค๋ ๊ฐ์ ์ด ํ์ํ๊ธฐ ๋๋ฌธ์ด๋ค.
โฏ Comparison of methods
โฏ CAVEAT: Last resort for causal inference
• ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ณ์๋ค๋ง์ ๊ฐ์ง๊ณ ๊ด์ฐฐ ๋ถ๊ฐ๋ฅํ ๋ณ์๋ค๊น์ง ์ค๋ช ํ๋ ๊ฒ์ ์ด๋ ค์ธ ์ ์๋ค.
• ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ณ์๋ค์ด ์ด๋ป๊ฒ selection bias ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํต์ ํ ์ ์์์ง๋ฅผ ์ค๋ํ๋๋ฐ ์์ด์ causal graph ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ๋์์ด ๋ ์ ์๋ค.
• RCT ๋ฅผ ํ ์ ์์ผ๋ฉด ํ๋๊ฒ ์ข์ง๋ง, ํ ์ ์๋ค๋ฉด regression ์ด๋ matching ์ ์ฌ์ฉํ ์ ์๋ค.
๋๊ธ