์ฐธ๊ณ ์์ : Bootcamp 2-4. ๋งค์นญ๊ณผ ์ญํ๋ฅ ๊ฐ์ค์น
1. Matching
โข Regression ์ control variable๊ณผ selection bias์ ๋ํด linear form์ผ๋ก ๊ฐ์ ํ๊ณ , control variable์ conditioning ํจ์ผ๋ก์จ ํน์ฑ์ ์ ์ฌํ๊ฒ ๋ง๋ค์๋ค๋ฉด matching ์ functional form ์์ด ๋จ์ํ control variable์์ ํน์ฑ์ด ์ ์ฌํ ๊ฒ๋ค์ ์ง์ ์ ์ผ๋ก ๋งค์นญํ๋ ๋ฐฉ๋ฒ์ด๋ค. ํจ์ฌ ๋ ์ง๊ด์ ์ธ ๋ฐฉ๋ฒ์ด๋ผ ๋ณผ ์ ์๋ค. Flexible ํ ํํ์ด๋ค.

โข ์ฆ, ํ๊ท๋ถ์๊ณผ Matching ์ functional form ์ ๊ฐ์ ํ๋๋ ์ ํ๋๋์ ์ฐจ์ด๋ง ์กด์ฌํ๋ค.
โข Matching ์ ํ๋ ๋ฐฉ๋ฒ์ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์๋๋ฐ, ๊ฐ์์์๋ 2๊ฐ์ง๋ง ์๊ฐํ๊ฒ ๋ค!
2. Matching Method : PSM
โฏ Propensity score matching
โข Propensity score matching ์ฑํฅ๋ ์ ์ ๋งค์นญ
โข control variable ์ด ์ฃผ์ด์ง ์ํ์์ treatment๋ฅผ ๋ฐ์ ํ๋ฅ
โข Propensity score ๋ฅผ ๊ธฐ์ค์ผ๋ก treatment์์์ score์ control์์์ score ๊ฐ ๋น์ทํ ๋ฐ์ดํฐ๋ค๋ผ๋ฆฌ ์๋ก ๋งค์นญํ๋ค.
โข logit ์ด๋ probit regression์ ํ์ฉํด์, treatment๋ฅผ ๋ฐ์ ๊ฑด์ง ์ฌ๋ถ๊ฐ y ๊ฐ ๋๊ณ , control variable์ x๋ก ๋์ด์ 0~1 ์ฌ์ด์ ๊ฐ์ ๊ฐ๋ ๊ฒฝํฅ์ ์๋ฅผ ์ป์ ์ ์๋ค.
โข selection on observable ์ ๋ต์ ๊ฐ์ ํ๋ ๋ฐฉ๋ฒ๋ก : propensity score ๋ฅผ ๊ณ์ฐํ๊ธฐ ์ํ ๋ณ์๋ค์ ๋ชจ๋ ์๊ณ ์์ด์ผ ํ๋ ๊ฒ์ด ์ ์ โจ ๊ต์ฅํ ๊ฐํ ๊ฐ์

โข propensity score ๊ฐ ์ ์ฌํ ๋ฐ์ดํฐ๋ง ๋จ๋๋ค. ์ด๋ค์ ํตํด ์ธ๊ณผ์ถ๋ก ์ ์งํํด ๋ณผ ์ ์๋ค.
โข ๋งค์นญ๋ control group ๊ณผ treatment group์ ํ๊ท ์ ๋จ์ ๋น๊ตํด๋ ๋๋ค.
โฏ Matching Method : Propensity score stratification

โข ์์ ๋ง์ฐฌ๊ฐ์ง๋ก propensity score ๋ฅผscore๋ฅผ ๊ตฌํ ๋ค์์, ์ด score๋ฅผ ์ผ์ ๊ตฌ๊ฐ์ผ๋ก ๋๋์ด์, ๊ฐ ๊ตฌ์ญ ๋ด์์ control group๊ณผ treatment group์ ๋น๊ตํ๋ค. ๋ชจ๋ ๊ตฌ๊ฐ์ ๋ํด ํ๊ท ์ ๋ด๋ ๋ฐฉ์์ผ๋ก ์ต์ข ๊ฒฐ๊ณผ๋ฅผ ์ป๋๋ค.
โข ๊ทธ๋ฌ๋ ์ฑํฅ์ ์๋งค์นญ์์ ์ฑํฅ์ ์๊ฐ ์ ํํ๊ฒ ๊ตฌํด์ง๋์ง ์์ฒด์ ๋ํด ๋ถํ์ค์ฑ (logit , probit ์ ๋์ ํด์ ๊ตฌํ๋ ๊ฒ์ด ๊ณผ์ฐ ์ณ์๊ฐ) ์ด ๋ง๋ค. ์ต๊ทผ์๋ ๋์์ผ๋ก CEM ์ด ๋ง์ด ์ฌ์ฉ๋๋ค.
3. CEM
โข Coarsened Exact Matching : ์ด๋ ํ ํจ์๋ ๊ฐ์ ํ์ง ์๊ณ ์ง๊ด์ ์ธ ๋ฐฉ๋ฒ์ด๋ค. ์ฑํฅ์ ์๋ฅผ ๊ตฌํ๋ ๊ฒ๋ ์๋๊ณ , probit ๊ฐ์ ๋ชจ๋ธ์ ๊ฐ์ ํ๋ ๊ฒ๋ ์๋๋ค. ๋จ์ํ control variable ์ด ๋น์ทํ ๊ฒ๋ผ๋ฆฌ ๋งค์นญ์ํค๋ ๊ฒ์ด๋ค. (A : ๋จ์, 175cm) - (B : ๋จ์, 175cm) ๋งค์นญ์ฒ๋ผ control variable ์ด ์ง์ ์ ์ผ๋ก ๊ฐ์ ์ฌ๋๋ค๋ผ๋ฆฌ ๋งค์นญํ๋ ๊ฒ์ด๋ค.

โข ๋ณ์๊ฐ ์ฌ๋ฌ ๊ฐ๋ฉด ๋ชจ๋ ๋ณ์๊ฐ ์ ํํ๊ฒ ๊ฐ์ ๊ฒฝ์ฐ๋ ๊ฑฐ์ ์์ ๊ฒ์ด๋ค. Control variable ์ ๋ช ๊ฐ์ bin์ผ๋ก ๋์จํ๊ฒ ๋๋์ด, ๊ทธ ๊ตฌ๊ฐ ๋ด์์ ์๋ก ๋งค์นญ์ ํ๋ค. ๊ฐ์ ๊ตฌ๊ฐ ๋ด์ ์๋ ๊ฐ๋ค์ ๋งค์นญํจ์ผ๋ก์จ Exact matching ์ด๊ธด ํ์ง๋ง ์กฐ๊ธ ๋์จํ๊ฒ ๋งค์นญํ์ฌ ์ฌ๋ฌ ๊ฐ์ ๋งค์นญ ๋ฐ์ดํฐ๋ฅผ ์ป๋๋ค.
โข ์ด๋ ํ ๊ฐ์ ์ ์์กดํ์ง ์๊ธฐ ๋๋ฌธ์, ์ง์ ์ ์ผ๋ก ์ ์ฌํ๊ฒ ๋ง๋ค ์ ์๋ค. ๊ทธ๋ฌ๋ ๊ตฌ๊ฐ์ ๋ํ ๋งค์นญ์ ํ๋๋ผ๋, ๋ชจ๋ ๋ณ์๋ค์ ๋ํด ๊ฐ ๋ณ์ ๋ณ๋ก ๊ตฌ๊ฐ์ด ๊ฐ์์ผ ํ๋๊น ๋งค์นญ๋๋ ๋ฐ์ดํฐ์ ๊ฐ์๋ ์ฌ์ ํ ์ ๋ค. ๊ทธ๋์ ์์ง๊น์ง๋ PSM, CEM ์ค์ ๋ฌด์์ด ๋ ์ฐ์ํ๋ค๊ณ ๊ฒฐ๋ก ๋ด๋ฆฌ๊ธฐ๋ ์ด๋ ต๋ค. ํ์ฌ ์ฐ๊ตฌ์์๋ ์ด 2๊ฐ์ง๋ฅผ ๋ชจ๋ ํ์ฉํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
4. Weighting
โฏ Weighting
โข Matching ์ด ์ฌ์ฉ๋์ง ๋ชปํ๋ ๊ฒฝ์ฐ์๋, Weighting ์ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค.
โข Weighting ์ propensity score ์ ์ญ์๋งํผ์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค. treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ด ์์ ๊ทธ๋ฃน์๋ ๋ ๋ง์ weight์ ์ฃผ์ด์ ํ๋ฅ ์ ๋ ํค์ฐ๊ณ , treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ด ํฐ ๊ทธ๋ฃน์๋ weight๋ฅผ ์๊ฒ ์ฃผ์ด์ ํ๋ฅ ์ ๋ฎ์ถ๋ค. treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ ๋น์ทํ๊ฒ ๋ง๋ค์ด ์ฃผ๊ฒ ๋ค๋ ๊ฒ weighting ๋ฐฉ๋ฒ์ด๋ค.
โข Treatment ๋ฅผ ๋ฐ์ ํ๋ฅ ์ ์ญ์ ๊ฐ์ ์ด์ฉํ๊ธฐ ๋๋ฌธ์ "IPW : Inverse probability (=propensity score) weighting"๋ผ๊ณ ๋ ๋ถ๋ฅธ๋ค.

โข ์ฑ์ธ๋จ์ฑ์ด treatment ๋ฅผ ๋ฐ์ ํ๋ฅ ์ 1/5์ด๊ณ , ๋ฐ์ง ๋ชปํ ํ๋ฅ ์ 4/5์ด๋ค. treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ด ์ฐจ์ด๊ฐ ๋๋ฏ๋ก, ์ด์ ์ญ์๋ฅผ ์ทจํด์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ๊ฐ์ค๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด, treatment๋ฅผ ๋ฐ์ ํ๋ฅ ์ 5/10, ๋ฐ์ง ์์ ํ๋ฅ ๋ 5/10๋ก ๋์ผํด์ง๋ค โจ ๋์ ๋์ง๊ธฐ์ ๋น์ทํ ์ธํ ์ด ๋๋ค.
โฏ Inverse Probability Weighting
โข C : confounder, control variable (selection bias ๋ฅผ ์ผ๊ธฐํ๋ ๋ณ์) โจ Binary ํํ๋ก ๊ฐ์
โข X : ์์ธ๋ณ์ โจ Binary ํํ๋ก ๊ฐ์ , Y : ๊ฒฐ๊ณผ๋ณ์

โข 100๊ฐ์ ์ํ ์ค, C=1 ์ธ ๊ฒ์ 60๊ฐ, 0์ธ ๊ฒ์ 40๊ฐ โจ ๊ฐ C์ ์กฐ๊ฑด ์์์ X (treatment)๊ฐ ๋ฌ๋ผ์ง : selection bias
โข X ๊ฐ Y ์ ๋ฏธ์น๋ ์ธ๊ณผ์ ์ธ ํจ๊ณผ : P(Y | X=1) - P(Y | X=0) โจ ๊ทธ๋ฌ๋ ์์ ์์์์๋ Control variable ์ ํต์ ํ์ง ์์ ์ํฉ์ด๋ผ ์ธ๊ณผํจ๊ณผ๋ผ๊ณ ๋งํ ์ ์๋ค.

โข Control variable ์ด selection bias ๋ฅผ ๋ชจ๋ ์ค๋ช ํ ์ ์๋ค๊ณ ๊ฐ์ ํด๋ณด๋ฉด, C๋ผ๋ ๋ณ์๊ฐ selection bias ๋ฅผ ์ ๋ถ ์ค๋ช ํ๋ฏ๋ก, C๋ฅผ control ํ๋ฉด selection bias ๋ฅผ ์์จ ์ ์๋ค. ๊ทธ๋ฌ๋ฏ๋ก C=1 ์ธ ๊ฒฝ์ฐ ๋ด์์ ๋น๊ตํ๊ณ , C=0 ์ธ ๊ฒฝ์ฐ ๋ด์์ ๋น๊ต๊ฐ ๊ฐ๋ฅํ ๊ฒ์ด๋ค. Control group ์ด ๊ฐ์ ๊ทธ๋ฃน ๋ด์์๋ Counterfactual ์ ๋์ฒดํ ์ ์๋ค.


โข Counterfactual ์ ๋์ฒดํ ํ ์ด๋ธ์ ์์ ๊ฐ๋ค. ์ด๋ฅผ Pseudo-Population ์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค. ํ๋์ ์ซ์๋ง ์๋ฅผ๋ค์ด ์ค๋ช ํด๋ณด์๋ฉด, (C=0 , X=0) ์ธ ๊ฒฝ์ฐ์๋, (C=0, X=1) ์ธ ๊ฒฝ์ฐ์์ Y ๊ฐ 7:3 ์ ๋น์จ์ ํ์ฑํ๊ณ ์์ผ๋ฏ๋ก Counterfactual ์ ๋์ฒด๋ฅผ 7, 3 ์ผ๋ก ํ ์ ์๋ ๊ฒ์ด๋ค.
โข Counterfactual ๋ก ๋์ฒดํ๋ค๋ ๊ฒ์ ์๋ฏธ : control variable ์ด ์ฃผ์ด์ง ์ํ์์์ treatment ๋ฅผ ๋ฐ์ ํ๋ฅ ์ ์ญ์๋ฅผ ๊ณฑํ๊ณ , treatment ๋ฅผ ๋ฐ์ง ์์ ํ๋ฅ ์ ์ญ์๋ฅผ ๊ณฑํ๋ ๊ฑฐ์ ์ ํํ ๋์ผํ ์ ๊ทผ์ด๋ค.
โข ๊ด์ฐฐํ ์ ์๋ counterfactual ์ control variable ์ด ๋์ผํ ๋ค๋ฅธ ์ง๋จ์ ๊ฐ์ผ๋ก ์นํํ๋ ๊ฐ๋ ์ด treatment group ์์๋ propensity score ์ ์ญ์๋ฅผ ๊ณฑํ๊ณ control group ์์๋ (1 - propensity score) ์ ์ญ์๋ฅผ ๊ณฑํ๋ ๊ฒ๊ณผ ๋๊ฐ๋ค.

โข C์ ๊ด๊ณ์์ด X๋ฅผ ๋ฐ์ ํ๋ฅ ์ 50:50์ด ๋๋ค. random assignment ์ ๋์ผํด์ง๋ค โจ Control variable ์ independent ํ๊ฒ ์์ ํ random assignment ๋๋ค.
5. Weighting vs Regression/Matching

โข ๊ธฐ์กด์ regression ์์ control variable ์ ํต์ ํ ๋๋, control variable ์ ๊ณ ์ ์์ผฐ๋ค. Matching ์์๋ control variable ์ ๊ฐ์ด ๊ฐ๋๋ก ๊ณ ์ ํ๋ค. ์ด ๋ ๋ฐฉ๋ฒ ๋ชจ๋ control variable ์ด selection bias ๋ฅผ ๋ชจ๋ ์ค๋ช ํด์ค๋ค๋ ๊ฐ์ ํ์์ control variable ์ ๊ฐ์ ํต์ ํจ์ผ๋ก์จ selection bias ๋ฅผ ์์ ๋ ์ ๋ต์ด๋ค. ๋ฐ๋ฉด weighting ์ selection bias ๋ฅผ ์ผ๊ธฐํ๋ control variable ์ independent ํ๊ฒ ์ฒ์น๋ฐ์ ํ๋ฅ ์ 50:50, ์ฆ random assignment ์ ๊ฐ๊น๊ฒ ๋ง๋ ๋ค.
โข Conditioning ์ ํ ์ ์๋ ๊ฒฝ์ฐ๋ผ๋ฉด ์ ์ผํ๊ฒ ์ธ ์ ์๋ ๊ฒ์ weighting ๋ฐฉ๋ฒ์ด๋ค. ๊ทธ๋ฌ๋ weighting ๋ฐฉ๋ฒ์ด ํญ์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋ ๊ฒ์ ์๋๋ค. propensity score ๋ฅผ ์ ํํ๊ฒ ๊ณ์ฐ๋์ด์ผ ํ๋ค๋ ๊ฐ์ ์ด ํ์ํ๊ธฐ ๋๋ฌธ์ด๋ค.
โฏ Comparison of methods

โฏ CAVEAT: Last resort for causal inference
โข ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ณ์๋ค๋ง์ ๊ฐ์ง๊ณ ๊ด์ฐฐ ๋ถ๊ฐ๋ฅํ ๋ณ์๋ค๊น์ง ์ค๋ช ํ๋ ๊ฒ์ ์ด๋ ค์ธ ์ ์๋ค.
โข ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ณ์๋ค์ด ์ด๋ป๊ฒ selection bias ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํต์ ํ ์ ์์์ง๋ฅผ ์ค๋ํ๋๋ฐ ์์ด์ causal graph ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ๋์์ด ๋ ์ ์๋ค.

โข RCT ๋ฅผ ํ ์ ์์ผ๋ฉด ํ๋๊ฒ ์ข์ง๋ง, ํ ์ ์๋ค๋ฉด regression ์ด๋ matching ์ ์ฌ์ฉํ ์ ์๋ค.
๋๊ธ