1๏ธโฃ AI•DS/๐ฅ Casual inference47 ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ํต์ ํจ์์ ์ ํ๋ชจํ ์ฐธ๊ณ ์์ : Bootcamp 4-4. ํต์ ํจ์์ ์ ํ๋ชจํ โธ Control function: selection bias correction method , LATE, 2SLS ์ ๋น์ทํ๊ฒ Instrumental variable ์ ํ์ฉํ๋ค. โธ Heckman selection model : control function ์ special case 1. Causal inference = How to address Endogeneity โฏ Causal inference • Selection model ๊ณผ Causal Graph ๋ ์ธ๊ณผ์ถ๋ก ์ Researcg design ๊ณผ ๋ค๋ฅธ ๊ด์ ์ ์ทจํ๊ณ ์๋ค. • ๊ทธ๋ฌ๋ LATE ์ selection model ์ ๋ชจ๋ IV ๋ฅผ ํ์ฉํ๋ค. โฏ Second approac.. 2023. 4. 26. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ํ๊ท๋ถ์ฐ์ ์ฐธ๊ณ ์์ : Bootcamp 4-3. ํ๊ท ๋ถ์ฐ์ 1. RD โฏ Regression Discontinuity • Discontinuous ๊ฐ ๋ฐ์ํ๋ฉด ๊ทธ๊ฒ์ ๊ธฐ์ ์ผ๋ก ์ธ๊ณผ์ถ๋ก ์ ์งํํ๋ ๋ฐฉ๋ฒ • Running variable = assignment variable = Forcing variable : Discontinuity ๊ฐ ๋ฐ์ํ๋ ๋ณ์ • RD ์์์ counterfactual : running variable ์ด ์์์ ๋๋ฅผ ๊ฐ์ ํ ์ถ์ด (์ ์ ) • counterfactual (์ ์ )๊ณผ treatment ๋ฅผ ๋ฐ์์ ๋์จ (์ค์ ) ์ฐจ์ด๊ฐ causal effect ์ด๋ค. โฏ Example of discontinuity • ์์ฃผ์ ๊ฑด๊ฐ/์ฌ๋ง ์ฌ์ด์ ์ธ๊ณผํจ๊ณผ • ๋ฏธ๊ตญ์์๋ ๋ฒ์ ์ผ๋ก 21์ธ๋ฅผ ๊ธฐ์ค์ผ๋ก ์.. 2023. 4. 26. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ์ธ๊ณผ์ถ๋ก ๊ด์ ์์์ ๋๊ตฌ๋ณ์ ์ฐธ๊ณ ์์ : Bootcamp 4-2. Local Average treatment effect (LATE) 1. IV from perspective of potential outcome โฏ LATE • IV ๊ฐ casual effect ์์ ์ด๋ค ๋ถ๋ถ์ ์ธก์ ํ๋ ๊ฒ์ธ์ง (์ธ๊ณผ๊ด๊ณ์์ ์ด๋ค ํด์์ ๊ฐ๋ ๊ฒ์ธ์ง) ์ง๊ด์ ์ธ ์ดํด๊ฐ ์กฐ๊ธ ์ด๋ ต๋ค. • ๋๊ตฌ๋ณ์ ๋ถ์์ potential outcome framework ์ ํตํฉํ๋๋ก ํ๋ ๊ฒ์ด LATE • LATE ๋ฅผ ๊ฐ์ง๊ณ , ๋๊ตฌ๋ณ์ ๋ถ์์ ํตํด์ ์ฐ๋ฆฌ๊ฐ ์ถ์ ํ๋ causal effect ๊ฐ ์ด๋ค ๊ฒ์ธ์ง ๋ถ๋ช ํ๊ฒ ํด์ํ ์ ์๊ฒ ๋์๋ค. 2. IV as a treatment assignment mechanism • Research design : ์ด๋ป๊ฒ treatm.. 2023. 4. 25. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๋๊ตฌ๋ณ์ ์ฐธ๊ณ ์์ : Bootcamp 4-1. Instrumental variable and regression discontinuity 1. ๋๊ตฌ๋ณ์ โฏ Causal Hierarchy • quasi-experiment design ์ด ๋ถ๊ฐ๋ฅํ์ง๋ง treatment๋ฅผ ํ ์ ์๋ ์ธ์๋ณ์๊ฐ ์กด์ฌํ๋ ๊ฒฝ์ฐ โจ instrumental variable ๋ฅผ ์ฌ์ฉ • quasi-experiment design ์ด ๊ฐ๋ฅํ๊ณ , ์ฒ์น์ง๋จ๊ณผ ํต์ ์ง๋จ์ ๊ด์ฐฐํ ์ ์์ง๋ง, longitudinal data (=panel data)๋ฅผ ๊ด์ธกํ ์ ์์ด (์ฆ, panel data ๊ฐ ์๋) treatment ๊ฐ arbitrary ํ threshold๋ก ์ ์ฉ๋๋ ๊ฒฝ์ฐ โจ Regression discontinuity์ ์ฌ์ฉ โฏ Endogen.. 2023. 4. 25. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๊ฐ์์ ํต์ ์ง๋จ ์ฐธ๊ณ ์์ : Bootcamp 3-4. ๊ฐ์์ ํต์ ์ง๋จ 1. synthetic control vs DID โฏ Synthetic control • synthetic control ์ DID ์ ํ์ฅ๋ฒ์ ์ด๋ ์ข ๋ ์ ์ฐํ ๋ฐฉ๋ฒ์ด๋ค. • ๋งค์นญ์ด ์ฑ๋ฆฝ๋์ง ์๊ณ , parallel trend ๊ฐ์ ์ด ์ฑ๋ฆฝํ์ง ์๋๋ผ๋ ์ ์ฉํ ์ ์๋ค. • ์ต๊ทผ ๊ฐ์ฅ ์ฃผ๋ชฉ๋ฐ๋ ๋ฐฉ๋ฒ๋ก ์ด๊ธฐ๋ ํ๋ค. • control group ์ ์กฐํฉํจ์ผ๋ก์ ๊ฐ์์ ๋น๊ต๊ฐ๋ฅํ ํต์ ์ง๋จ์ ๊ตฌ์ฑํ ์ ์๋ ๋ฐฉ๋ฒ์ด๋ค. 2. Example โฏ ์บ๋ฆฌํฌ๋์์ ๋ด๋ฐฐ ๊ท์ ์ ๋ด๋ฐฐ ํ๋งค๋์ ๋ฏธ์น ํจ๊ณผ • ์บ๋ฆฌํฌ๋์์์๋ง 1988๋ ์ ๋์ ๋จ, ๊ท์ ๊ฐ ๋์ ๋์ง ์์ 49๊ฐ์ ๋ค๋ฅธ ์ฃผ์ ๋น๊ตํ๊ณ ์ ํ์ง๋ง, ์์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด parallel trend ๋ฅผ ๋ฐ๋ฅด์ง ์์ โจ syn.. 2023. 4. 25. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ์ด์ค์ฐจ๋ถ๋ฒ ์ฐธ๊ณ ์์ : Bootcamp 3-3. ์ด์ค์ฐจ๋ถ๋ฒ DID(Difference-in-Differences)๋ quasi-experimental design ์ค ํ๋์ ๋๋ค. Quasi-experimental design์ randomized controlled trial(RCT)๊ณผ ๊ฐ์ ์๊ฒฉํ ์คํ์ ์ค๊ณ๊ฐ ์ ์ฉ๋์ง ์์ ๊ฒฝ์ฐ๋ฅผ ๋งํฉ๋๋ค. DID๋ ์ผ๋ฐ์ ์ผ๋ก ์ค์ ์คํ์ ์กฐ์์ ๊ฐํ์ง ์๋ ์์ฐ์ ์ธ ์ฌ๊ฑด, ์๋ฅผ ๋ค์ด ์ ์ฑ ๋ณํ, ์์ฐ ์ฌํด ๋ฑ์ด ๋ฐ์ํ ๊ฒฝ์ฐ๋ฅผ ์ด์ฉํ์ฌ ํจ๊ณผ๋ฅผ ์ธก์ ํ๋ ๊ฒ์ ๋๋ค. DID๋ ๋ ๊ฐ ์ด์์ ๊ทธ๋ฃน์ ๋น๊ตํ์ฌ ํจ๊ณผ๋ฅผ ์ธก์ ํฉ๋๋ค. DID๋ ์๊ฐ์ ์ผ๋ก ์๋ก ๋ค๋ฅธ ๋ ๊ทธ๋ฃน์ด ์๋ ๊ฒฝ์ฐ์ ์ฃผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. ์คํ ๊ทธ๋ฃน๊ณผ ๋์กฐ ๊ทธ๋ฃน์ ํน์ฑ์ด ์๋ก ๋ค๋ฅด์ง ์์ ๊ฒ์ด ์ ์ ๋์ด์ผ ํ๋ฉฐ, ์ด๋ฅผ ์ํด DI.. 2023. 4. 24. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ์ค์คํ ๋ถ์ ๋ฐฉ๋ฒ๋ก ์ฐธ๊ณ ์์ : Bootcamp 3-2. ์ค์คํ ๋ถ์ ๋ฐฉ๋ฒ๋ก 1. Counterfactual and methods โฏ Counterfactual revisited • ์ฐ๋ฆฌ์๊ฒ ํ์ํ๊ฑด, treatment group ์์ treat ๋ฅผ ๋ฐ์ง ์์๋๋ผ๋ฉด ์ด๋ค ๊ฒฐ๊ณผ๋ฅผ ๋ณด์๋์ง์ ๋ํ counterfactual โจ ํ์ค์์ ๊ด์ฐฐ ๋ถ๊ฐ๋ฅํ๊ธฐ ๋๋ฌธ์ ๊ฐ์ฅ ๋น์ทํ control group ์ ์ฐพ๋ ๊ฒ์ด ๊ด๊ฑด์ด๋ค. • Causal experiment method: control group ์ ํ์ฉํด ์ด๋ป๊ฒ counterfactual ์ ์ ์ถํ ์ ์์์ง์ ๋ํ ๋ฐฉ๋ฒ โจ Research design and apply method • ์ฐ๋ฆฌ๊ฐ ์ค์ ๋ฐ์ดํฐ๋ฅผ ํตํด ์ถ์ ํ๋ ๊ฒ์, treatment group ์ ๋ํ ATE ์ธ .. 2023. 4. 24. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๋์์ธ ๊ธฐ๋ฐ์ ์ธ๊ณผ์ถ๋ก ์ฐธ๊ณ ์์ : Bootcamp 3-1. ๋์์ธ ๊ธฐ๋ฐ์ ์ธ๊ณผ์ถ๋ก 1. Quasi-experimental designs โฏ Quasi-experiment designs • Research designs without random assignment : ๋ฌด์์ ์คํ์ ํ ์ ์์ ๋, ์ด์ ์ ์ฌํ๊ฒ ์คํ๋ ์ ์๋๋ก ํ๋ ์คํ • Quasi-experiment ๋ Instrumental variable์ ๊ฒฝ์ฐ, ๊ด์ฐฐ๋์ง ์์ ๊ฐ๋ค๊น์ง (selection bias) ๊ณ ๋ คํ๊ธฐ ์ํด research design์ ๋์ ํ๋ค. โฏ Random assignment is not always feasible • Quasi experiment ๋ RCT์ ๊ฑฐ์ ๋์ผํ๋ค๊ณ ๋ณผ ์ ์๋ค. ๋ค๋ง, selection bias๋ฅผ ์์ ๊ธฐ.. 2023. 4. 24. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๋งค์นญ๊ณผ ์ญํ๋ฅ ๊ฐ์ค์น ์ฐธ๊ณ ์์ : Bootcamp 2-4. ๋งค์นญ๊ณผ ์ญํ๋ฅ ๊ฐ์ค์น 1. Matching • Regression ์ control variable๊ณผ selection bias์ ๋ํด linear form์ผ๋ก ๊ฐ์ ํ๊ณ , control variable์ conditioning ํจ์ผ๋ก์จ ํน์ฑ์ ์ ์ฌํ๊ฒ ๋ง๋ค์๋ค๋ฉด matching ์ functional form ์์ด ๋จ์ํ control variable์์ ํน์ฑ์ด ์ ์ฌํ ๊ฒ๋ค์ ์ง์ ์ ์ผ๋ก ๋งค์นญํ๋ ๋ฐฉ๋ฒ์ด๋ค. ํจ์ฌ ๋ ์ง๊ด์ ์ธ ๋ฐฉ๋ฒ์ด๋ผ ๋ณผ ์ ์๋ค. Flexible ํ ํํ์ด๋ค. • ์ฆ, ํ๊ท๋ถ์๊ณผ Matching ์ functional form ์ ๊ฐ์ ํ๋๋ ์ ํ๋๋์ ์ฐจ์ด๋ง ์กด์ฌํ๋ค. • Matching ์ ํ๋ ๋ฐฉ๋ฒ์ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์๋๋ฐ, ๊ฐ์์์๋ 2๊ฐ์ง๋ง ์๊ฐ.. 2023. 4. 21. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ์ธ๊ณผ์ถ๋ก ๊ด์ ์์์ ํ๊ท๋ถ์ ์ฐธ๊ณ ์์ : Bootcamp 2-3. ์ธ๊ณผ์ถ๋ก ๊ด์ ์์์ ํ๊ท๋ถ์ 1. Casual Hierarchy • ์ด๋ค ์ข ๋ฅ์ selection bias๋ฅผ ๋ค๋ฃฐ ์ ์๋์ง์ ๋ํ ๊ธฐ์ค • Selection on Observables strategies : ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ณ์๋ค์ ์ํด์๋ง treatment์ control ์ด ์ ํ๋๋ค๋ ๊ฐ์ ์ ๊ฐ์ง๊ณ ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ณ์๋ค๋ง์ ๊ฐ์ง๊ณ selection bias๋ฅผ ์ค๋ช ํ๋ ค๋ ๊ฒฝํฅ • Selection on Unobservables strategies : ๊ด์ฐฐ ๊ฐ๋ฅํ์ง ์์ ๊ต๋ ์์ธ๋ค๋ ์ ์ ํ ์คํ๋์์ธ์ ํตํด ํด๊ฒฐํ๊ณ ์ ํ๋ ์ ๋ต โจ ์ข ๋ powerful ํ ์ ๋ต 2. How to balance between treatment and control groups โฏ Re.. 2023. 4. 21. ์ด์ 1 2 3 4 5 ๋ค์ 728x90