์ฐธ๊ณ ์์ : Bootcamp 4-4. ํต์ ํจ์์ ์ ํ๋ชจํ
โธ Control function: selection bias correction method , LATE, 2SLS ์ ๋น์ทํ๊ฒ Instrumental variable ์ ํ์ฉํ๋ค.
โธ Heckman selection model : control function ์ special case
1. Causal inference = How to address Endogeneity
โฏ Causal inference
• Selection model ๊ณผ Causal Graph ๋ ์ธ๊ณผ์ถ๋ก ์ Researcg design ๊ณผ ๋ค๋ฅธ ๊ด์ ์ ์ทจํ๊ณ ์๋ค.
• ๊ทธ๋ฌ๋ LATE ์ selection model ์ ๋ชจ๋ IV ๋ฅผ ํ์ฉํ๋ค.
โฏ Second approach : Control function
• control function ๊ณผ selection model ์ ๋๊ตฌ๋ณ์๋ฅผ ์๊ตฌํ๋ ๊ฒ์ ๋๊ฐ๋ค. First stage ์์ ๋๊ตฌ๋ณ์๊ฐ ํ๋ ์ญํ ์ 2SLS ์ ๋์ผํ๋ค. ๋๊ตฌ๋ณ์๋ฅผ ํตํด exogenous ํ ๋ถ๋ถ๊ณผ endogenous ํ ๋ถ๋ถ์ ๋๋๋ค. ๊ทธ๋ฌ๋, second stage ์ ๋ํ ์ ๊ทผ์ด ๋ค๋ฅด๋ค. LATE ๋ exogenous ํ ๋ถ๋ถ์ ๋ผ์ด์ ๋ถ์ํ๋ ๋ฐ๋ฉด,
• control function ์ endogenous ํ ๋ถ๋ถ๊ณผ ๊ด๋ จ๋์ด์๋ error term ์ selection bias ๋ฅผ ์์ธกํ๊ณ , selection bias ๋ฅผ ํต๊ณ์ ์ผ๋ก ๊ณ์ฐํ์ฌ ์ง์ ํต์ ํจ์ผ๋ก์จ ์ธ๊ณผ์ถ๋ก ์ ํ๊ณ ์ ํ๋ ๋ฐฉ๋ฒ์ด๋ค. counterfactual ์ ๋ํ ๊ฐ์ ๋ฑ์ด ํ์ ์์ด ํต๊ณ์ ์ผ๋ก ์ ๊ทผํ๋ ๋ฐฉ์์ด๋ค.
• control function์์ selection bias ๊ฐ treatment group ํน์ sample ์ select ๋ ํ๋ฅ ์ด๋ผ๋ฉด (predicted residual represents the probability of being selected) ๊ทธ๋ฌํ ํน์ํ ๊ฒฝ์ฐ๋ฅผ selection model ์ด๋ผ ๋ถ๋ฅธ๋ค.
• selection model ์์ probit modeling ์ ํ๋ ๊ฒ์ด Heckman selection model !
โฏ Second approach : Control function , ์์์ผ๋ก ์ดํด๋ณด๊ธฐ
[2] First-stage equation : x = α0 + α1โz + v
โช α0 + α1โz : exogenous ํ ๋ถ๋ถ
โช v : endogenous ํ ๋ถ๋ถ (residual)
โช v ๋ฅผ ํ์ฉํด์ u ๋ฅผ ์์ธกํ๋ค. v ๋ endogenous ํ ๋ถ๋ถ์ด๊ธฐ ๋๋ฌธ์, error term u ์์ endogenous ํ ๋ถ๋ถ (selection bias) ๋ฅผ ์์ธกํ ์ ์๋ค.
[3] Predicting the endogenous portion of the error term : u = ρโv + e
โช ρโv : selection bias
โช e : ์์ error term
โช ρ : ์ด๋ก ์ ์ผ๋ก๋ treatment ๋ฅผ ์ค๋ช ํ๋๋ฐ ๊ด์ฐฐ๋์ง ์๋ v ์, outcome ์ ์ค๋ช ํ๋๋ฐ ๊ด์ฐฐ๋์ง ์๋ u์ correlation
[4] 3๋ฒ ๊ฒฐ๊ณผ๋ฅผ 1์ ์ง์ด๋ฃ๋๋ค : second-stage : y = β0 + β1โx + ρโv + e
โช error term ์์ selection bias ๋ถ๋ถ์ ๋ฐ๋ก ๋ผ์ด์, selection bias ๋ฅผ ์ผ๊ธฐํ๋ v๋ฅผ ๋ฃ๊ณ ์ง์ selection bias ๋ฅผ control ํ์
2. Two-stage Least Squares vs Control function
โฏ ๋น๊ต
• Potential outcome framework ์ ์ ๊ฐํ์ฌ ๋๊ตฌ๋ณ์๋ฅผ ํ์ฉํด ์ธ๊ณผํจ๊ณผ๋ฅผ ๋ถ์ํ์ → 2SLS
• ๋๊ตฌ๋ณ์๋ฅผ ํ์ฉํด ๋ด์์ฑ์ ์ง์ ์ ์ดํ๊ธฐ ์ํด ํต๊ณ์ ์ผ๋ก ๋ถ์ํ์ → Control function
โฏ 2SLS ์ ์ฅ๋จ์
• ์ฅ์ : LATE ๊ฐ๋ ํ์์ potential outcome framework ์ ํตํฉ๋ ์ ์๋ค. RCT, ์ค์คํ ๋ฑ๊ณผ ๋์ผํ ์ ์์์ IV ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ํด์ํ ์ ์๋ค.
• ๋จ์ : monotonicity assumption (๋๊ตฌ๋ณ์์ ์ํด์ ํ๋ฐฉํฅ์ผ๋ก treatment ๊ฐ assign ๋์ด์ผ ํ๋ค = compliers)์ด ์ฑ๋ฆฝํด์ผ ํ๊ธฐ ๋๋ฌธ์, ๊ตฌํ ์ ์๋ ๊ฒ์ compliers ๋ผ๋ ํน์ ์ง๋จ์์์ local ํ causal effect ์ด๊ธฐ ๋๋ฌธ์ ๋ค๋ฅธ ์ง๋จ์์ ์ผ๋ฐํ ํ๋๊ฒ ์ด๋ ต๋ค๋ฉด ํ๊ณ๊ฐ ์์ ์ ์๋ค. ๋ํ, non-linear model ๋ก ์ถ์ ํ๊ธฐ๊ฐ ์ด๋ ต๋ค๋ ๋จ์ ์ด ์๋ค.
โฏ Control function ์ ์ฅ๋จ์
• ์ฅ์ : ์ ์ฒด treatment ๋ฅผ ๋ค ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์, selection bias ๋ฅผ ์ control ํ ์ ์๋ค๋ฉด, ATET ๋ฅผ ๊ตฌํ ์ ์๋ค. ๋ํ ํต๊ณ์ ์ผ๋ก ํจ์ฌ ๋ ์ ์ฐํ๊ฒ ํ์ฅ๋ ์ ์๋ค.
• ๋จ์ : ๊ตฌํ causal effect ๊ฐ ๋ฌด์์ ์๋ฏธํ๋์ง ์ง๊ด์ ์ผ๋ก ํด์ํ๊ธฐ๊ฐ ์ด๋ ต๋ค. ํต๊ณ์ ์ผ๋ก๋ ์ดํด๊ฐ ๋์ง๋ง, ๊ทธ๋ ๊ฒ ๊ตฌํ ๊ฒ์ด ์ด๋ค causal effect ์ธ์ง ๋ชจํธํ๋ค.
3. Example
โฏ Effects of previews/Reviews on E-book purchase
• control function: residual inclusion method (=selection bias correction model)
โฏ Effects of Advertising on Sales
• endogeneity ๋ selection bias ๊ฐ ์์ด์ ๊ทธ ์์ธ์ด confounder ๋ก์ outcome ์๋ง ์ํฅ์ ์ค ์ ์์ง๋ง causal effect ์์ฒด์ ์ํฅ์ ์ฃผ๋ ์ฌ๋ก๊ฐ ์์ ์ ์๋ค. ์ฆ, error term (v) ๋ฟ๋ง ์๋๋ผ ์ถ์ ํ ๊ณ์ (ϒ) ์์ฒด์๋ selection bias ๊ฐ ์์ฌ๋ค์ด๊ฐ ์ ์๋ค. ๋ฐ๋ผ์ ์ด๋ฌํ ๊ฒ์ ๊ณ ๋ คํ๊ธฐ ์ํด, Extended model ์ ๋ณด๋ฉด coefficient term ์๋ error term ์ ์ถ๊ฐํ ๊ฒ์ ๋ณผ ์ ์๋ค. (P ๋ treatment variable)
• ๋ค์ํ ํํ๋ก control ํ๋ค.
4. Heckman selection model : special case of control function
• selection ์ด 1 ์๋๋ฉด 0์ด๊ณ (probability residual), ๊ทธ bianry ๋ฅผ probit ์ผ๋ก ๋ชจ๋ธ๋ง ํ๋ค๋ฉด binary probit model ์์์ residual v ๋ฅผ ์ค์ ๋ก ๊ณ์ฐํด๋ณด๋ฉด Inverse Mills ratio (=๋์ ๋ถํฌํจ์/ํ๋ฅ ๋ฐ๋ํจ์ ์ ์ญ์) ๊ฐ ๋์จ๋ค.
• lambda : coefficient of Inverse Mills ratio : -0.14 (์์) : first stage ์์ ๋ค๊ฐํ์ ์ํฅ์ ์ฃผ๋ ๊ด์ธก๋์ง ์์ ์์ธ๊ณผ outcome ์ธ firm value ์ ์ํฅ์ ์ฃผ๋ ๊ด์ธก๋์ง ์์ ์์ธ์ด ์์ ์๊ด๊ด๊ณ์ ์๋ค. ์ฆ, ๋ค๊ฐํ๋ฅผ ํ๋ ๊ฒฝํฅ์ด ๋์ ๊ธฐ์ ๋ค์ firm value ๊ฐ ๋ฎ์ ๊ธฐ์ ๋ค์ด ๋ง๋ค.
๋๊ธ