โฏ ์ค์ต ๋ฐ๋ผ ๊ณต๋ถํ ๋ ธํธ๋ถ
https://colab.research.google.com/drive/1gM9uiyTwW80ZhWGqXkK_PbVXQGGfacTR?usp=sharing
โ ML based estimation of heterogeneous Treatment Effects
• ๋จธ์ ๋ฌ๋์ ๊ฐ์ฅ ํฐ ๋ชฉ์ ์ ๋๋ฉ์ธ ์์ฉ์์ ์์ฌ๊ฒฐ์ ์ ์๋ํ ํ๋ ๊ฒ์ด๋ค.
• ๋๋ถ๋ถ์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ personalized ๋ ์์ฌ๊ฒฐ์ ์๋๋ฆฌ์ค์ ํต์ฌ์ ์ธ ๋ฌธ์ ๋ heterogeneous treatment effects ๋ฅผ ์ถ์ ํ๋ ๊ฒ์ด๋ค. (Intervention ์ ํจ๊ณผ๋ ๋ฌด์์ธ๊ฐ)
• ๊ฐ๋ น ๊ฐ๊ฒฉํ ์ธ์ด ์์์ ๋ฏธ์น๋ ์ํฅ์, ์๋น์ ํน์ฑ ํจ์๋ก ์ถ์ ํ๋, personalized pricing ๋ฌธ์ ์์ ๋ฐ์ํ ์ ์๋ค. ๋ํ ์ฝ๋ฌผ์น๋ฃ๊ฐ ํ์์ ์์ ๋ฐ์์ ๋ฏธ์น๋ ์ํฅ์ ํ์์ ํน์ฑ ํจ์๋ก ์ถ์ ํ๋ ๊ฒ์ด ๋ชฉํ์ธ ์๋ฃ ์์์ํ์์๋ ํด๋น ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์๋ค.
• ์์ ๊ฐ์ ์์๋ค์ ๊ฒฝ์ฐ๋ observational data ๊ฐ ํ๋ถํ๊ณ , unknown policy ์ ์ํด treatment ๊ฐ ๊ฐํด์ง๊ณ , A/B test ๋ฅผ ์คํํ๋ ๊ฒ์ด ์ ํ๋์ด ์๋ ์ํฉ์ ๋์ฌ์ ธ ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
• EconML ํจํค์ง๋ ๊ณ๋๊ฒฝ์ ํ๊ณผ ๋จธ์ ๋ฌ๋์ ๊ต์ฐจ์ ์์ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ํตํด heterogeneous treatment effect ์ถ์ ํ๋ ์ต์ ๊ธฐ๋ฒ์ ๊ตฌํํ๋ค. ์ด๋ฌํ ๋ฐฉ๋ฒ์ Random forests, boosting, lasso and neural nets ๋ฑ์ ๊ธฐ๋ฒ์ ํตํด heterogeneity effect ๋ฅผ ๋ชจ๋ธ๋ง ํ๋๋ฐ์ ์๋นํ flexibility ๋ฅผ ์ ๊ณตํ๋ ๋์์ ์ธ๊ณผ์ถ๋ก ๋ฐ ๊ณ๋๊ฒฝ์ ํ์ ๊ธฐ๋ฒ์ ํ์ฉํ์ฌ ํ์ต๋ ๋ชจ๋ธ์ ์ธ๊ณผ์ ํด์์ ๋ณด์กดํ๊ณ , ์ ํจํ ์ ๋ขฐ๊ตฌ๊ฐ์ ๊ตฌ์ฑํจ์ผ๋ก์จ ํต๊ณ์ ํ๋น์ฑ์ ์ ๊ณตํ๋ค.
โก Motivating Examples
• EconML ์ feature set X ๋ฅผ controlling ํ๋ฉด์, treatment variable T ๊ฐ outcome variable Y ์ ๋ฏธ์น๋ causal effect ๋ฅผ ์ธก์ ํ๊ธฐ ์ํด ๊ณ ์ํ ๋ชจ๋ธ์ด๋ค.
โด Recommendation A/B testing
Interpret experiments with imperfect compliance
• Question. ์ฌํ ์น์ฌ์ดํธ์์ ๋ฉค๋ฒ์ญ ํ๋ก๊ทธ๋จ์ ๊ฐ์ ํ๋ฉด ์ฌ์ฉ์๊ฐ ์น์ฌ์ดํธ์ ๋ ๋ง์ ์๊ฐ์ ๋ณด๋ด๋์ง ์๊ณ ์ถ๋ค.
• Problem. ๋ฉค๋ฒ์ญ ํ์์ด ๋๊ธฐ๋ก ์ ํํ ๊ณ ๊ฐ์ engagement ๊ฐ ๋ค๋ฅธ ๊ณ ๊ฐ๋ณด๋ค ์ด๋ฏธ ๋์ ๊ฐ๋ฅ์ฑ์ด ๋๊ธฐ ๋๋ฌธ์ ๊ธฐ์กด ๋ฐ์ดํฐ๋ฅผ ์ง์ ์ดํด๋ณด๊ณ ๋ฉค๋ฒ์ญ ํ์๊ณผ ๋นํ์์ ๋น๊ตํ๊ธฐ๊ฐ ์ด๋ ต๋ค. ๋ํ ์ฌ์ฉ์์๊ฒ ๋ฉค๋ฒ์ญ ๊ฐ์ ์ ๊ฐ์ํ ์ ์๊ธฐ ๋๋ฌธ์ ์ง์ ์ ์ธ A/B ํ ์คํธ๋ฅผ ์คํํ ์๋ ์๋ค.
• Solution. ํ์ฌ์ธก์์ ์๋กญ๊ณ ๋น ๋ฅธ ๊ฐ์ ๊ณผ์ ์ ๊ฐ์น๋ฅผ ํ ์คํธ ํ๊ธฐ ์ํด ์ด์ ์ ์คํ์ ์งํํ ์ ์ด ์๋ค. EconML ์ DRIV estimator ๋ ๋ฉค๋ฒ์ญ์ ๋ํ ์ด ์คํ์ nudge ๋ฅผ ๋ฉค๋ฒ์ญ likelihood ์ ๋ฌด์์ ๋ณ๋์ ์์ฑํ๋ ๋๊ตฌ๋ณ์๋ก ์ฌ์ฉํด๋ณผ ์ ์๋ค. DRIV ๋ชจ๋ธ์ ๋น ๋ฅธ ๊ฐ์ ๊ณผ์ ์ ์ ์๋ฐ์ ๋ชจ๋ ๊ณ ๊ฐ์ด ๋ฉค๋ฒ์ญ ํ์์ด ๋๋ ๊ฒ์ ์๋๋ผ๋ ์ ์ ๊ณ ๋ คํด ๋น ๋ฅธ ๊ฐ์ ๊ณผ์ ์ ํจ๊ณผ๊ฐ ์๋ ๋ฉค๋ฒ์ญ์ ํจ๊ณผ๋ฅผ ๋ฐํํ๋ค. (Returns the effect of membership rather than the effect of receiving the quick sign-up)
โฏ ์ฝ๋ ์ค์ต
โฏ Case study : Trip advisor
โต Customer segmentation
Estimate individualized responses to incentives
• Question. ๋ฏธ๋์ด ๊ตฌ๋ ์๋น์ค์์ ๋ง์ถค์ ์๊ธ์ ๋ฅผ ํตํด ํ๊ฒ ํ ์ธ์ ์ ๊ณตํ๋ ค๊ณ ํ๋ค.
• Problem. ๊ณ ๊ฐ์ ๋ง์ ํน์ง์ ๊ด์ฐฐํ ์ ์์ง๋ง, ์ด๋ค ๊ณ ๊ฐ์ด ๋ ๋ฎ์ ๊ฐ๊ฒฉ์ ๊ฐ์ฅ ํฐ ๋ฐ์์ ๋ณด์ผ์ง ํ์ ํ๊ธฐ๊ฐ ์ด๋ ต๋ค.
• Solution. EconML ์ DML estimator ๋ฅผ ํตํด ๊ธฐ์กด ๋ฐ์ดํฐ์์ ์กด์ฌํ๋ ์ ์ ๊ฐ๊ฒฉ ๋ณ๋์ ์ฌ์ฉํ์ฌ ๋ค์ ์ ์ ์ feature ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋ heterogeneous ํ ๊ฐ๊ฒฉ ๋ฏผ๊ฐ๋๋ฅผ ์ถ์ ํ๋ค. Tree interpreter ๋ ํ ์ธ์ ๋ํ ๋ฐ์์ ๊ฐ์ฅ ํฐ ์ฐจ์ด๋ฅผ ์ค๋ช ํ๋ ์ฃผ์ feature ์ ๋ํ ์์ฝ์ ์ ๊ณตํ๋ค.
โฏ ์ฝ๋ ์ค์ต
โถ Multi-investment attribution
Distinguish the effects of multiple outreach efforts
• Question. ์คํํธ์ ์ด ์ ๊ท ๊ณ ๊ฐ์ ๋ชจ์งํ๋๋ฐ ๊ฐ์ฅ ํจ๊ณผ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ์๊ณ ์ ํ๋ค : ๊ฐ๊ฒฉํ ์ธ, Adoption ์ ์ด๋ผ๋ ๊ธฐ์ ์ ์ง์, ํน์ ์ด ๋ ๊ฐ์ง๋ฅผ ๊ฒฐํฉํ ๋ฐฉ์
• Problem. ๊ณ ๊ฐ์ ์์ ์ ์๋ ์ํ ๋๋ฌธ์ ์ง์ํ๋์ ๋๋ ๋ ธ๋ ฅ์ ๋ง์ ๋น์ฉ์ด ์์๋๋ค. ๋๊ธฐ์ ์ ๊ธฐ์ ์ ์ง์์ ๋ฐ์ ๊ฐ๋ฅ์ฑ์ด ๋ ๋์ ๊ฒ์ฒ๋ผ, ๊ณ ๊ฐ์๊ฒ ์ ๋ต์ ์ผ๋ก ์ธ์ผํฐ๋ธ๋ฅผ ์ ๊ณตํด์๋ค.
• Solution. EconML ์ Doubly Robust Learner model ์ ์ฌ๋ฌ ์ด์ฐ์ ์ธ treatment ์ ํจ๊ณผ๋ฅผ jointly ํ๊ฒ ์ถ์ ํ๋ค. ํด๋น ๋ชจ๋ธ์ confounding correlation ์ ํํฐ๋งํ๊ธฐ ์ํด ๊ด์ธก๋ ๊ณ ๊ฐ feature ์ flexible ํ ํจ์๋ฅผ ์ฌ์ฉํ๊ณ ๊ฐ effort ๊ฐ ๋งค์ถ์ ๋ฏธ์น๋ ์ธ๊ณผ์ ํจ๊ณผ๋ฅผ ์ ๊ณตํ๋ค.
โฏ ์ฝ๋ ์ค์ต
๋๊ธ