๐ ์ธ๊ณผ์ถ๋ก ๊ฐ์ธ ๊ณต๋ถ์ฉ ํฌ์คํธ ๊ธ์ ๋๋ค. ์ถ์ฒ๋ ์ฒจ๋ถํ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์ธ์!
• Econ ML : Microsoft EconML
• Causal Graph : Microsoft DoWhy
→ ๋ฉ๋ด์ผ์ ์ฝ๊ณ ๋ ผ๋ฌธ์ ์ฝ์ด๋ณด๋ ๊ฒ์ ์ถ์ฒ
• Multi-armed Bandits : ์จ๋ผ์ธ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ์ด ๊น๋ค๋กญ๊ณ ์ด๋ฅผ ํ ์ ์๋ ์ฝ๋ฉ ๋ฅ๋ ฅ์ด๋ฉด ํ๋ ์์ ๋ณ ์๋ฏธ ์์
โ ECON ML models (Potential outcomes)
• ์ธ๊ณผ ๊ด๊ณ/๊ตฌ์กฐ๋ฅผ ์ด๋ฏธ ์๊ณ ์๋ค๊ณ ๊ฐ์ ํ๋ค.
• ์ ๊ทผ ๋ฐฉ์์ ๊ฐ๊ธฐ ๋ค๋ฅด์ง๋ง, ๋น์ทํ ๋ชฉ์ ์ ๋ฌ์ฑํ๊ธฐ ์ํด ์กด์ฌํ๋ ๋ชจ๋ธ๋ค์ด๋ค. A/B testing ์ด ๋๋ ํ๊ฒฝ์์ EconML ์ ์ ์ฉํด๋ณด๋ฉด ์ข๋ค. (Same Goal, Different approach)
โฏ ML ๋ชจ๋ธ ๊ธฐ๋ฐ์ causal model ์ ์ฌ์ฉํ๋ ์ด์
• show better performance (with abundant data ๋ฐ์ดํฐ๊ฐ ํ๋ถํ ๋๋ง ์ฑ๋ฅ์ด ๋ ์ข๊ฒ ๋์ด)
• measure heterogeneity effects of treatment (CATE > ATE)
โช ์ฟ ํฐ ์ง๊ธ ์ฌ๋ถ์ ๋ฐ๋ฅธ ๋ ๊ทธ๋ฃน์ ํ๊ท ์ ์ธ ์ฐจ์ด : ATE
โช ML ์ด ๋ค์ด๊ฐ๋ฉด์ condition ์ด ๋ฐ๋ผ ๋ถ์ ์ ์์. (ํ์ณ์ ํ๊ท ๋ด๋ ๋ฐฉ์์ด ์๋๋ผ) ์ฌ๋์ ํน์ฑ๋ง๋ค effect ๊ฐ ๋ค๋ฅผ ์ ์๋ ๋ถ๋ถ๋ค์ ๋ฐ์ํ ์ ์์
• address high-dim and sparse data (e.g. lasso with Double ML)
• address flexible data forms (e.g. continuous treatment effects) : ์ด๋ฏธ์ง, ํ ์คํธ ๋ฐ์ดํฐ๋ก๋ถํฐ ์๋ก์ด feature ๋ฅผ ๋ฝ์ causal effect ๋ฅผ ์ถ์ ํ๋๋ฐ ์ฌ์ฉํ๋ค.
• have less restrictive assumptions (e.g. non-parametric)
โฏ ์ฌ๋ฌ ๋ชจ๋ธ๋ค์ ์กฐํฉํด์๋ ์ฌ์ฉํ ์ ์๋ค.
โฏ EconML ์ Motivating
• heterogeneity effects of treatment ๋ฅผ ํตํด effect ๊ฐ ๋น์ทํ ๋์๋ผ๋ฆฌ ๋ฌถ์ด์ Targeting, Segmentation, Personalization ๋ฑ ๋น์ฆ๋์ค task ๋ค์ ๋ค๋ฃฐ ์ ์๋ค.
โฏ EconML - Example : Uplift
• random ํ๊ฒ campaign ์ assign ํ๋ฉด loss ๊ฐ ๋ฐ์ํ๋ฏ๋ก highly effective ํ ์ ์ ๋ค์ ์ ํํ๋ ๊ฒ์ด ์ค์ํ๋ค.
• Potential ์ ๊ฐ๊น๊ฒ ํจ์จ์ ๋์ด์ = Uplift
• Uplift Process : A/B testing ์คํ → characteristics ์ ๋ฐ๋ฅธ heterogeneity effect ๋ฅผ ๊ฐ์ธ ๋ณ๋ก ๋ฝ์๋ → effect ๋ฅผ ranking ์์ผ๋ก ๋์ดํด์ ์์๋ถํฐ ์ ์ฉํด ๋์๊ฐ (์์ฐ์ ranking ์ด ๋์ ์ฌ๋๋ถํฐ ์ ์ฉํด ๋์๊ฐ๋ ๋ฐฉ์)
• Uplift ๋ฐฉ์์ ํตํด ์์ฐ์ ์ฌ์ฉํ ๋์๋ ๊ทธ๋ํ์์ 20%๋ง ์ฌ์ฉํ๋๋ฐ๋ Top quantile ranking ๋ฐฉ์์์ 40%์ ํจ๊ณผ๊ฐ ๋์ด, 40%์ ์์ฐ์ ์ผ๋๋ฐ 70%์ ํจ๊ณผ๊ฐ ๋์ด
โฏ EconML ๊ตฌํ ๋ฐฉ๋ฒ
• CATE ์์ ์ค์ํ ๊ฑด X (covariates - ex. demographic information)
• ๊ตฌํ ์์ฒด๋ ๋ฌธ์ ๊ฐ ๋์ง ์๋๋ค. ๊ฒฐ๊ตญ ๋ชจ๋ธ๋ง์ ์ํ Theory & Domain knowledge ๊ฐ ํ์์ด๋ค. ์ฆ ML/DL causal model ์ ์ฌ์ ํ manual design ์ด ํต์ฌ์ด๊ณ , ๋ฐ์ดํฐ๊ฐ ์ค์ํ๋ค. Unobserved important confounder ๊ฐ ์์ด์ผ ํ๋ค โจ A/B test ๋ฅผ ์ฌ๋ฌ๋ฒ ํด๋ณด๋ฉด์ Treatment ๋ฅผ ๋ฐ๊ฟ๋ณด๋ Agile ํ ๋ฐฉ์์ผ๋ก ์คํ์ ์งํํด๋ณด์! ์ค๋ฌด์์๋ ์คํ๋ฐ์ดํฐ+Uplift ๋ฅผ ๋จผ์ ์ ์ฉํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
โฏ ์ด๋ค ๋ชจ๋ธ์ ์ ํํด์ผ ํ ๊น
• ๋จธ์ ๋ฌ๋
• Econ ML model ๋ ๋จธ์ ๋ฌ๋๊ณผ ์ฒ ํ์ ๋ค๋ฅด์ง๋ง ํ๋ ์ผ์ ๊ฐ๋ค. ๋ฅ๋ฌ๋์ ๊ฒฝ์ฐ์๋ ์ ์๋๋์ง ์ค๋ช ์ ํ ์ ์๋ค. ์ฐ๋ฆฌ๋ ๋ค ๊ตฌํํด๋ณด๊ณ ๊ฐ์ฅ ์ ์๋ํ๋ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ฉด ๋๋ค. (cross validation)
• Application ์ value ์ impact ์ ๋ ์ด์ ์ ๋ง์ถ์!
โฏ ์๋ํ ๋ชจ๋ธ
• Google's Bayesian structural time series (a.k.a Causal Impact)
โช ๋ช ๋ฐฑํ ํจํด๋ง ์ก์ ์ ์๋ค๋ ๋จ์ ์ด ์กด์ฌํ๋ค. trend/seasonal/cyclical ํ obvious ํ ํจํด์ด ๋ณด์ด๋ ๊ฒฝ์ฐ์๋ง ์ ๋์ํ๋ค.
• Transfer Entropy : Multivariate TS features
โก Graph-Based causal models
• ๋ฒ ์ด์ง์ ๋คํธ์ํฌ๋ฅผ ๋ง๋ ์ฌ๋
• Bayesian Network can incorporate complex relationships : ๋ฐ์ดํฐ๊ฐ ํ๋ถํ๊ณ ๋ถ๋ช ํ ์ธ๊ณผ๊ด๊ณ๋ฅผ ๊ฐ์ง๊ณ ์์ผ๋ฉด ์ถ์ฒํ๋ ๋ฐฉ์
โช ๋์ฅ๊ณ ๋ฅผ ํ์๋ ๊ธฐ์ฌ๋ฅผ ๋ถ๋ฅด๋ฉด ์ธ๊ฑด๋น์ ์ํด ๋ง์ง์ด ์๋จ์. ์ฝ์ผํฐ์ ๋์ฅ๊ณ ๊ณ ์ฅ์ด ๋ฌ์ ๋ ๋ฉ๋ด์ผ์ causal relation ์ผ๋ก ๋ฃ์ด์ ์๋ดํ๋๋ก ํจ. ๊ธฐ์ฌ๊ฐ ํ์ ์์ด ์๋ฆฌ๊ฐ ๊ฐ๋ฅํ ์ผ์ด์ค๋ค์ ๋ง์ด ๋ฐ๊ตดํด ๋น์ฉ์ ์ ๊ฐํ ์ฌ๋ก
• Graph-based model ์ ์ฌํ๊ณผํ ๋ถ์ผ์ ์ ์ฉํ๊ธฐ๋ ์กฐ๊ธ ์ด๋ ต๋ค. ์ฃผ๋ก ๋ฐ์ดํฐ๊ฐ ๊น๋ํ๊ณ + ์ธ๊ณผ ๊ด๊ณ๊ฐ ๋ช ํํ ๊ฒฝ์ฐ์๋ง ์ ์ฉ์ด ๊ฐ๋ฅํ๋ค.
โข Multi-armed Bandits
• ๊ธฐ๋ณธ์ ๊ฐํํ์ต์ ์๋ค.
• Exploration (์ํด ๋ณธ ๊ฒ์ ํด๋ณด๋ ๊ฒ) and Exploitation (ํ์ฌ ์๊ณ ์๋ ๊ฒ์ ๋ ์ง์ค)
• MAB : ์ต์ํ์ ๋ ธ๋ ฅ์ผ๋ก ์ต๋ํ์ ๋ ธ๋ ฅ์, Exploration & Exploitation ์ ์ ์ ํ ์กฐํฉํด์ ๋ฌ์ฑํ ๊น
• MAB ๋ Advanced AB testing ์ด๋ค.
• Two naive approaches : (์์ exploration ๋ฐฉ์์ผ๋ก ์๋ํด๋ณด๋ ๊ฒ = Random), (์์ exploitation ๋ฐฉ์์ผ๋ก ์๋ํด๋ณด๋ ๊ฒ = Greedy)
• Epsilon greedy approach : ๋๋คํ๊ฒ exploit ์ explore ์ค์ ํ๋๋ฅผ ์ ํํ๋ ๋ฐฉ์์ผ๋ก ์์ด์ ์ ํํ๋ ๋ฐฉ์ (Epsilon ์ ๋น์จ๋ก)
• Sampling ์ ํ๋ ๋ฐฉ์์ด๋๊น Confidence interval ์ ํด๋๊ณ ์ ๋ขฐ๊ฐ ๋ค ์ ๋์ ์์ค์ด ์๋๋ฉด exploration ์ ๋ ํ์๋ ๋ฐฉ์ : UCB
• ํน์ ๋ถํฌ์์ sampling ์ ํด๋ณด์๋ ๋ฐฉ์ : Thompson Sampling
โช ์ข ๋ ์ ๋์ํ๋ ๋ฐฉ์์ด๋ผ baseline ์ผ๋ก ๋ง์ด ์ค์ ํจ
• ์ฑ๋๋ค์ covariate ์ ๋ฃ์ด์ ๊ณ ๋ คํ๋ ๋ฐฉ์ (CATE) : Contextual bandits
๋๊ธ