โฏ Causal representation learning
• ๋ณต์กํ ํ์ต ๋ชจ๋ธ์ ํน์ฑ์ ๋ํด ์ดํดํ๊ธฐ ์ํด ์ต๊ทผ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ์ธ๊ณผ์ถ๋ก ์ ๋ํ ๊ด์ฌ์ด ๋์์ง๊ณ ์๋ค.
• causality ๋ฅผ ํ์ฉํ๋ค๋ฉด ๊ด์ฐฐ๋ ์ํฉ๊ณผ ๋ค๋ฅธ ํ๊ฒฝ์์๋ robust ํ ์์ธก์ ํ ์ ์์ผ๋ฉฐ ๋ฐ์ดํฐ ์ฌ์ด์ ์ธ๊ณผ๊ด๊ณ๋ ํ์ ํ ์ ์๊ธฐ ๋๋ฌธ์ causality ๊ด์ ์ด ๋ฐ๋์ ํ์ํ๋ค. causality ๋ฅผ ํตํด ML ์ ํ๊ณ์ ์ ๊ทน๋ณตํ ์ ์๋ค.
• ๋ฅ๋ฌ๋ ์ฐฝ์์ ์์์ ๋ฒค์ง์ค๋ AI ๋ฅผ ๊ฐ๋ฐํ ๋ ์ธ์ง๋ฅ๋ ฅ์ ๋ํ๋ค๋ฉด ๋จธ์ ๋ฌ๋๊ณผ ๊ด๋ จ๋ ๋ฌธ์ ๋ค์ด ์ค๋ช ๊ฐ๋ฅํ๊ฒ ๋ ๊ฒ์ด๋ผ ์ ๋งํ๋ค. ์ฌ๋์ด ์์ํ๋ ์ธ์ง๋ฅ๋ ฅ์ ์คํํ ์ ์๋ ์๋ก์ด ํ์ต ๋ชจ๋ธ์ด ํ์ํ๋ค๋ฉฐ ์ธ๊ณผํ์ต์ ์ค์์ฑ์ ์ธ๊ธํ๋ค.
โฏ Causal machine learning in practice : Netflix
• ๋จธ์ ๋ฌ๋์ '๋ทํ๋ฆญ์ค๊ฐ ์ฝํ ์ธ ๋ฆฌ์คํธ์ D.P ๋์ ์ ์ค์ง์ด๊ฒ์์ ์๋จ์ ๋๋๋ค๋ฉด ์ด์ฉ์์ ์ฝํ ์ธ ์ด์ฉ์ ์ฆ๋์ํฌ ์ ์์๊น' ์ ๊ฐ์ "What if" ๋ฌธ์ ์ ๋ตํ์ง ๋ชปํ๋ค.
• ๋จธ์ ๋ฌ๋์์ ์ธ๊ณผ์ถ๋ก ์ ์ฅ์ ์ ์ฌ์ฉํ ์ ์์๊น
โช ๋ฐ์ดํฐ๋ก๋ถํฐ ์ธ๊ณผ๊ตฌ์กฐ๋ฅผ ๋ฐ๊ฒฌํ๊ณ , ์ด์ง์ ์ธ ์ฒ์นํจ๊ณผ๋ฅผ ์ถ์ ํ๊ธฐ ์ํ ๋ณต์กํ ํจ์๋ฅผ ํ์ตํ๋ค.
• ์ธ๊ณผํจ๊ณผ๋ฅผ ์ถ์ ํ๋ ๋ฐฉ๋ฒ
โช RCT (ATE) , Controlling confounders (CATE), IV (LATE)
• CATE estimation with ML
โช Meta-learning ์ CATE (conditional average treatment effect) estimation ์ ์ํout of the box ML model ์ ์ด์ฉํ๋ค.
โช Double/Orthogonalized learning ์ Propensity score ์ outcome model ์ ๊ฒฐํฉํ๋ค.
โช Tree-based model ์ CART/RF ์ node split ๊ธฐ์ค์ ๋ณ๊ฒฝํ๋ค.
โช Neural Net-based model ์ ๊ณต์ ๋ representation layer ๋ฅผ ๊ฐ์ง๊ณ control ๊ณผ treatment ์ ๋ํ ๊ฒฐ๊ณผ๋ฅผ ๋์์ ํ์ตํ๋ค.
• Causal ML tools
โช R : grf
โช Python
โธ do-calculus ์ ๊ธฐ๋ฐํ ์ธ๊ณผ๊ตฌ์กฐ๋ฅผ ๋์ถํด๋ผ ์ ์๋ ์ธํฐํ์ด์ค๋ฅผ ์ ๊ณต : Dowhy
โธ ML์ ๊ธฐ๋ฐํ CATE ์ถ์ ๋ฐฉ๋ฒ์ ์ ๊ณต : EconML
โธ ML์ ๊ธฐ๋ฐํ CATE ์ถ์ ๋ฐฉ๋ฒ์ ์ ๊ณต : Causal ML
โธ PySpark ์ H2O ๋ฅผ ๊ฐ์ง๊ณ modeling ์ ํจ์ผ๋ก์จ scalable ํ ๋ชจ๋ธ : upliftML
• Causal ML ์ค์ ์ฐ์ ์ ์ฉ case
โช Observational causal inference : ๊ณ ๊ฐ ๊ฐ์น ๋ณํ ๋ฐ์ ๋ถ์ ํ๋ก์ ํธ์์, ๊ต์ฐจ ํ๋งค ์ ํ (Cross-selling) ์ด ๊ธฐ์กด ์ฌ์ฉ์์ ์ฅ๊ธฐ์ ๊ฐ์น์ ๋ฏธ์น๋ ์ํฅ์ ์ธก์
โป Cross-selling : ๊ธฐ์ ์ ์ ํ๊ณผ ์๋น์ค ์ค ํ๋๋ฅผ ๊ตฌ๋งคํ ๊ณ ๊ฐ์๊ฒ ๊ทธ ๊ธฐ์ ์ด ์ ๊ณตํ๋ ๋ค๋ฅธ ์ ํ์ด๋ ์๋น์ค๋ฅผ ์ถ๊ฐ์ ์ผ๋ก ํ๋งคํ๋ ์ ๋ต์ ๋งํ๋ค. ๊ฐ๋ น ์์ด์ ์ธ ๋ฅผ ์ฐ ์ฌ๋์๊ฒ ์ด์ธ๋ฆฌ๋ ํ์ด๋ฅผ ์ ์ํ๋ ๊ฒฝ์ฐ๋ฅผ ๋งํ๋ค.
โช Targeting optimization : RTB Targeting Optimization ํ๋ก์ ํธ์์๋ ์ ๋ฆฌํํธ ๋ชจ๋ธ๋ง์ ์ฌ์ฉํ์ฌ ์ค๋๋ ฅ ์๋ ์ฌ์ฉ์ ๊ทธ๋ฃน (๊ด๊ณ ๋ ธ์ถ์๋ง ๋ฐ์ํ๋ ์ฌ์ฉ์) ์ ์ ํํ์ฌ ๊ด๊ณ ๋น์ฉ ์์ต๋ฅ ์ ์ต์ ํํ๋ค.
โช Personalization : ์ฐ๋ฆฌ๋ heterogeneous treatment effect ๋ฅผ ํ์ตํจ์ผ๋ก์จ ์ฌ์ฉ์์ ๋ ํจ๊ณผ์ ์ผ๋ก ๊ด๊ณ๋ฅผ ๋งบ์ ์ ์๋ค. ์๋ฅผ ๋ค์ด, ์์ฒญํ ์ฆ๋ถ ์ผ ์ถ์ฒ, ์ฌ์ ๊ณ ๊ฐ ์ง์ ์ ๊ณต ๋ฑ์ด ์๋ค.
โฏ Causal Inference: Question of Why
• AI ๋ ๋ฐ์ดํฐ์ ์๊ด๊ด๊ณ ํจํด์ ํ์ตํ๋ค. ์ธ๋ถํ๊ฒฝ์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ์ ๋ณํ๋ ํจํด ๋ณํ๊ฐ ์ ์ ๋ถ์ผ (NLP, vision, collaboration filtering) ์์๋ ์ฑ๋ฅ์ด ๋ฐ์ด๋๋ค. ๊ทธ๋ฌ๋ ๋ถ๋ฅ,์์ธก,์ถ์ฒ์ ๊ฒฐ๊ณผ๊ฐ ์ ๋์๋์ง์ ๋ํด์๋ ๊ถ๊ทน์ ์ผ๋ก ์ค๋ช ํ์ง ๋ชปํ๋ค.
• XAI ๋ก๋ ์ธ๊ณผ๊ด๊ณ๋ ์ ์ ์๋ค.
๋๊ธ