๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

[Causal ML] ๊ฐ•์—ฐ์ž๋ฃŒ ์ •๋ฆฌ

by isdawell 2023. 5. 6.
728x90

 

 

โ—ฏ  Causal representation learning 


 

์ถœ์ฒ˜ 

 

•  ๋ณต์žกํ•œ ํ•™์Šต ๋ชจ๋ธ์˜ ํŠน์„ฑ์— ๋Œ€ํ•ด ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด ์ตœ๊ทผ ๋”ฅ๋Ÿฌ๋‹ ๋ถ„์•ผ์—์„œ ์ธ๊ณผ์ถ”๋ก ์— ๋Œ€ํ•œ ๊ด€์‹ฌ์ด ๋†’์•„์ง€๊ณ  ์žˆ๋‹ค. 

•  causality ๋ฅผ ํ™œ์šฉํ•œ๋‹ค๋ฉด ๊ด€์ฐฐ๋œ ์ƒํ™ฉ๊ณผ ๋‹ค๋ฅธ ํ™˜๊ฒฝ์—์„œ๋„ robust ํ•œ ์˜ˆ์ธก์„ ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์˜ ์ธ๊ณผ๊ด€๊ณ„๋„ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— causality ๊ด€์ ์ด ๋ฐ˜๋“œ์‹œ ํ•„์š”ํ•˜๋‹ค. causality ๋ฅผ ํ†ตํ•ด ML ์˜ ํ•œ๊ณ„์ ์„ ๊ทน๋ณตํ•  ์ˆ˜ ์žˆ๋‹ค. 

•  ๋”ฅ๋Ÿฌ๋‹ ์ฐฝ์‹œ์ž ์š”์Šˆ์•„ ๋ฒค์ง€์˜ค๋Š” AI ๋ฅผ ๊ฐœ๋ฐœํ•  ๋•Œ ์ธ์ง€๋Šฅ๋ ฅ์„ ๋”ํ•œ๋‹ค๋ฉด ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๊ด€๋ จ๋œ ๋ฌธ์ œ๋“ค์ด ์„ค๋ช… ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋  ๊ฒƒ์ด๋ผ ์ „๋งํ–ˆ๋‹ค. ์‚ฌ๋žŒ์ด ์˜์‹ํ•˜๋Š” ์ธ์ง€๋Šฅ๋ ฅ์„ ์‹คํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ์ƒˆ๋กœ์šด ํ•™์Šต ๋ชจ๋ธ์ด ํ•„์š”ํ•˜๋‹ค๋ฉฐ ์ธ๊ณผํ•™์Šต์˜ ์ค‘์š”์„ฑ์„ ์–ธ๊ธ‰ํ–ˆ๋‹ค. 

 

 

 

 

 

 

โ—ฏ Causal machine learning in practice : Netflix 


 

์„œ์šธ๋Œ€๊ฐ•์—ฐ

 

•  ๋จธ์‹ ๋Ÿฌ๋‹์€ '๋„ทํ”Œ๋ฆญ์Šค๊ฐ€ ์ฝ˜ํ…์ธ  ๋ฆฌ์ŠคํŠธ์— D.P ๋Œ€์‹ ์— ์˜ค์ง•์–ด๊ฒŒ์ž„์„ ์ƒ๋‹จ์— ๋†“๋Š”๋‹ค๋ฉด ์ด์šฉ์ž์˜ ์ฝ˜ํ…์ธ  ์ด์šฉ์„ ์ฆ๋Œ€์‹œํ‚ฌ ์ˆ˜ ์žˆ์„๊นŒ' ์™€ ๊ฐ™์€ "What if" ๋ฌธ์ œ์— ๋‹ตํ•˜์ง€ ๋ชปํ•œ๋‹ค. 

 

•  ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ์ธ๊ณผ์ถ”๋ก ์˜ ์žฅ์ ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์„๊นŒ

โ†ช ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์ธ๊ณผ๊ตฌ์กฐ๋ฅผ ๋ฐœ๊ฒฌํ•˜๊ณ , ์ด์งˆ์ ์ธ ์ฒ˜์น˜ํšจ๊ณผ๋ฅผ ์ถ”์ •ํ•˜๊ธฐ ์œ„ํ•œ ๋ณต์žกํ•œ ํ•จ์ˆ˜๋ฅผ ํ•™์Šตํ•œ๋‹ค. 

 

 

 

•  ์ธ๊ณผํšจ๊ณผ๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ• 

โ†ช RCT (ATE) , Controlling confounders (CATE), IV (LATE) 

 

 

 

 

•  CATE estimation with ML 

 

โ†ช Meta-learning ์€ CATE (conditional average treatment effect) estimation ์„ ์œ„ํ•œout of the box  ML model ์„ ์ด์šฉํ•œ๋‹ค. 

โ†ช Double/Orthogonalized learning ์€ Propensity score ์™€ outcome model ์„ ๊ฒฐํ•ฉํ•œ๋‹ค. 

โ†ช Tree-based model ์€ CART/RF ์˜ node split ๊ธฐ์ค€์„ ๋ณ€๊ฒฝํ•œ๋‹ค. 

โ†ช Neural Net-based model ์€ ๊ณต์œ ๋œ representation layer ๋ฅผ ๊ฐ€์ง€๊ณ  control ๊ณผ treatment ์— ๋Œ€ํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋™์‹œ์— ํ•™์Šตํ•œ๋‹ค. 

 

 

 

 

•  Causal ML tools 

 

โ†ช Rgrf 

 

โ†ช Python 

     โ–ธ do-calculus ์— ๊ธฐ๋ฐ˜ํ•œ ์ธ๊ณผ๊ตฌ์กฐ๋ฅผ ๋„์ถœํ•ด๋‚ผ ์ˆ˜ ์žˆ๋Š” ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ์ œ๊ณต :  Dowhy

     โ–ธ ML์— ๊ธฐ๋ฐ˜ํ•œ CATE ์ถ”์ • ๋ฐฉ๋ฒ•์„ ์ œ๊ณต : EconML

     โ–ธ ML์— ๊ธฐ๋ฐ˜ํ•œ CATE ์ถ”์ • ๋ฐฉ๋ฒ•์„ ์ œ๊ณต : Causal ML 

 

causal ML ํŒจํ‚ค์ง€ ํ™œ์šฉ ์˜ˆ์‹œ

 

 

   โ–ธ PySpark ์™€ H2O ๋ฅผ ๊ฐ€์ง€๊ณ  modeling ์„ ํ•จ์œผ๋กœ์จ scalable ํ•œ ๋ชจ๋ธ : upliftML 

 

 

 

 

 

 

•  Causal ML ์‹ค์ œ ์‚ฐ์—… ์ ์šฉ case 

 

โ†ช Observational causal inference : ๊ณ ๊ฐ ๊ฐ€์น˜ ๋ณ€ํ™” ๋ฐœ์ƒ ๋ถ„์„ ํ”„๋กœ์ ํŠธ์—์„œ, ๊ต์ฐจ ํŒ๋งค ์ „ํ™˜ (Cross-selling) ์ด ๊ธฐ์กด ์‚ฌ์šฉ์ž์˜ ์žฅ๊ธฐ์  ๊ฐ€์น˜์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์ธก์ •

 

 

โ€ป Cross-selling : ๊ธฐ์—…์˜ ์ œํ’ˆ๊ณผ ์„œ๋น„์Šค ์ค‘ ํ•˜๋‚˜๋ฅผ ๊ตฌ๋งคํ•œ ๊ณ ๊ฐ์—๊ฒŒ ๊ทธ ๊ธฐ์—…์ด ์ œ๊ณตํ•˜๋Š” ๋‹ค๋ฅธ ์ œํ’ˆ์ด๋‚˜ ์„œ๋น„์Šค๋ฅผ ์ถ”๊ฐ€์ ์œผ๋กœ ํŒ๋งคํ•˜๋Š” ์ „๋žต์„ ๋งํ•œ๋‹ค. ๊ฐ€๋ น ์™€์ด์…”์ธ ๋ฅผ ์‚ฐ ์‚ฌ๋žŒ์—๊ฒŒ ์–ด์šธ๋ฆฌ๋Š” ํƒ€์ด๋ฅผ ์ œ์•ˆํ•˜๋Š” ๊ฒฝ์šฐ๋ฅผ ๋งํ•œ๋‹ค. 

 

 

โ†ช Targeting optimization : RTB Targeting Optimization ํ”„๋กœ์ ํŠธ์—์„œ๋Š” ์—…๋ฆฌํ”„ํŠธ ๋ชจ๋ธ๋ง์„ ์‚ฌ์šฉํ•˜์—ฌ ์„ค๋“๋ ฅ ์žˆ๋Š” ์‚ฌ์šฉ์ž ๊ทธ๋ฃน (๊ด‘๊ณ ๋…ธ์ถœ์—๋งŒ ๋ฐ˜์‘ํ•˜๋Š” ์‚ฌ์šฉ์ž) ์„ ์„ ํƒํ•˜์—ฌ ๊ด‘๊ณ  ๋น„์šฉ ์ˆ˜์ต๋ฅ ์„ ์ตœ์ ํ™”ํ–ˆ๋‹ค. 

 

 

 

โ†ช Personalization : ์šฐ๋ฆฌ๋Š” heterogeneous treatment effect ๋ฅผ ํ•™์Šตํ•จ์œผ๋กœ์จ ์‚ฌ์šฉ์ž์™€ ๋” ํšจ๊ณผ์ ์œผ๋กœ ๊ด€๊ณ„๋ฅผ ๋งบ์„ ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์‹œ์ฒญํ•  ์ฆ๋ถ„ ์‡ผ ์ถ”์ฒœ, ์‚ฌ์ „ ๊ณ ๊ฐ ์ง€์› ์ œ๊ณต ๋“ฑ์ด ์žˆ๋‹ค. 

 

 

 

 

 

 

โ—ฏ Causal Inference: Question of Why


 

๊ณ ๋ ค๋Œ€ ์‚ฐ๊ณต ์„ธ๋ฏธ๋‚˜ 

 

 

•  AI ๋Š” ๋ฐ์ดํ„ฐ์˜ ์ƒ๊ด€๊ด€๊ณ„ ํŒจํ„ด์„ ํ•™์Šตํ•œ๋‹ค. ์™ธ๋ถ€ํ™˜๊ฒฝ์— ๋”ฐ๋ฅธ ๋ฐ์ดํ„ฐ์˜ ๋ณ€ํ™”๋‚˜ ํŒจํ„ด ๋ณ€ํ™”๊ฐ€ ์ ์€ ๋ถ„์•ผ (NLP, vision, collaboration filtering) ์—์„œ๋Š” ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚˜๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋ถ„๋ฅ˜,์˜ˆ์ธก,์ถ”์ฒœ์˜ ๊ฒฐ๊ณผ๊ฐ€ ์™œ ๋‚˜์™”๋Š”์ง€์— ๋Œ€ํ•ด์„œ๋Š” ๊ถ๊ทน์ ์œผ๋กœ ์„ค๋ช…ํ•˜์ง€ ๋ชปํ•œ๋‹ค. 

 

•  XAI ๋กœ๋„ ์ธ๊ณผ๊ด€๊ณ„๋Š” ์•Œ ์ˆ˜ ์—†๋‹ค. 

 

 

 

 

 

 

 

 

 

 

 

 

 

728x90

๋Œ“๊ธ€