๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

์ธ๊ณผ์ถ”๋ก ์˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ - ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์ธ๊ณผ์ถ”๋ก 

by isdawell 2023. 6. 29.
728x90

 

 

 

 

๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”!

 

 

 

 

 

 

โ‘   Value of Causality 


 

•  ์ธ๊ณผ์„ฑ์€ actionable ํ•œ ์ „๋žต์„ ์ œ๊ณตํ•œ๋‹ค. ์ƒ๊ด€์„ฑ์€ action ์œผ๋กœ ์ด์–ด์ง€๊ธฐ๊ฐ€ ์–ด๋ ต๋‹ค (e.g. ์ดˆ์ฝœ๋ฆฟ ์†Œ๋น„๊ฐ€ ๋งŽ์„์ˆ˜๋ก ๋…ธ๋ฒจ์ƒ ์ˆ˜์ƒ์ž๊ฐ€ ๋งŽ๋‹ค๋Š” ์ƒ๊ด€๊ด€๊ณ„)

 

•  ๊ทธ๋Ÿฌ๋‚˜ ์‹ค์ œ๋กœ ์ธ๊ณผ์„ฑ์„ ๋„์ถœํ•ด๋‚ด๋Š” ๊ฒƒ์€ ๋งค์šฐ ์–ด๋ ค์›€ (Prediction ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€) 

โ†ช  ์‹ค์ œ ์„ธ์ƒ์€ ๋งค์šฐ ๋ณต์žกํ•˜๋ฉฐ dynamic ํ•œ system ์œผ๋กœ ๋™์ž‘ํ•œ๋‹ค. ํ•˜์ง€๋งŒ ๋ถ„์„์„ ํ•  ๋•Œ๋Š” ์ด๋Ÿฐ dynamic ํ•œ ํŠน์„ฑ์„ ์—†์• ๊ณ  static ํ•œ ๊ฐ€์ •์—์„œ ์ง„ํ–‰ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ด€์ ์ด ์ œํ•œ์ ์ผ ์ˆ˜ ์žˆ๋‹ค. 

 

•  ๋˜ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ์™„์ „ํ•˜์ง€ ์•Š๋‹ค. (imperfect and proxy - e.g. ํ–‰๋ณต์ง€์ˆ˜) 

 

•  ๋น„์ฆˆ๋‹ˆ์Šค๋Š” Causal law ๋ฅผ ์•Œ๊ณ ์žˆ๋‹ค๊ณ  ํ•ด๋„ ์ด๋ฅผ ์ ์šฉํ•˜๋Š” ๊ฒƒ์€ ์‰ฝ์ง€ ์•Š์„ ์ˆ˜ ์žˆ๋‹ค : different context, existence of unobserved exogeneous factors (e.g. ๊ฒฝ์Ÿ์‚ฌ) 

 

 

 

โ‡จ  ๋„๋ฉ”์ธ ์ง€์‹์ด๋‚˜ ์ด๋ก  ์—†์ด ML/DL ๋ชจ๋ธ์ด Causality ๋ฅผ ์ž๋™์œผ๋กœ ์ฐพ์•„์ค„ ์ˆ˜๋Š” ์—†๋‚˜? 

 

 

 

โ—ฏ ๊ฒฐ๋ก  

 

 

•  Pros : ๊ธฐ์กด์—๋Š” ์„ ํ˜• ๋ชจ๋ธ์„ ๊ฐ€์ •ํ–ˆ๋‹ค๋ฉด, ML/DL ์„ ์‚ฌ์šฉํ•˜๋ฉด ํ’๋ถ€ํ•œ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์„ ํ˜• ๋ชจ๋ธ ์ด์ƒ์œผ๋กœ ๋ณต์žกํ•œ feature space ๋ฅผ ๋ชจ๋ธ๋ง ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์  

 

•  Cons : ๋ฐ์ดํ„ฐ๊ฐ€ ๋ถˆ์™„์ „ํ•˜๋ฉด ํ•ด๊ฒฐ์ด ๋ถˆ๊ฐ€๋Šฅํ•˜๊ณ  ๋˜ํ•œ ๋„๋ฉ”์ธ ์ง€์‹์ด ๋ชจ๋ธ๋ง์— ์•„์˜ˆ ํ•„์š”ํ•˜์ง€ ์•Š์€ ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค. 

 

•  Usage : ๊ฐ€์žฅ ํšจ์œจ์ ์ธ ๋ฐฉ์‹์€ ์—ฌ์ „ํžˆ ์‹คํ—˜ ๋ฐฉ์‹์ด๋‹ค. (ํŽ˜์ด์Šค๋ถ์ด ์ œ์ผ ์ž˜ํ•จ) ํ˜„์—…์—์„œ๋Š” Agile ํ•œ A/B testing pipeline ์„ ๊ตฌ์ถ•ํ•˜๋Š”๋ฐ ์ตœ์„ ์„ ๋‹คํ•˜๊ณ  ์žˆ๋‹ค. 

 

 

 

 

 

โ—ฏ  Case Study

 

 

 

 

 

 

 

โ‘ก   Interpretability 


 

โ—ฏ  SHAP : ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ๊ฒฝ์šฐ์˜ ์ˆ˜๋ฅผ ๊ณ„์‚ฐ 

 

 

 

•  Local interpretability : ๊ฐ€๋ น ์‹œ๋ ฅ์„ ์˜ˆ์ธกํ•˜๋Š”๋ฐ ์žˆ์–ด์„œ, ์‚ฌ๋žŒ๋งˆ๋‹ค ์‹œ๋ ฅ ์˜ˆ์ธก์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ ๋ณ€์ˆ˜๋“ค์ด ๋‹ค๋ฆ„ 

 

 

 

 

 

โ—ฏ  Counterfactual 

 

•  SHAP provides the heterogeneity effect of each feature while controlling other feature values 

 

 

 

โ—ฏ  Confounding 

 

•  confounding feature ๋ฅผ ํ•ด๊ฒฐํ•˜์ง€ ๋ชปํ•˜๋ฉด ์ธ๊ณผํšจ๊ณผ๋ฅผ ์ž˜๋ชป ์˜ˆ์ธกํ•œ๋‹ค. 

 

 

 

 

 

 

 

 

 

 

 

 

 

728x90

๋Œ“๊ธ€