๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

์ธ๊ณผ์ถ”๋ก ์˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ - ML for Causal inference : ์ธ๊ณผ์ถ”๋ก  ๊ธฐ๋ฐ˜์˜ ์˜ˆ์ธก ๋ชจ๋ธ๋ง ํ‰๊ฐ€

by isdawell 2023. 6. 21.
728x90

 

 

๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”!

 

 

 

 

โ‘   Evaluating Recommendation algorithms in Netflix 


 

•  ์‹ค์ œ๋กœ ์‚ฐ์—… ํ˜„์žฅ์—์„  ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•œ Evaluation ์ด A/B test ๋กœ ์ด๋ฃจ์–ด์ง€๊ณ  ์žˆ๋‹ค. 

 

 

 

•  Test set ์—์„œ์˜ ํšจ๊ณผ๊ฐ€ ์‹ค์ œ ๋น„์ฆˆ๋‹ˆ์Šค ํ˜„์žฅ์— ์ ์šฉํ–ˆ์„ ๋•Œ๊นŒ์ง€ ๊ทธ๋Œ€๋กœ ๋‚˜ํƒ€๋‚˜๋ ค๋ฉด, ์‚ฌ๋žŒ๋“ค์ด ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•ด ์ด์ „๊ณผ ๋™์ผํ•œ ํ–‰๋™์–‘์ƒ์œผ๋กœ ๋Œ€์‘ํ•  ๊ฒƒ์ด๋ผ๋Š” ๊ฐ€์ •์ด ๋งŒ์กฑ๋˜์–ด์•ผ ํ•˜๋Š”๋ฐ, ์‹ค์ œ๋กœ๋Š” ๊ทธ๋ ‡์ง€ ์•Š๋‹ค. ๋”ฐ๋ผ์„œ Test set ์—์„œ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค ํ•˜๋”๋ผ๋„, ์‹ค์ œ๋กœ๋Š” performance ๊ฐ€ ๋‚˜์˜ค์ง€ ์•Š์„ ์ˆ˜ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ณผ๊ฑฐ ๋ฐ์ดํ„ฐ์—์„œ ofline experiment ๋ฅผ ํ•œ ํ›„์—, ๊ณผ๊ฑฐ์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์‚ฌ์ด์˜ A/B test ๋ฅผ ์ง„ํ–‰ํ•˜์—ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํšจ๊ณผ๋ฅผ ๊ฒ€์ฆํ•ด์•ผ ํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ํšจ๊ณผ๊ฐ€ ๊ฒ€์ฆ๋œ ํ›„์— ์‹ค์ œ ์„œ๋น„์Šค์— ์ ์šฉํ•œ๋‹ค. 

 

 

 

โ‘ก  Predictive models are also subject to selection bias 


 

•  ๋งŽ์€ ๊ฒฝ์šฐ ์˜ˆ์ธก๋ชจ๋ธ๋„ selection bias ๋กœ๋ถ€ํ„ฐ ์ž์œ ๋กญ์ง€ ์•Š๋‹ค. 

 

•  ํ˜„์‹ค์—์„œ ๋งŽ์€ ๋ฐ์ดํ„ฐ๋“ค์€ ์„ ํƒ๋œ outcome ๋งŒ ๊ด€์ฐฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋Œ€๋‹ค์ˆ˜๋‹ค = selection label 

 

โ—ฏ  ex. ์žฌ๋ฒ”์œจ ์˜ˆ์ธก 

 

 

โ†ช ํŒ์‚ฌ์— ์˜ํ•ด jail ๋œ ์‚ฌ๋žŒ๋“ค์— ๋Œ€ํ•ด์„œ๋Š” ์• ์ดˆ์— ์žฌ๋ฒ”์œจ์— ๋Œ€ํ•œ ๊ด€์ธก์ด ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค. release ๋œ ์‚ฌ๋žŒ๋“ค์„ ๋Œ€์ƒ์œผ๋กœ๋งŒ ์žฌ๋ฒ”์„ ํ–ˆ๋Š”์ง€์— ๋Œ€ํ•ด ์‚ดํŽด๋ณผ ์ˆ˜ ์žˆ๋Š” selective labels ๋ฐ์ดํ„ฐ๋งŒ ํ™œ์šฉ์ด ๊ฐ€๋Šฅํ•˜๋‹ค. 

 

 

โ†ช Bias ๋ฅผ ์—†์• ๋Š” ๊ฐ€์žฅ ์ข‹์€ ๋ฐฉ๋ฒ•์€ ์ผ๋‹จ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋žœ๋คํ•˜๊ฒŒ ๋ฒ•์› ๋ณ„๋กœ ์ ์šฉํ•ด๋ณด๊ณ  ํŒ์‚ฌ์˜ ํŒ๋‹จ๊ณผ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํŒ๋‹จ์„ ๋น„๊ตํ•ด๋ณด๋Š” ๊ฒƒ์ธ๋ฐ, ์ด๋Š” ์•„์ง ๊ฒ€์ฆ๋˜์ง€ ์•Š์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‹ค์ œ ์ ์šฉํ•˜๋Š” ์ธก๋ฉด์—์„œ ๋น„์œค๋ฆฌ์ ์ผ ์ˆ˜ ๋ฐ–์— ์—†๋‹ค. ๋”ฐ๋ผ์„œ ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์€ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ ๋ฟ์ด๋‹ค. ์•Œ๊ณ ๋ฆฌ์ฆ˜์—์„œ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•ด ์˜ˆ์ธกํ•˜๋Š”๋ฐ, ์ด ๋˜ํ•œ ํŒ์‚ฌ์˜ ํŒ๊ฒฐ๊ณผ ์ง์ ‘์ ์œผ๋กœ ๋น„๊ตํ•˜๊ธฐ๋Š” ์–ด๋ ต๋‹ค. ๋Œ€๋ถ€๋ถ„ ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ํšจ๊ณผ๊ฐ€ ํฌ๋‹ค๊ณ  ๋‚˜์˜ฌ ์ˆ˜ ๋ฐ–์— ์—†๋‹ค. 

 

 

โ†ช ํŒ์‚ฌ๋“ค์˜ ์„ฑํ–ฅ์— ๋”ฐ๋ผ ์„๋ฐฉ๋ฅ ์ด ๋‹ฌ๋ผ์ง„๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ•˜์˜€๊ณ , ์ข€ ๋” ์—„๊ฒฉํ•˜์ง€ ์•Š์€ ํŒ์‚ฌ๊ฐ€ ์„๋ฐฉํ•œ ๋น„์œจ์˜ 55% ์—์„œ 5%๋งŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์˜ˆ์ธก์„ ์ ์šฉํ•ด๋ด„ 

 

 

•  ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฐœ๋ฐœํ•  ๋•Œ, ์ปดํ“จํ„ฐ ์ƒ์—์„œ test set ์— ๋Œ€ํ•ด ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ๋„ ์ค‘์š”ํ•˜์ง€๋งŒ, ๊ทธ๊ฒƒ์„ ๋„˜์–ด์„œ ํ˜„์‹ค ๋ฌธ์ œ์— ์ ์šฉํ•˜๊ณ , ํ˜„์‹ค ์ƒํ™ฉ์—์„œ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š”๋ฐ ์žˆ์–ด์„œ selective labels ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๊ณ  ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— ์ด๋Ÿฌํ•œ predictive modeling ์— ์žˆ์–ด์„œ๋„ causal modeling ๊ด€์ ์ด ํ•„์š”ํ•˜๋‹ค. Research design ์ด predictive modeling ์—์„œ๋„ ์ค‘์š”ํ•˜๋‹ค. 

 

 

 

 

 

 

 

 

728x90

๋Œ“๊ธ€