๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

[industry] ์ธ๊ณผ์ถ”๋ก ์—์„œ ๋„๋ฉ”์ธ์˜ ์—ญํ• ๊ณผ ๊ต๋ž€๋ณ€์ˆ˜ ๋ณด์ •

by isdawell 2023. 6. 15.
728x90

 

 

์ถœ์ฒ˜

 

 

๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”!

 

 

 

 

โ‘  ๋„๋ฉ”์ธ๊ณผ ์ธ๊ณผ์ถ”๋ก  


 

โ—ฏ  ์ธ๊ณผ์ถ”๋ก ์€ ๋„๋ฉ”์ธ์— ์ƒ๋‹น ๋ถ€๋ถ„ ์˜์กดํ•˜๋Š” ๋ฐฉ๋ฒ•๋ก ์ด๋‹ค. Outcome ๊ณผ treatment ๊ทธ๋ฆฌ๊ณ  confounder (๊ต๋ž€๋ณ€์ˆ˜) ๋ฅผ ํŒŒ์•…ํ•˜๋Š”๋ฐ ์žˆ์–ด ๋„๋ฉ”์ธ ์ง€์‹์€ ํ•„์ˆ˜๋‹ค. 

 

 

 

โ—ฏ  data-driven ํ•˜๊ฒŒ ๋ณ€์ˆ˜ ๊ฐ„ ๊ทธ๋ž˜ํ”„ ๊ตฌ์กฐ๋ฅผ ์‹๋ณ„ํ•˜๊ธฐ ์œ„ํ•œ ์‹œ๋„๋กœ causal discovery ๋ผ๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๋ฐฉ๋ฒ•๋„ ์ œ์•ฝ์ด ์—†์œผ๋ฉด ์ž‘๋™ํ•˜๊ธฐ ์–ด๋ ต๊ณ , ๋ณ€์ˆ˜ ๊ฐ„์˜ ๋ชจ๋“  ์กฐํ•ฉ์„ ๊ณ ๋ คํ•˜๋Š” ๊ฒƒ์€ ๊ณ„์‚ฐ๋Ÿ‰์ด ๋„ˆ๋ฌด ๋งŽ๋‹ค. 

 

โ—ฏ  ์ธ๊ณผ์ถ”๋ก  : ์‹คํ—˜/์ฒ˜์น˜/ํ–‰๋™/์ •์ฑ…์ด ๊ฐ€์ ธ์˜จ ํšจ๊ณผ๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ๋ถ„์„ → ๋ณ€์ˆ˜๋“ค ๊ฐ„์˜ ๋ชจ๋“  ๊ด€๊ณ„๋ฅผ ์•Œ ํ•„์š”๋Š” ์—†๋‹ค. treatment ๋ฅผ ์ถ”์ •ํ•  ๋•Œ ๊ต๋ž€๋ณ€์ˆ˜๋ฅผ ๋ณด์ • (๋ชจํ˜•์— ์ถ”๊ฐ€) ํ–ˆ๋‹ค๋Š” ์‚ฌ์‹ค์ด ์ค‘์š”ํ•˜๋‹ค. ๋ณ€์ˆ˜๋“ค ๊ฐ„์˜ ๊ด€๊ณ„ ์ž์ฒด๋Š” bias ์— ์˜ํ–ฅ์„ ๋ฏธ์น˜์ง€ ์•Š๋Š”๋‹ค. 

 

 

 

 

 

โ‘ก  ๋ชจํ˜• ๊ธฐ๋ฐ˜์˜ ๊ต๋ž€๋ณ€์ˆ˜ ๋ณด์ • 


 

โ—ฏ  ๋ชจํ˜•์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ต๋ž€๋ณ€์ˆ˜ (์ฒ˜์น˜์™€ ๊ฒฐ๊ณผ ๋™์‹œ์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ๋ณ€์ˆ˜) ๋ฅผ ๋ณด์ •ํ•˜๋ ค๋ฉด, ์ž ์žฌ์  ๊ต๋ž€๋ณ€์ˆ˜์˜ ๋Œ€์ƒ์€ ํ•œ์ •ํ•ด์ฃผ์–ด์•ผ ํ•œ๋‹ค. ๋ณ€์ˆ˜๋“ค ๊ฐ„์˜ ์‹œ๊ฐ„์  ์„ ํ›„๊ด€๊ณ„๋ฅผ ํ†ตํ•ด Pre-treatment covariate ๋งŒ ๊ฑธ๋Ÿฌ ๋‚จ๊ฒจ์ฃผ์–ด์•ผ ํ•œ๋‹ค. 

 

โ—ฏ  ๊ต๋ž€๋ณ€์ˆ˜๋Š” ์ฒ˜์น˜์™€ ๊ฒฐ๊ณผ์— ๋ชจ๋‘ ์˜ํ–ฅ์„ ์ฃผ๋Š” ๋ณ€์ˆ˜์ด๊ธฐ ๋•Œ๋ฌธ์— Outcome Y ์— ๋Œ€ํ•œ ๋ชจํ˜• (ex. Lasso ํšŒ๊ท€๋ชจํ˜•) ๋ฟ ์•„๋‹ˆ๋ผ, Treatment ์— ๋Œ€ํ•œ ๋ชจํ˜•๋„ ๊ณ ๋ คํ•ด์ฃผ์–ด์•ผ ํ•œ๋‹ค. ๊ฒฐ๊ณผ์™€ ์ฒ˜์น˜์— ๋Œ€ํ•œ ๋ชจํ˜•์„ ๋™์‹œ์— ์ ํ•ฉํ•œ๋‹ค. 

 

 

 

 

โ‘ข  ํŠธ๋ฆฌ ๋ชจํ˜• ๊ธฐ๋ฐ˜์˜ ๊ต๋ž€๋ณ€์ˆ˜ ๋ณด์ • 


 

โ—ฏ  ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ๊ต๋ž€๋ณ€์ˆ˜ ๋ณด์ • ๋ชจํ˜•์€ ์ธ๊ณผํšจ๊ณผ์— ๋Œ€ํ•œ ์ถ”์ •์€ ์ •๋ฐ€ํ•˜๊ฒŒ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ์–ด๋–ค ๋ณ€์ˆ˜๊ฐ€ ๊ต๋ž€๋ณ€์ˆ˜๋กœ ์ž‘๋™ํ•˜๋Š”์ง€๋Š” ์•Œ ์ˆ˜ ์—†๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ BART (๋ฒ ์ด์ง€์•ˆ ํŠธ๋ฆฌ ์•™์ƒ๋ธ” ๋ชจํ˜•) (Kim et al., 2023) ์„ ์‚ฌ์šฉํ•˜๋ฉด ์ •ํ™•ํ•œ ํšจ๊ณผ ์ถ”์ •, ๊ต๋ž€๋ณ€์ˆ˜์ผ ํ™•๋ฅ ๊นŒ์ง€ ๋™์‹œ์— ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅํ•˜๋‹ค. 

 

โ—ฏ  BART ๋Š” treatment ์— ๋Œ€ํ•œ ๋ชจํ˜•๊ณผ outcome ์—์„œ ๋‚˜๋ฌด ๋ถ„๊ธฐ์— ๋™์‹œ์— ์‚ฌ์šฉ๋˜๋Š” ๋ณ€์ˆ˜๋“ค์— ๋” ํฐ ๊ฐ€์ค‘์น˜๋ฅผ ์ฃผ์–ด ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ด๋กœ์จ ๊ต๋ž€๋ณ€์ˆ˜๊ฐ€ ์•„๋‹Œ ๋ณ€์ˆ˜๋“ค์€ ์ตœ์ข… ๋ชจํ˜•์— ์ „ํ˜€ ํฌํ•จ๋˜์ง€ ์•Š๊ณ , ๊ต๋ž€๋ณ€์ˆ˜ ํ˜น์€ outcome ์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ๋ณ€์ˆ˜๋งŒ ์„ ํƒ๋˜์–ด ์ •ํ™•ํ•œ ์ธ๊ณผํšจ๊ณผ ์ถ”์ •์ด ๊ฐ€๋Šฅํ•˜๋‹ค. 

 

 

 

 

 

 

 

โ‘ฃ  ๋‰ด๋Ÿด๋„ท ๊ธฐ๋ฐ˜์˜ ๊ต๋ž€๋ณ€์ˆ˜ ๋ณด์ • 


 

โ—ฏ  ๋Œ€ํ‘œ์ ์ธ ๋ชจํ˜•์œผ๋กœ Draggonet (Shi et al., 2019) ์ด ์žˆ๋‹ค. ์ž ์žฌ์  ๊ต๋ž€๋ณ€์ˆ˜ X๋“ค๋กœ ๋„คํŠธ์›Œํฌ๋ฅผ ๊ฑฐ์ณ treatment ์— ๋Œ€ํ•œ ์˜ˆ์ธก์„ ์ˆ˜ํ–‰ํ•˜๊ณ , ๋งŒ๋“ค์–ด์ง„ ๊ฐ€์ค‘์น˜๋“ค๋กœ ๋‹ค์‹œ Potential outcome ์„ ์˜ˆ์ธกํ•˜๋Š” ๋ชจํ˜•์ด๋‹ค. ๋ฐ์ดํ„ฐ ์ˆ˜๊ฐ€ ์ ์€ ๊ฒฝ์šฐ์—๋Š” ์ข‹์€ ์„ฑ๋Šฅ์„ ๊ณ ๋ คํ•˜๊ธฐ ์–ด๋ ค์šธ ์ˆ˜ ์žˆ๋‹ค. ๊ด€์ธก์น˜ n ์˜ ๊ฐœ์ˆ˜๊ฐ€ ์ถฉ๋ถ„ํ•˜๋ฉด์„œ ์ž ์žฌ์  ๊ต๋ž€๋ณ€์ˆ˜์˜ ๊ฐœ์ˆ˜ p ๊ฐ€ ๋งŽ์€ ๊ฒฝ์šฐ ์‚ฌ์šฉํ•˜๋ฉด ์ข‹๋‹ค. 

 

 

 

 

 

 

  • Shi, C., Blei, D., adn Veitch, V. Adapting neural networks for the estimation of treatment effects. In Advances in Neural Information Processing Systems (2019).
  • ์ฝ”๋“œ

 

 

 

 

โ‘ค  BART, ๋ฒ ์ด์ง€์•ˆ ํŠธ๋ฆฌ ์•™์ƒ๋ธ” ๋ชจ๋ธ๋ง 


 

์ถœ์ฒ˜

 

โ—ฏ  Bayesian additive regression trees : ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ์™€ ๋ถ€์ŠคํŒ… ๊ฐ™์€ ํŠธ๋ฆฌ ์•™์ƒ๋ธ” ๋ชจํ˜•์— ๋Œ€ํ•œ ๋ฒ ์ด์ง€์•ˆ ๋ฒ„์ „์ด๋‹ค. 

 

โ—ฏ  ํŠธ๋ฆฌ๋ชจํ˜•์˜ ๋ถ„์‚ฐ (์˜ˆ์ธก์˜ ๋ถˆํ™•์‹ค์„ฑ) ์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๋‹ค๋ฃจ๊ธฐ ์œ„ํ•ด ๋ฒ ์ด์ง€์•ˆ์„ ๋„์ž…ํ•œ๋‹ค. ๋ชจ๋“  ๊ณผ์ •์ด deterministic ํ–ˆ๋˜ ํŠธ๋ฆฌ ๋ชจํ˜•๊ณผ ๋‹ฌ๋ฆฌ ๋ฒ ์ด์ง€์•ˆ ํŠธ๋ฆฌ ๋ชจํ˜•์€ ๋ชจ๋“  ๊ฒฐ์ •์ด stochastic ํ•˜๋‹ค. tree ๊ฐ€ ๊นŠ์–ด์ง€๋ฉด์„œ ๋” ๋ถ„๊ธฐํ• ์ง€์— ๋Œ€ํ•ด ํ™•๋ฅ ์ ์œผ๋กœ ์„ ํƒํ•˜๊ณ , ๋‚˜๋ฌด๊ฐ€ ๊นŠ์–ด์งˆ์ˆ˜๋ก ํ•ด๋‹น ๋…ธ๋“œ์—์„œ ๋ถ„๊ธฐํ•  ํ™•๋ฅ ์„ ๋‚ฎ์ถฐ์ฃผ๋Š” ๋ฐฉ์‹์œผ๋กœ ์ž‘๋™ํ•œ๋‹ค. 

 

 

 

โ—ฏ  ๋˜ํ•œ ์˜ˆ์ธก๊ฐ’์„ ์–ป๋Š” ๊ฒƒ์—๋„ ์žˆ์–ด ๊ธฐ์กด ํŠธ๋ฆฌ๋ชจํ˜•์€ y ๊ฐ’๋“ค์˜ ํ‰๊ท ์„ ์˜ˆ์ธก๊ฐ’์œผ๋กœ ์‚ฌ์šฉํ•œ ๋ฐ˜๋ฉด, ๋ฒ ์ด์ง€์•ˆ ํŠธ๋ฆฌ ๋ชจํ˜•์€ y ๊ฐ’๋“ค์˜ ํ‰๊ท ์„ ์ค‘์‹ฌ์œผ๋กœ ๋‘๋Š” ์ •๊ทœ๋ถ„ํฌ์—์„œ ์ƒ˜ํ”Œ๋ง์„ ์ง„ํ–‰ํ•˜์—ฌ ์ด๋ฅผ ํ†ตํ•ด ์–ป์–ด์ง„ ๊ฐ’์„ ์˜ˆ์ธก๊ฐ’์œผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ๋˜ํ•œ MCMC ๊ณผ์ •์„ ํ†ตํ•ด ์‚ฌํ›„๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๋Š” ์ƒ˜ํ”Œ์„ ์–ป๊ฒŒ ๋˜๋Š”๋ฐ, MCMC ๊ณผ์ •๋งˆ๋‹ค ํŠธ๋ฆฌ๋ฅผ ์ถ”๊ฐ€์ ์œผ๋กœ ๋ถ„๊ธฐํ• ์ง€, ๊ฐ€์ง€์น˜๊ธฐ๋ฅผ ์‹œํ–‰ํ• ์ง€, ๋ถ„๊ธฐ ๊ธฐ์ค€ ๋ณ€์ˆ˜๋ฅผ ๋ณ€๊ฒฝํ•  ์ง€ ํ™•๋ฅ ์ ์œผ๋กœ ์„ ํƒํ•œ๋‹ค. 

 

โ€ป MCMC

 

 

โ—ฏ  BART ์˜ ๊ฐ tree ๋Š” ๋„ˆ๋ฌด ๊นŠ์ด ๋ถ„๊ธฐํ•˜์ง€ ์•Š๋Š”๋‹ค. ๋˜ํ•œ tree ์˜ ๊ฐœ์ˆ˜๊ฐ€ ์ปค์งˆ์ˆ˜๋ก ๊ฐ ๋‚˜๋ฌด์˜ ์˜ํ–ฅ๋ ฅ์ด ๋” ์•ฝํ•ด์ง€๋„๋ก ํ†ต์ œํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅํ•˜๋‹ค. 

 

โ—ฏ  ํ™•๋ฅ ์ ์ธ ํŠธ๋ฆฌ๋ฅผ ์•™์ƒ๋ธ”ํ•จ์œผ๋กœ์จ ์˜ˆ์ธก์˜ ๋ถˆํ™•์‹ค์„ฑ์„ ๊ณ„๋Ÿ‰ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์ด ์ค‘์š”ํ•˜๋‹ค. 

 

 

 

 

โ—ฏ  ์ตœ๊ทผ ๊ด€์ฐฐ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ธ๊ณผ์ถ”๋ก ์— BART ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ๋“ค์ด ๋งŽ์•„์กŒ๋‹ค. 

 

 

 

 

 

728x90

๋Œ“๊ธ€