๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
2๏ธโƒฃ Study/๐Ÿ“‘ ๋…ผ๋ฌธ์ฝ๊ธฐ

[Causal Forest] ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ์ธ๊ณผ ํฌ๋ ˆ์ŠคํŠธ ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•œ ์ฒ˜์น˜ํšจ๊ณผ ๊ฒ€์ฆ: ๊ต๋‚ด ๋™์•„๋ฆฌํ™œ๋™ ์ฐธ์—ฌ๊ฐ€ ํ˜‘์—…๋Šฅ๋ ฅ์— ๋ฏธ์น˜๋Š” ํšจ๊ณผ๋ฅผ ์ค‘์‹ฌ์œผ๋กœ

by isdawell 2024. 1. 23.
728x90

 

 

โ—  [Research Topic]  โ— 

 

 โˆ˜  Causal Forest ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•ด ์ฒ˜์น˜ํšจ๊ณผ๋ฅผ ๊ฒ€์ฆ 

 โˆ˜  ๊ต๋‚ด ๋™์•„๋ฆฌ ํ™œ๋™ ์ฐธ์—ฌ๊ฐ€ ํ˜‘์—… ๋Šฅ๋ ฅ์— ๋ฏธ์น˜๋Š” ํšจ๊ณผ ๋ถ„์„ : ๋™์•„๋ฆฌ ํ™œ๋™์ด ํ˜‘์—…๋Šฅ๋ ฅ์— ๋ฏธ์น˜๋Š” ํ‰๊ท  ์ฒ˜์น˜ํšจ๊ณผ (ATE) ๋ฅผ ์ถ”์ •ํ•จ๊ณผ ๋™์‹œ์— ์„ฑ๋ณ„, ๋˜๋ž˜๊ด€๊ณ„, ๊ต์‚ฌ๊ด€๊ณ„์— ๋”ฐ๋ผ ๋™์•„๋ฆฌํ™œ๋™์˜ ํšจ๊ณผ๊ฐ€ ๋‹ค๋ฅด๊ฒŒ ๋‚˜ํƒ€๋‚˜๋Š”์ง€ (Heterogeneous treatment effects) ๋„ ํƒ์ƒ‰ 

 

 

 

 

โ—  [Introduction]  โ— 

 

โ‘ด ๊ธฐ์กด ์—ฐ๊ตฌ ๋ฐฉ์‹

 

 โˆ˜  ์ฒ˜์น˜๋“ค์— ๋Œ€ํ•œ ํšจ๊ณผ๋ฅผ Randomized experiments ํ˜น์€ Observational data ๋ฅผ ์ด์šฉํ•ด ๊ฒ€์ฆํ•˜๋ ค๋Š” ๋…ธ๋ ฅ์ด ์ด๋ฃจ์–ด์ง€๊ณ  ์žˆ๋‹ค. Randomized experiments ๋Š” ์—ฐ๊ตฌ์ž๊ฐ€ ์ฒ˜์น˜ ํ• ๋‹น์„ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ฐธ์—ฌ์ž์— ์˜ํ•œ Selection bias ๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š”๋‹ค.

 

๊ทธ๋Ÿฌ๋‚˜ Observational data๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ ์—ฐ๊ตฌ์ž ์ด์™ธ์˜ ๋‹ค๋ฅธ ์š”์†Œ๋“ค๋กœ ์ธํ•ด ์ฒ˜์น˜๊ฐ€ ๊ฒฐ์ •๋˜๋ฏ€๋กœ ์„ ํƒํŽธ์˜ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. ์ด๋ฅผ ์—†์• ๊ธฐ ์œ„ํ•œ ์—ฌ๋Ÿฌ ํ†ต๊ณ„์  ๋ฐฉ๋ฒ•๋“ค์ด ์‚ฌ์šฉ๋˜๊ณ  ์žˆ์œผ๋ฉฐ, ๊ทธ์ค‘ ๊ฐ€์žฅ ๋งŽ์ด ์‚ฌ์šฉ๋˜๋Š” ๊ฒƒ์ด Propensity Score ๋‹ค. ๊ฐœ๊ฐœ์ธ์ด ์ฒ˜์น˜๋ฅผ ๋ฐ›์„ ์กฐ๊ฑด์  ํ™•๋ฅ ์„ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ์ด๋ถ„ํ˜• ์ฒ˜์น˜๋ณ€์ˆ˜๋ผ๋ฉด ์ผ๋ฐ˜์ ์œผ๋กœ ๋กœ์ง€์Šคํ‹ฑ ๋ชจํ˜•์„ ์‚ฌ์šฉํ•ด ๊ฒฝํ–ฅ ์ ์ˆ˜๋ฅผ ์ถ”์ •ํ•œ๋‹ค. 

 

 

โ‘ต ๋จธ์‹ ๋Ÿฌ๋‹ ๋„์ž…์ด ํ•„์š”ํ•œ ์ด์œ 

 

 โˆ˜  ์—ฐ๊ตฌ์ž๊ฐ€ ์‚ฌ์ „์ง€์‹์„ ๋ฐ”ํƒ•์œผ๋กœ ๊ณต๋ณ€์ธ๋“ค๊ณผ ์ฒ˜์น˜๋ณ€์ˆ˜์˜ ๊ด€๊ณ„๋ฅผ ์ง์ ‘ ๋ชจํ˜•์—์„œ ์„ค์ •ํ•˜๊ณ , ์„ค์ •๋œ ๋ชจํ˜•์„ ๋ฐ”ํƒ•์œผ๋กœ ๊ฒฝํ–ฅ์ ์ˆ˜ ๋ฐ ์ฒ˜์น˜ํšจ๊ณผ๋ฅผ ์ถ”์ •ํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜, ์‚ฌ์ „ ์ง€์‹๋งŒ์œผ๋กœ ๋ณ€์ˆ˜๋“ค ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ํŒŒ์•…ํ•˜๊ธฐ ์–ด๋ ค์šด ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค. ์‚ฌ์ „์—ฐ๊ตฌ๊ฐ€ ๋งŽ์ด ์ง„ํ–‰๋˜์ง€ ์•Š์•˜๊ฑฐ๋‚˜, ํ‘œ๋ณธ์˜ ํŠน์ˆ˜์„ฑ์œผ๋กœ ์‚ฌ์ „ ์ง€์‹๊ณผ ์ผ์น˜ํ•˜์ง€ ์•Š๋Š”๋‹ค๊ฑฐ๋‚˜, ๋ณ€์ˆ˜๋“ค์ด ๊ณ ์ฐจํ•ญ์˜ ๊ด€๊ณ„์™€ ๊ฐ™์ด ๋ณต์žกํ•œ ์–‘์ƒ์ด๋ผ ๊ฒฐ๊ณผ๋ฅผ ์˜ˆ์ธกํ•˜๊ธฐ ์–ด๋ ต๋‹ค๊ฑฐ๋‚˜, ๋ฐ์ดํ„ฐ๊ฐ€ ๋ฐฉ๋Œ€ํ•ด์„œ ๋ชจ๋“  ๋ณ€์ˆ˜๋“ค ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ํŒŒ์•…ํ•˜๊ธฐ ์–ด๋ ค์šด ๊ฒฝ์šฐ ๋“ฑ์ด ์žˆ๋‹ค.

 

๋˜ํ•œ ์„ ํ˜• ํšŒ๊ท€๋ชจํ˜•์ด๋‚˜ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ชจํ˜• ๊ฐ™์€ ๋ชจ์ˆ˜์  ๋ฐฉ๋ฒ•์˜ ๊ฒฝ์šฐ๋Š” ๋ณ€์ˆ˜๋“ค๊ฐ„์˜ ํŠน์ •ํ•œ ๊ด€๊ณ„๋ฅผ ๋ฏธ๋ฆฌ ๊ฐ€์ •ํ•˜๊ณ ์„œ ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ํ•จ์ˆ˜์  ๊ด€๊ณ„ (ex. ๊ณต๋ณ€์ธ๊ณผ ๋กœ์ง“ ๊ฐ„์˜ ์„ ํ˜•๊ด€๊ณ„) ๊ฐ€ ์ ์ ˆํ•  ๋•Œ๋Š” ํšจ๊ณผ์ ์ธ ์ถ”์ •์ด๊ฒ ์ง€๋งŒ, ๊ทธ๋ ‡์ง€ ์•Š๋‹ค๋ฉด ๋ฐ์ดํ„ฐ ํŠน์„ฑ์— ๋”ฐ๋ผ ๋ชจํ˜•์„ ์œ ์—ฐํ•˜๊ฒŒ ์ ์šฉํ•˜๊ธฐ์—๋Š” ์ œ์•ฝ์ด ์žˆ๋‹ค. 

 

์ด๋Ÿฌํ•œ ์ƒํ™ฉ์—์„œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ๋ณ€์ˆ˜๋“ค๊ฐ„์˜ ๋ณต์žกํ•œ ๊ด€๊ณ„๋ฅผ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ์œ ์—ฐํ•˜๊ฒŒ ์ž๋™์ ์œผ๋กœ ์„ค์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์žฅ์ ์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ์—ฐ๊ตฌ์ž์˜ ์‚ฌ์ „ ์ง€์‹์ด ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ, ๋ถˆ์ถฉ๋ถ„ํ•œ ์‚ฌ์ „ ์ง€์‹์œผ๋กœ ์„ค์ •ํ•œ ๋ชจํ˜• ๊ฒฐ๊ณผ์—๋งŒ ์˜์กดํ•˜๋Š” ๊ฒƒ ๋ณด๋‹ค๋Š” ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜์˜ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ฐฉ๋ฒ•๋“ค์„ ์‚ฌ์šฉํ•˜๋ฉด ๋ณด๋‹ค Robust ํ•œ ์ถ”์ •์น˜๋ฅผ ์‚ฐ์ถœํ•  ์ˆ˜ ์žˆ๋‹ค. 

 

 

โ‘ถ  ๋จธ์‹ ๋Ÿฌ๋‹ + ์ธ๊ณผ์ถ”๋ก 

 

 โˆ˜  ์ตœ๊ทผ์— ๊ฐœ๋ฐœ๋œ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ์ธ๊ณผ์ถ”๋ก  ๋ฐฉ๋ฒ•๋“ค์€ ํ‰๊ท  ์ฒ˜์น˜ํšจ๊ณผ (ATE) ์™€ ๊ฐœ๋ณ„/์กฐ๊ฑด์  ํ‰๊ท  ์ฒ˜์น˜ํšจ๊ณผ (CATE) ๋ฅผ ์ถ”์ •ํ•˜๋Š”๋ฐ ๋ชฉ์ ์ด ์žˆ๋‹ค. 

 

 โˆ˜  Causal Forest, Bayes additive regression trees model (BART ๋ฒ ์ด์ง€์•ˆ ๊ธฐ๋ฒ• ํšŒ๊ท€๋‚˜๋ฌด ๋ชจํ˜•), Targeted Maximum Likelihood estimation (TMLE ํ‘œ์  ์ตœ๋Œ€์šฐ๋„ ์ถ”์ •) 

 

 โˆ˜  ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ์ธ๊ณผ์ถ”๋ก  ๋ฐฉ๋ฒ•๋“ค์€ ์œ ์—ฐํ•˜๊ฒŒ ์ž๋™์ ์œผ๋กœ ๋ชจํ˜•์„ ์„ค์ •ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์—ฐ๊ตฌ์ž์˜ ๋ชจํ˜• ์„ค์ • ์˜ค๋ฅ˜๋กœ ์ธํ•ด์„œ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ํŽธ์˜๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ์žฅ์ ์ด ์ฃผ๋ชฉ๋ฐ›์œผ๋ฉด์„œ ๋จธ์‹ ๋Ÿฌ๋‹ ์ธ๊ณผ์ถ”๋ก  ๋ฐฉ๋ฒ•์„ ํ™œ์šฉํ•ด ์ฒ˜์น˜ํšจ๊ณผ๋ฅผ ๋ถ„์„ํ•˜๋ ค๋Š” ์—ฐ๊ตฌ๋“ค๋„ ์ตœ๊ทผ ํ™œ๋ฐœํžˆ ์ง„ํ–‰๋˜๊ณ  ์žˆ๋‹ค. 

 

 

 

 

 

โ— [Theoretical background]  โ— 

 

 โˆ˜  ๋ชจ์ˆ˜์  ๋ฐฉ๋ฒ•๊ณผ ๋‹ฌ๋ฆฌ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ฐฉ๋ฒ•๋“ค์€ Treatment model ๊ณผ Outcome model ์˜ ํ•จ์ˆ˜์  ๊ด€๊ณ„๋ฅผ ๋งค์šฐ ์œ ์—ฐํ•˜๊ฒŒ ์ž๋™์ ์œผ๋กœ ์„ค์ •ํ•œ๋‹ค. ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ฐฉ๋ฒ•๋“ค์€ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ฐฉ๋ฒ•์„ ์ด์šฉํ•ด ๊ฒฐ๊ณผ ๋ชจํ˜• ๋˜๋Š” ์ฒ˜์น˜๋ชจํ˜•์„ ์„ค์ •ํ•œ๋‹ค. 

 

 โˆ˜  Treatment model : ์ฒ˜์น˜๋ณ€์ˆ˜๊ฐ€ ์ข…์†๋ณ€์ˆ˜์ธ ๋ชจํ˜•์œผ๋กœ, ๊ฐ€๋ น ๊ต๋‚ด ๋™์•„๋ฆฌํ™œ๋™ ์ฐธ์—ฌ ์—ฌ๋ถ€๋ฅผ ์ข…์†๋ณ€์ˆ˜๋กœ ํ•˜๋Š” ๋ชจํ˜•์„ ๋– ์˜ฌ๋ฆด ์ˆ˜ ์žˆ๋‹ค. 

   โ†ช   ๊ณต๋ณ€์ธ์˜ ์กฐ๊ฑด์  ์ฒ˜์น˜ํ‰๊ท  e(x) = E[Zi | Xi] ์œผ๋กœ ์ถ”์ •๋œ๋‹ค. 

 

 โˆ˜  Outcome model : ๊ฒฐ๊ณผ๋ณ€์ˆ˜๊ฐ€ ์ข…์†๋ณ€์ˆ˜์ธ ๋ชจํ˜•์œผ๋กœ, ๊ฐ€๋ น ํ˜‘์—…๋Šฅ๋ ฅ์„ ์ข…์†๋ณ€์ˆ˜๋กœ ํ•˜๋Š” ๋ชจํ˜•์„ ๋– ์˜ฌ๋ฆด ์ˆ˜ ์žˆ๋‹ค. 

   โ†ช  ๊ณต๋ณ€์ธ๊ณผ ์ฒ˜์น˜๋ณ€์ˆ˜์˜ ์กฐ๊ฑด์  ์ข…์†ํ‰๊ท  m(x,z) = E[Yi | Xi, Zi] ํ˜น์€ ๊ณต๋ณ€์ธ๋งŒ์˜ 

        ์กฐ๊ฑด์  ์ข…์†ํ‰๊ท  m(x) = E[Yi | Xi] ๋กœ ์ถ”์ •๋œ๋‹ค. 

 

 โˆ˜  BART๋Š” ๋ฒ ์ด์ง€์•ˆ ๊ฐ€๋ฒ• ํšŒ๊ท€๋‚˜๋ฌด ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ Outcome model ์„ ์ถ”์ •ํ•˜๊ณ , ์ผ๋ฐ˜์ ์œผ๋กœ Outcome model ๋งŒ์œผ๋กœ CATE ๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค. 

 

 โˆ˜  TMLE๋Š” ์Šˆํผ๋Ÿฌ๋„ˆ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์•™์ƒ๋ธ” ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•ด Outcome model ๋ฐ Treatment model ์„ ์ถ”์ •ํ•˜๊ณ , Treatment ์˜ˆ์ธก ๊ฐ’์„ ์ด์šฉํ•œ ๋ณ€์ˆ˜๋ฅผ Outcome model ์— ์ถ”๊ฐ€์ ์ธ ๊ณต๋ณ€์ธ์œผ๋กœ ํˆฌ์ž…ํ•˜์—ฌ Treatment effect ๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค. 

 

 โˆ˜  ์ธ๊ณผ ํฌ๋ ˆ์ŠคํŠธ๋Š” Random forest ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ Outcome model ๋ฐ Treatment model ์„ ์ถ”์ •ํ•˜๊ณ , Weighted Linear regression ์ ‘๊ทผ๋ฒ•์„ ํ†ตํ•ด CATE ๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค. 

 

์ธ๊ณผ ํฌ๋ ˆ์ŠคํŠธ๋Š” ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ˆ˜์ •ํ•˜์—ฌ Outcome ๋ฐ Treatment ๋ฅผ ์˜ˆ์ธกํ•˜๊ณ , ์ถ”์ •๋œ ์˜ˆ์ธก๊ฐ’์„ ๋ฐ”ํƒ•์œผ๋กœ CATE ์™€ ATE ๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค. CATE ๋ฅผ ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด์„œ, ์ธ๊ณผ ํฌ๋ ˆ์ŠคํŠธ๋Š” ๊ฐ€์ค‘ ์„ ํ˜• ํšŒ๊ท€ ์ ‘๊ทผ๋ฒ•์„ ์‚ฌ์šฉํ•˜๊ณ , ๊ธฐ์กด ๋ณ€์ˆ˜๋“ค์—์„œ ์˜ˆ์ธก๋œ ๊ฐ’์„ ๋บ€ ์ž”์ฐจ ๋ณ€์ˆ˜๋“ค์„ ์ด์šฉํ•œ๋‹ค. Prediction on Outcome ๊ณผ Treatment Estimation ์€ ML ์—์„œ ํ”ํžˆ ์‚ฌ์šฉ๋˜๋Š” OOB leave-one-out ๋ฐฉ๋ฒ•์œผ๋กœ ์ถ”์ •๋œ๋‹ค. ์ด๋Š” ํŠน์ • i ๋ฅผ ์ œ์™ธํ•˜์—ฌ ๋ชจํ˜•์„ ์„ค์ •ํ•œ ํ›„, ์ถ”์ •๋œ ๋ชจํ˜•์œผ๋กœ ํŠน์ • i ์— ๋Œ€ํ•œ ์˜ˆ์ธก์น˜๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ์•„๋ž˜ ์‹์— ๋”ฐ๋ผ Individual CATE τ(x) ๋ฅผ ๊ณ„์‚ฐํ•œ๋‹ค. 

 

 

โ†ช   αi(x) : ํŠน์ • i ๊ฐ€ CATE ๋ฅผ ๊ณ„์‚ฐํ•˜๋Š”๋ฐ ๋ฏธ์น˜๋Š” ๊ณตํ—Œ๋„ 0~1 ์‚ฌ์ด์˜ ๊ฐ’ 

โ†ช   - i : leave one out ๋ฐฉ๋ฒ•์„ ๋œปํ•จ 

โ†ช   m(X), e(X) : Athey ๊ฐ€ ์ œ์•ˆํ•œ Honest Random forest ๋ฅผ ํ†ตํ•ด ๊ฐ’์ด ์ถ”์ •๋œ๋‹ค. Honesty ๋ž€ ์ธ๊ณผ ํฌ๋ ˆ์ŠคํŠธ์˜ ์ค‘์š”ํ•œ ํŠน์„ฑ์œผ๋กœ, Tree ํŠน์„ฑ ์ค‘ ํ•˜๋‚˜๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋Š”๋ฐ, Tree ๋ชจํ˜•์„ ์„ค์ •ํ•˜๋Š”๋ฐ ์‚ฌ์šฉ๋œ ์ž๋ฃŒ๋Š” Tree ์˜ ๊ฐ Leaf ์—์„œ Treatment effect ๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐ๋Š” ์‚ฌ์šฉ๋˜์ง€ ์•Š๋Š”๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. 

โ†ช   ATE ๋Š” Individual CATE ๋ฅผ ํ‰๊ท ํ•˜์—ฌ ๊ณ„์‚ฐํ•œ๋‹ค. 



โ€ป  OOB : ์ฃผ๋กœ ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ์™€ ๊ฐ™์€ ์•™์ƒ๋ธ” ํ•™์Šต ๊ธฐ๋ฒ•์—์„œ ์‚ฌ์šฉ๋˜๋Š” ๊ต์ฐจ ๊ฒ€์ฆ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•  ๋•Œ ์ผ๋ถ€ ์ƒ˜ํ”Œ์„ ์ œ์™ธํ•˜๊ณ  ํ…Œ์ŠคํŠธํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ฐ ์ƒ˜ํ”Œ์ด ํ›ˆ๋ จ์— ์–ผ๋งˆ๋‚˜ ๊ธฐ์—ฌํ•˜๋Š”์ง€๋ฅผ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๊ฐ€ ๋ชจ๋ธ์— ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ์ง€๋ฅผ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 



 

 

โ— [Methods] โ— 

 

 โˆ˜   Variable Definition : ์กฐ์‚ฌ์‹œ์  ๊ธฐ์ค€ ์ง€๋‚œ 1๋…„๋™์•ˆ ๋™์•„๋ฆฌ์— ํ•œ ๋ฒˆ์ด๋ผ๋„ ์ฐธ์—ฌํ•œ ๊ฒฝ์šฐ์—๋Š” ์ฐธ์—ฌ์ง‘๋‹จ (์ฒ˜์น˜์ง‘๋‹จ) ์œผ๋กœ, ์ฐธ์—ฌํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ์—๋Š” ๋น„์ฐธ์—ฌ์ง‘๋‹จ (ํ†ต์ œ์ง‘๋‹จ) ์œผ๋กœ ๊ตฌ๋ถ„ํ•˜์˜€๋‹ค. ๊ฒฐ๊ณผ๋ณ€์ˆ˜์ธ ํ˜‘์—…๋Šฅ๋ ฅ์€ ๋ฆฌ์ปคํŠธ ์ฒ™๋„๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์ ์ˆ˜๋กœ ์ธก์ •๋˜์—ˆ๋‹ค. ๊ณต๋ณ€์ธ์œผ๋กœ๋Š” ์„ฑ๋ณ„, ํ•™์—…ํŠน์„ฑ, ์ •์„œํŠน์ •, ์‚ฌํšŒํŠน์„ฑ, ๋ถ€๋ชจํŠน์„ฑ, ํ•™๊ตํŠน์„ฑ ๋“ฑ์„ ํˆฌ์ž…ํ•ด ํ†ต์ œํ•˜์˜€๋‹ค. 

 

 โˆ˜  Program : R ํ”„๋กœ๊ทธ๋žจ ํŒจํ‚ค์ง€ grf ๋ฅผ ์‚ฌ์šฉํ•˜์˜€๋‹ค. causal_forest ํ•จ์ˆ˜์— ์ฒ˜์น˜๋ณ€์ˆ˜, ๊ฒฐ๊ณผ๋ณ€์ˆ˜, ๊ณต๋ณ€์ธ์„ ํˆฌ์ž…ํ•ด Individual/Conditional Treatment effect ์ถ”์ •์น˜๋ฅผ ์‚ฐ์ถœํ•˜์˜€๋‹ค. ๊ทธ๋ฆฌ๊ณ  ํ•จ์ˆ˜ best_linear_projection ์— ์‚ฌ์šฉํ•ด Individual/Conditional Treatment effect ์ถ”์ •์น˜๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ATE (ํ‰๊ท  ์ฒ˜์น˜ํšจ๊ณผ) ์™€ ํ•™์ƒ๋“ค์˜ ํŠน์„ฑ (์„ฑ๋ณ„, ๋˜๋ž˜๊ด€๊ณ„, ๊ต์‚ฌ๊ด€๊ณ„) ์— ๋”ฐ๋ฅธ ์ฐจ๋ณ„์  ์ฒ˜์น˜ํšจ๊ณผ๋ฅผ ๋ถ„์„ํ•˜์˜€๋‹ค. 

 

 

 

 

 

โ—  [Results]  โ— 

 

 โˆ˜  ATE 

 

โ†ช  2.891 : ๊ณต๋ณ€์ธ ํ†ต์ œ ์ „, ์ฒ˜์น˜์ง‘๋‹จ๊ณผ ํ†ต์ œ์ง‘๋‹จ์˜ ํ˜‘์—…๋Šฅ๋ ฅ ์ ์ˆ˜ ์ฐจ์ด 

โ†ช  0.069 : ๊ณต๋ณ€์ธ ํ†ต์ œ ํ›„, ์ฒ˜์น˜์ง‘๋‹จ๊ณผ ํ†ต์ œ์ง‘๋‹จ์˜ ํ˜‘์—…๋Šฅ๋ ฅ ์ ์ˆ˜ ์ฐจ์ด 

 

 

 โˆ˜  Individual CATE

  โ†ช  ์ ์„  : ATE 

 

 

 

 โˆ˜  Heterogeneous treatment effects 

 

 

โ†ช  ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜ํ•œ ์ฐจ๋ณ„์  ์ฒ˜์น˜ํšจ๊ณผ๋Š” ๋ฐœ๊ฒฌ๋˜์ง€ ์•Š์•˜๋‹ค. 

 

 

 

  โ†ช  ๋นจ๊ฐ„์  : ํ‰๊ท ๊ฐ’ . ์„ฑ๋ณ„์— ๋”ฐ๋ผ ์ฒ˜์น˜ํšจ๊ณผ ๋ถ„ํฌ์— ํฐ ์ฐจ์ด๊ฐ€ ๋‚˜ํƒ€๋‚˜์ง€ ์•Š์Œ

 

 

 

 

  โ†ช  ๋˜๋ž˜์™€์˜ ๊ด€๊ณ„, ๊ต์‚ฌ์™€์˜ ๊ด€๊ณ„์— ๋”ฐ๋ฅธ ๊ฐ ์กฐ๊ฑด์—์„œ์˜ ์ฒ˜์น˜ํšจ๊ณผ ํ‰๊ท ๊ฐ’ (tau) ํฌ๊ธฐ๊ฐ€ ํด์ˆ˜๋ก ๋” ์ง™์€ ์ƒ‰์œผ๋กœ ํ‘œํ˜„๋จ. ์ฒ˜์น˜ํšจ๊ณผ๊ฐ€ ๋šœ๋ ทํ•˜๊ฒŒ ๋‹ค๋ฅธ ํŒจํ„ด์„ ๋ณด์ด์ง€๋Š” ์•Š์Œ

 

 

 

728x90

๋Œ“๊ธ€