๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

[The Brave and True] 1. Introduction to causality

by isdawell 2023. 6. 20.
728x90

 

 

๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”!

 

 

 

 

โ‘   ์ธ๊ณผ์ถ”๋ก ์— ๊ด€์‹ฌ์„ ๊ฐ€์ ธ์•ผ ํ•˜๋Š” ์ด์œ  


 

•  ๋จธ์‹ ๋Ÿฌ๋‹์€ ์ธ๊ณผ๊ด€๊ณ„ ์œ ํ˜•์˜ ๋ฌธ์ œ๋ฅผ ์ž˜ ๋‹ค๋ฃจ์ง€ ๋ชปํ•œ๋‹ค. ๊ฐ€๋ น ํ˜ธํ…” ์‚ฐ์—…์—์„ , ๊ฐ€๊ฒฉ์ด ๋น„์ˆ˜๊ธฐ์ผ๋•Œ ์ €๋ ดํ•˜๊ณ  ์„ฑ์ˆ˜๊ธฐ์ผ๋•Œ ๋†’๋‹ค. ๋จธ์‹ ๋Ÿฌ๋‹์ด Naive ํ•œ prediction ์„ ํ•˜๊ฒŒ ๋˜๋ฉด ๊ฐ€๊ฒฉ์„ ์ธ์ƒํ–ˆ์„ ๋•Œ ๋” ๋งŽ์€ ๊ฐ์‹ค์ด ํŒ”๋ฆด ๊ฒƒ์ด๋ผ ์ œ์•ˆํ•  ์ˆ˜ ์žˆ๋‹ค. 

 

•  ์ธ๊ณผ์ถ”๋ก ์€ Counterfactual ์ด๋ผ ๋ถ€๋ฅด๋Š” "๋งŒ์•ฝ์—" ๋ผ๋Š” ์งˆ๋ฌธ์— ๋‹ตํ•  ๊ฒƒ์„ ์š”๊ตฌํ•œ๋‹ค. 

 

•  ๋จธ์‹ ๋Ÿฌ๋‹์€ ์ƒ๊ด€๊ด€๊ณ„ ์œ ํ˜• ์˜ˆ์ธก์— ์˜์กดํ•˜์—ฌ ์ธ๊ณผ์ถ”๋ก ์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์—†๋‹ค. ์ƒ๊ด€๊ด€๊ณ„์™€ ์ธ๊ณผ๊ด€๊ณ„๋Š” ๋‹ค๋ฅด๋‹ค. 

 

 

 

 

โ‘ก  Notation 


 

โ—ฏ  ์˜ˆ์ œ

 

•  ํ•™์ƒ๋“ค์—๊ฒŒ ํƒœ๋ธ”๋ฆฟ์„ ์ œ๊ณตํ–ˆ์„ ๋•Œ ์„ฑ๊ณผ์— ๋ฏธ์น˜๋Š” ์ธ๊ณผํšจ๊ณผ ๋ฐํ˜€๋‚ด๊ธฐ 

 

 

โ—ฏ  Ti 

 

•  unit i ์— ๋Œ€ํ•œ Treatment ์—ฌ๋ถ€๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. 

 

•  effect ๋ฅผ ์•Œ๊ณ ์ž ํ•˜๋Š” ์ผ๋ถ€ intervention ์„ ๋‚˜ํƒ€๋‚ด๋Š”๋ฐ ์‚ฌ์šฉํ•˜๋Š” ์šฉ์–ด

•  T ๋Œ€์‹  D๋กœ ํ‘œ์‹œ๋˜๋Š” ๊ฒฝ์šฐ๋„ ์ข…์ข… ์žˆ๋‹ค. 

•  ์œ„์˜ ์˜ˆ์‹œ์‚ฌ๋ก€์—์„  ํƒœ๋ธ”๋ฆฟ ์ œ๊ณต์ด Treatment ์— ํ•ด๋‹น 

 

 

 

โ—ฏ  Yi

 

•  unit i ์— ๋Œ€ํ•œ ๊ด€์ฐฐ๋œ ๊ฒฐ๊ณผ๋ณ€์ˆ˜ (Outcome variable) 

•  ๊ด€์‹ฌ์žˆ๋Š” ๋ณ€์ˆ˜๋กœ, Treatment ๊ฐ€ Outcome ์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š”์ง€์— ๋Œ€ํ•ด ์•Œ๊ณ ์ž ํ•œ๋‹ค. 

•  ์œ„์˜ ์˜ˆ์‹œ ์‚ฌ๋ก€์—์„  ํ•™์—… ์„ฑ์ทจ๊ฐ€ ๊ฒฐ๊ณผ๋ณ€์ˆ˜๊ฐ€ ๋œ๋‹ค. 

 

 

 

โ—ฏ  ์ธ๊ณผ์ถ”๋ก ์˜ ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ œ 

 

•  Treatment ๊ฐ€ ์žˆ๋“  ์—†๋“  ๊ฐ™์€ ์‹คํ—˜ ๋Œ€์ƒ์— ๋Œ€ํ•ด ๋™์‹œ์— ๊ด€์ฐฐํ•  ์ˆ˜ ์—†๋‹ค๋Š” ๊ฒƒ 

•  Potential outcome : ์‹ค์ œ๋กœ ์ผ์–ด๋‚˜์ง€ ์•Š์•˜์œผ๋‚˜ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฐ๊ณผ 

•  ๋ฐœ์ƒํ•œ ์ž ์žฌ์  ๊ฒฐ๊ณผ๋ฅผ factual ์ด๋ผ๊ณ  ๋ถ€๋ฅด๊ณ  ์ผ์–ด๋‚˜์ง€ ์•Š์€ ๊ฒฐ๊ณผ๋ฅผ counterfactual ์ด๋ผ๊ณ  ๋ถ€๋ฅด๊ธฐ๋„ ํ•œ๋‹ค. 

 

•  Y0i : ์‹คํ—˜๋Œ€์ƒ i๊ฐ€ Treatment ๋ฅผ ๋ฐ›์ง€ ์•Š์€ ์ž ์žฌ์  ๊ฒฐ๊ณผ 

•  Y1i : ๊ฐ™์€ ์‹คํ—˜๋Œ€์ƒ i๊ฐ€ Treatment ๋ฅผ ๋ฐ›์€ ์ž ์žฌ์  ๊ฒฐ๊ณผ 

 

•  ์˜ˆ์ œ์—์„œ Y1i ๋Š” ํƒœ๋ธ”๋ฆฟ์ด ์žˆ๋Š” ๊ต์‹ค์— ์žˆ๋Š” ๊ฒฝ์šฐ ํ•™์ƒ i์— ๋Œ€ํ•œ ํ•™์—…์„ฑ์ทจ๋„๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ํƒœ๋ธ”๋ฆฟ์„ ๋ฐ›์ง€ ๋ชปํ•œ ๊ฒฝ์šฐ๋ผ๋ฉด Y0i๊ฐ€ ๊ด€์ธก๋œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํƒœ๋ธ”๋ฆฟ์„ ๋ฐ›์ง€ ๋ชปํ•œ ๊ฒฝ์šฐ์˜ Y1i ๋Š” ๊ด€์ธก ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฝ์šฐ๋ฅผ counterfactual potential outcome ์ด๋ผ ๋ถ€๋ฅธ๋‹ค. 

 

 

โ—ฏ  ITE

 

•  potential outcomes ๋ฅผ ํ†ตํ•ด ๊ฐœ๋ณ„ ์ฒ˜์น˜ํšจ๊ณผ ITE ๋ฅผ ์ •์˜ํ•  ์ˆ˜ ์žˆ๋‹ค : Y1i - Y0i 

•  ๊ทธ๋Ÿฌ๋‚˜ ์ธ๊ณผ์ถ”๋ก ์˜ ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ œ๋กœ ๊ฐ™์€ i ์— ๋Œ€ํ•ด ์ž ์žฌ์  ๊ฒฐ๊ณผ ์ค‘ ํ•˜๋‚˜๋งŒ ๊ด€์ธก ๊ฐ€๋Šฅํ•˜๊ธฐ ๋•Œ๋ฌธ์— ITE ๋ฅผ ์•Œ ์ˆ˜ ์—†๋‹ค โ‡จ ๋Œ€์‹  ATE ๋ฅผ ์ถ”์ •

 

 

โ—ฏ  ATE

 

•  Average treatment effect 

•  ATE = E[Y1-Y0] 

 

 

โ—ฏ  ATET (ATT)

 

•  average treatment effect on the treated

•  ์ฒ˜์น˜๋ฐ›์€ ๊ทธ๋ฃน์— ๋Œ€ํ•œ ํ‰๊ท  ์ฒ˜์น˜ํšจ๊ณผ๋กœ ATE๋ณด๋‹ค ์ถ”์ •ํ•˜๊ธฐ ์ข€ ๋” ์‰ฝ๋‹ค. 

•  ATT = E[Y1-Y0 | Y=1] 

 

 

 

โ—ฏ  ์˜ˆ์ œ ๊ณ„์‚ฐ ์˜ˆ์‹œ 

 

 

•  4๊ฐœ์˜ ํ•™๊ต์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ : i = {1,2,3,4}

•  ํ•™์ƒ๋“ค์—๊ฒŒ ํƒœ๋ธ”๋ฆฟ์„ ์ œ๊ณตํ•˜๋Š” ๊ฒฝ์šฐ : t=1 

•  y0 : before treatment, y1 : after treatment, te = treatment effect = y1 - y0 

•  y : ์‹ค์ œ ๊ด€์ธก์น˜ โ‡จ t=0 ์ผ ๋•Œ๋Š” y0 ๊ฐ’์„ ๊ฐ€์ง€๊ณ , t=1 ์ผ ๋•Œ๋Š” y1 ๊ฐ’์„ ๊ฐ€์ง„๋‹ค. 

•  t=0 ์ผ ๋•Œ์˜ y1 ๊ฐ’์€ ์ฒ˜์น˜๋ฐ›์€ Y0 ์œผ๋กœ counterfactual ๊ฐ’์— ํ•ด๋‹นํ•œ๋‹ค. ์œ ์‚ฌํ•˜๊ฒŒ t=1 ์ผ ๋•Œ y0 ๋„ counterfactual ์— ํ•ด๋‹นํ•œ๋‹ค. 

 

•  ATE ๋Š” ๋งˆ์ง€๋ง‰ ์นผ๋Ÿผ์— ๋Œ€ํ•œ ํ‰๊ท , ์ฆ‰ ๊ฐœ๋ณ„ ์ฒ˜์น˜ํšจ๊ณผ์— ๋Œ€ํ•œ ํ‰๊ท ์ด๋‹ค.

โ†ช ํƒœ๋ธ”๋ฆฟ์ด ํ•™์ƒ๋“ค์˜ ํ•™์—… ์„ฑ์ทจ๋„๋ฅผ ํ‰๊ท ์ ์œผ๋กœ 50์  ๊ฐ์†Œ์‹œ์ผฐ์Œ์„ ์˜๋ฏธํ•œ๋‹ค. 

 

•  ATT ๋Š” T=1 ์ผ ๋•Œ ๋งˆ์ง€๋ง‰ ์—ด์˜ ํ‰๊ท ์ด๋‹ค.

โ†ช ํƒœ๋ธ”๋ฆฟ์„ ๋ฐ›์€ ํ•™๊ต๋Š” ํƒœ๋ธ”๋ฆฟ์ด ํ•™์ƒ๋“ค์˜ ํ•™์—… ์„ฑ์ทจ๋„๋ฅผ ํ‰๊ท ์ ์œผ๋กœ 75์  ๊ฐ์†Œ์‹œ์ผฐ์Œ์„ ์˜๋ฏธํ•œ๋‹ค. 

 

 

 

•  ๊ทธ๋Ÿฌ๋‚˜ ์‹ค์ œ๋กœ ATE ์™€ ATT ๋ฅผ ๊ณ„์‚ฐํ•ด๋‚ผ ์ˆ˜๋Š” ์—†๋‹ค. (counterfactual) ์‹ค์ œ๋กœ ๋งˆ์ฃผํ•˜๋Š” ๋ฐ์ดํ„ฐ๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค. 

 

 

 

 

 

 

 

 

โ‘ข  Bias 


 

โ—ฏ  ์˜ˆ์ œ์—์„œ bias 

 

•  ํ•™์ƒ๋“ค์—๊ฒŒ ํƒœ๋ธ”๋ฆฟ์„ ์ œ๊ณตํ•˜๋Š” ํ•™๊ต๊ฐ€ ๋” ๋†’์€ ์‹œํ—˜ ์ ์ˆ˜๋ฅผ ์–ป๋Š”๋‹ค๋Š” ์ฃผ์žฅ์— ๋ถ€๋”›ํ˜”์„ ๋•Œ,  ํ•ด๋‹น ํ•™๊ต๋Š” ๋ถ€์œ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํƒœ๋ธ”๋ฆฟ์„ ์ œ๊ณต ํ•  ์ˆ˜ ์žˆ์—ˆ๋˜ ๊ฒƒ์ด๊ณ , ๋”ฐ๋ผ์„œ ํƒœ๋ธ”๋ฆฟ ์—†์ด๋„ ๋” ๋Šฅ๋ ฅ์ด ์ข‹์€ ๊ต์‚ฌ๋ฅผ ๊ณ ์šฉํ•ด ์–ด์จŒ๋“  ๋” ๋†’์€ ์‹œํ—˜ ์ ์ˆ˜๋ฅผ ์–ป์„ ๊ฒƒ์ด๋ผ๊ณ  ๋งํ•จ์œผ๋กœ์จ ์ด ์ฃผ์žฅ์„ ๋ฐ˜๋ฐ•ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, treatment group ๊ณผ control group ์ด ๋น„๊ต ๊ฐ€๋Šฅํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ์— ํ•ด๋‹นํ•œ๋‹ค. 

 

 

โ—ฏ  Bias

 

•  Counterfactual ์€ ๊ด€์ฐฐ ๋ถˆ๊ฐ€๋Šฅํ•˜๋‚˜, ํ•ด๋‹น ๋ถ€๋ถ„์— ๋Œ€ํ•œ ์ถ”๋ก ์€ ๋„๋ฉ”์ธ ์ง€์‹๋“ฑ์„ ํ†ตํ•ด ๊ฐ€๋Šฅํ•˜๋‹ค. 

•  ์œ„์˜ ์˜ˆ์‹œ์˜ ๊ฒฝ์šฐ ์ฒ˜์น˜๋ฅผ ๋ฐ›์€ ํ•™๊ต์˜ Y0 ๊ฐ€ ์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์€ ํ•™๊ต์˜ Y0 ๋ณด๋‹ค ํฌ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, ํ•™์ƒ๋“ค์—๊ฒŒ ํƒœ๋ธ”๋ฆฟ์„ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์ด ์žˆ๋Š” ํ•™๊ต๋Š” ๋” ๋†’์€ ์‹œํ—˜์ ์ˆ˜์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ๋‹ค๋ฅธ ์š”์ธ๋“ค๋„ ์กด์žฌํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. (ex. ๊ตญ์ œํ•™๊ต๋ผ๋˜์ง€) 

 

•  ์ฒ˜์น˜๋ฅผ ๋ฐ›์€ ๊ฒฝ์šฐ ๊ด€์ฐฐ๋œ ๊ฒฐ๊ณผ๋ฅผ Y1, ์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์€ ๊ฒฝ์šฐ์— ๊ด€์ฐฐ๋œ ๊ฒฐ๊ณผ๋ฅผ Y0 ์ด๋ผ๊ณ  ์•ด์„ ๋•Œ, 

 

 

๋กœ ๋ณผ ์ˆ˜ ์žˆ๊ณ , counterfactual outcome (์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์•˜๋‹ค๋ฉด ์ฒ˜์น˜์˜ ๊ฒฐ๊ณผ) ์ธ E[Y0 | T=1] ๋ฅผ ๋”ํ•˜๊ณ  ๋บ์„ ๋•Œ 

 

 

์™€ ๊ฐ™์ด ์ž‘์„ฑํ•ด๋ณผ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ˆ˜์‹์„ ์žฌ์ •๋ฆฌํ•˜๊ณ  ๊ธฐ๋Œ“๊ฐ’์„ ํ•ฉ์นœ ์ดํ›„์˜ ์ˆ˜์‹์€ ์•„๋ž˜์™€ ๊ฐ™๋‹ค. 

 

์ธ๊ณผ๊ด€๊ณ„๊ฐ€ ์•„๋‹ˆ๋‹ค

 

์ด๋•Œ bias ๋Š” ์‹คํ—˜๊ตฐ๊ณผ ๋Œ€์กฐ๊ตฐ์ด ์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์€ ๊ฒฝ์šฐ, ์ฒ˜์น˜ ์ „์— ์‹คํ—˜๊ตฐ๊ณผ ๋Œ€์กฐ๊ตฐ์ด ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅธ์ง€๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ํƒœ๋ธ”๋ฆฟ ์˜ˆ์ œ์—์„œ ์ฃผ์žฅํ•˜๋Š” ๋ฐ˜๋ฐ•๋Œ€๋กœ bias ๋ฅผ ์ž‘์„ฑํ•ด๋ณด๋ฉด E[Y0 | T=0] < E[Y0 | T=1] ์ด๋ผ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. (์ด๋ฏธ ๋Šฅ๋ ฅ์žˆ๋Š” ํ•™๊ต) 

 

•  Bias ๊ฐ€ ๋ฐœ์ƒํ•˜๋Š” ์ด์œ ๋Š”, ์šฐ๋ฆฌ๊ฐ€ ํ†ต์ œํ•  ์ˆ˜ ์—†๋Š” ๋งŽ์€ ๋ณ€์ˆ˜๋“ค์ด Treatment ์™€ ํ•จ๊ป˜ ๋ฐ”๋€Œ๊ธฐ ๋•Œ๋ฌธ์— ๋ฐœ์ƒํ•œ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ์ฒ˜์น˜๋ฅผ ๋ฐ›์€ ํ•™๊ต์™€ ์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์€ ํ•™๊ต๋Š” ํƒœ๋ธ”๋ฆฟ์—์„œ๋งŒ ์ฐจ์ด๊ฐ€ ์žˆ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋‹ค. ์ˆ˜์—…๋ฃŒ, ์œ„์น˜, ๊ต์‚ฌ ๋“ฑ ๋‹ค๋ฅธ ์š”์ธ๋“ค๋„ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋‹ค. ๋งŒ์•ฝ, ํƒœ๋ธ”๋ฆฟ ์ œ๊ณต๊ณผ ํ•™์—…์„ฑ์  ํ–ฅ์ƒ์˜ ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ๋ฐํžˆ๊ณ  ์‹ถ๋‹ค๋ฉด, ํƒœ๋ธ”๋ฆฟ์ด ์žˆ๋Š” ํ•™๊ต์™€ ์—†๋Š” ํ•™๊ต๊ฐ€ ํ‰๊ท ์ ์œผ๋กœ ์„œ๋กœ ๋น„์Šทํ•ด์•ผ ํ•œ๋‹ค. ์ฆ‰, E[Y0 | T=0] = E[Y0 | T=1] ์ด์—ฌ์•ผ ์ธ๊ณผ๊ด€๊ณ„๋กœ ํ•ด์„ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด๋‹ค. (๋˜๋Š” ์‹คํ—˜๊ตฐ์ด ์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์•˜์„ ๋•Œ๋ฅผ ๊ด€์ธกํ•  ์ˆ˜ ์žˆ์œผ๋ฉด ๋œ๋‹ค) 

 

 

•  bias ๊ฐ€ ์—†๋‹ค๋ฉด, ATT ๋Š” E[Y|T=1] - E[Y|T=0] ์ด ๋œ๋‹ค. ์ฆ‰, ๋น„๊ต ๊ฐ€๋Šฅํ•œ ๊ทธ๋ฃน์ผ ๊ฒฝ์šฐ ๋‘ ์ง‘๋‹จ์˜ ํ‰๊ท ์ฐจ์ด๊ฐ€ ์ธ๊ณผํšจ๊ณผ๊ฐ€ ๋œ๋‹ค. 

 

 

•  ๋งŒ์•ฝ ์ฒ˜์น˜ ํ›„์—๋„ ์‹คํ—˜๊ตฐ๊ณผ ๋Œ€์กฐ๊ตฐ์ด ๊ตํ™˜ ๊ฐ€๋Šฅํ•œ, ์ฆ‰, E[Y1 | T=0] = E[Y1 | T=1] ์ƒํƒœ๊ฐ€ ๋˜๋ฉด ์•„๋ž˜์™€ ๊ฐ™์ด ATT ๊ฐ€ ATE ๊ฐ€ ๋œ๋‹ค. (โ€ป ์ฐธ๊ณ 

 

 

 

•  ์‹คํ—˜๊ตฐ๊ณผ ๋Œ€์กฐ๊ตฐ์„ ๋‹จ์ˆœ ํ‰๊ท ์„ ๋น„๊ตํ–ˆ์„ ๋•Œ๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค. 

 

ํŒŒ๋ž€์  : ์ฒ˜์น˜๋ฐ›์ง€ ์•Š์€ ๊ทธ๋ฃน

 

๊ทธ๋Ÿฌ๋‚˜ ์‹ค์ œ ์ฒ˜์น˜ํšจ๊ณผ๋Š” ์•„๋ž˜์˜ ์™ผ์ชฝ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ์ž ์žฌ์  ๊ฒฐ๊ณผ๋ฅผ ๊ด€์ฐฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฝ์šฐ์—๋งŒ ๊ฐ€๋Šฅํ•˜๋‹ค. ์•„๋ž˜์˜ ์˜ค๋ฅธ์ชฝ ๊ทธ๋ž˜ํ”„๋Š” bias ๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. 

 

๋ฐ˜์‚ฌ์‹ค ๊ฒฐ๊ณผ๋Š” ๋ฐ์€ ์ƒ‰์œผ๋กœ ํ‘œ์‹œ๋จ

 

bias ๊ฐ€ ์—†๋Š” ๊ฐ€์ƒ์˜ ์ƒํ™ฉ์€ ์•„๋ž˜์™€ ๊ฐ™์€๋ฐ, ํƒœ๋ธ”๋ฆฟ์ด ํ•™๊ต์— ๋ฌด์ž‘์œ„๋กœ ํ• ๋‹น๋œ ๊ฒฝ์šฐ๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ด ๊ฒฝ์šฐ์—๋Š” ์ฒ˜์น˜๋ฅผ ๋ฐ›์€ ๊ทธ๋ฃน๊ณผ ๋ฐ›์ง€ ์•Š์€ ๊ทธ๋ฃน์˜ ์ฐจ์ด๋Š” ํ‰๊ท  ์ธ๊ณผํšจ๊ณผ์— ํ•ด๋‹นํ•œ๋‹ค. (ATE) treatment ์ด์™ธ์— ์ฒ˜์น˜๊ทธ๋ฃน๊ณผ ํ†ต์ œ๊ทธ๋ฃน ์ฐจ์ด์— ๋‹ค๋ฅธ ์›์ธ์ด ์—†๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. 

 

 

 

โ‡จ  Bias์„ ์ œ๊ฑฐํ•˜๊ณ  ์‹คํ—˜๊ตฐ๊ณผ ๋Œ€์กฐ๊ตฐ์„ ๋น„๊ต๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ํ˜„๋ช…ํ•œ ๋ฐฉ๋ฒ•์„ ์ฐพ์•„์„œ, ๋ชจ๋“  ์ฐจ์ด๊ฐ€ ํ‰๊ท ์ ์ธ ์ฒ˜๋ฆฌ ํšจ๊ณผ(ATE)๋งŒ์œผ๋กœ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๊ฒŒ๋”ํ•˜๋Š” ๊ฒƒ์ด ์ธ๊ณผ์ถ”๋ก ์ด๋‹ค. Identifying causal effect

 

 

 

 

 

728x90

๋Œ“๊ธ€