๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

[The Brave and True] 2. Randomized Experiments

by isdawell 2023. 6. 21.
728x90

 

 

๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”!

 

 

 

 

โ‘   The golden standard 


 

•  E(Y0 | T=0) = E(Y0 | T=1) ๋ฅผ ๋งŒ์กฑํ•  ๋•Œ Bias ๊ฐ€ ์—†๋‹ค. ์ฆ‰, ํƒ€๊ฒŸ๊ตฐ๊ณผ ๋Œ€์กฐ๊ตฐ์ด ์ฒ˜์น˜๋ฅผ ๋ฐ›์€ ๊ฒƒ์„ ์ œ์™ธํ•˜๊ณ  ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ์œ ์‚ฌํ•˜๋ฉด ์ธ๊ณผ๊ด€๊ณ„๊ฐ€ ์„ฑ๋ฆฝํ•œ๋‹ค. 

 

•   ์œ„์™€ ๊ฐ™์€ ์ด๋ก ์„ ๋งŒ์กฑ์‹œํ‚ฌ ์ฒซ๋ฒˆ ์งธ ๋„๊ตฌ๋กœ๋Š” Randomized experiments ๊ฐ€ ์žˆ๋‹ค. ๋ฌด์ž‘์œ„ ์‹คํ—˜์€ Treatment Group๊ณผ Control group์— ๊ฐœ๊ฐœ์ธ์„ ๋žœ๋คํ•˜๊ฒŒ ๋ถ„๋ฐฐํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ด๋•Œ ์ฒ˜์น˜๋ฅผ ๋ฐ›๋Š” ํƒ€๊ฒŸ๊ตฐ์˜ ๋น„์œจ์ด ๊ผญ 50%์ผ ํ•„์š”๋Š” ์—†๋‹ค. ๋žœ๋คํ•˜๊ฒŒ ๋ถ„๋ฐฐํ•จ์œผ๋กœ์จ potential outcome ์„ treatment ๋กœ๋ถ€ํ„ฐ ๋…๋ฆฝ์ ์œผ๋กœ ๋งŒ๋“ค์–ด bias ๋ฅผ ์ œ๊ฑฐํ•œ๋‹ค. 

 

 

•  ๋ฌด์ž‘์œ„ ์‹คํ—˜์—์„œ๋Š” treatment ๊ฐ€ ์ฒ˜์น˜๊ตฐ๊ณผ ๋Œ€์กฐ๊ตฐ ๊ฒฐ๊ณผ ์‚ฌ์ด์—์„œ ๋ฐœ์ƒํ•  ์œ ์ผํ•œ ์ฐจ์ด๋ผ๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. 

 

 

 

 

 

โ‘ก  In a school far, far away 


 

•  positive bias : treatment ๋ฅผ ๋ฐ›๋Š” group ์˜ pre-treatment ์ƒํƒœ๊ฐ€ ๋” ํฐ ๊ฒฝ์šฐ : E(Y0 | T=1) > E(Y0 | T=0) 

โ†ช ex. ๊ฐ€๋ น ์˜จ๋ผ์ธ ์ˆ˜์—…์„ ๋ฐ›์€ (→ treatment) ํ•™์ƒ๊ณผ ์˜คํ”„๋ผ์ธ ์ˆ˜์—…์„ ๋ฐ›์€ ํ•™์ƒ ๊ฐ„ ์„ฑ์ ์„ ๋น„๊ตํ•  ๋•Œ, ์˜จ๋ผ์ธ ์ˆ˜์—…์„ ๋ฐ›์€ ์ง‘๋‹จ์ด ๋” ์ž˜ํ•˜๋Š” ํ•™์ƒ๋“ค๋งŒ ๋ฐฐ์น˜๋˜์—ˆ์„ ์ˆ˜ ์žˆ๋‹ค. 

 

•  negative bias : treatment ๋ฅผ ๋ฐ›์€ group ์˜ pre-treatment ์ƒํƒœ๊ฐ€ ๋” ์ž‘์€ ๊ฒฝ์šฐ : E(Y0 | T=1) < E(Y0 | T=0) 

โ†ช ex. ๊ฐ€๋ น ์˜จ๋ผ์ธ ์ˆ˜์—…์ด ๋” ์ €๋ ดํ•˜์—ฌ ๊ณต๋ถ€ ์™ธ์— ๋‹ค๋ฅธ ์ผ๋“ค์„ ํ•ด์•ผํ•˜๋Š” ๋ถ€์œ ํ•˜์ง€ ์•Š์€ ํ•™์ƒ๋“ค๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค. 

 

•  ์ฒซ๋ฒˆ์งธ ๊ทธ๋ฃน์˜ ํ•™์ƒ๋“ค์€ ๋Œ€๋ฉด ๊ฐ•์˜๋ฅผ, ๋‘๋ฒˆ์งธ ํ•™์ƒ๋“ค์€ ์˜จ๋ผ์ธ ์ˆ˜์—…์„, ์„ธ๋ฒˆ์งธ ๊ทธ๋ฃน์˜ ํ•™์ƒ๋“ค์—๊ฒŒ๋Š” ํ˜ผํ•ฉํ˜• ์ˆ˜์—…์„ ๋“ฃ๋„๋ก ๋žœ๋ค ๋ฐฐ์ •์„ ์ง„ํ–‰ํ•˜์—ฌ ํ•™๊ธฐ๋ง ์‹œํ—˜ ์ ์ˆ˜์— ๋Œ€ํ•ด ๋Œ€๋ฉด ์ˆ˜์—…(face_to_face)์ด ํ‰๊ท  ์•ฝ 78.55์ ์ธ์— ๋ฐ˜ํ•ด, ์˜จ๋ผ์ธ ์ˆ˜์—…(online)์˜ ๊ฒฝ์šฐ ํ‰๊ท  73.63์ ์„ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ๋‹ค. (groupby, mean ํ•จ์ˆ˜ ์‚ฌ์šฉ) ๋”ฐ๋ผ์„œ ์˜จ๋ผ์ธ ์ˆ˜์—…์˜ ATE ๋Š” ์•ฝ - 4.91 ์ด๋‹ค. ์ฆ‰, ์˜จ๋ผ์ธ ์ˆ˜์—…์„ ๋“ฃ๋Š” ํ•™์ƒ๋“ค์€ ํ‰๊ท ์ ์œผ๋กœ ์•ฝ 5์  ๋‚ฎ์€ ์ ์ˆ˜๋ฅผ ๋ฐ›๋Š”๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. 

 

 

•  ๋žœ๋คํ™”๊ฐ€ ์ž˜ ์ด๋ฃจ์–ด์กŒ๋Š”์ง€ ํ™•์ธํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ์ฒ˜์น˜๋ฅผ ๋ฐ›์€ ๊ฒƒ์ด ์ „์ฒ˜๋ฆฌ ๋ณ€์ˆ˜์—์„œ ์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์€ ๊ฒƒ๊ณผ ๋™์ผํ•œ์ง€ ํ™•์ธํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์œ„์˜ ์˜ˆ์‹œ์—์„œ๋Š” gender, asian, hispanic, white ๋ณ€์ˆ˜์—์„œ ๊ทธ๋ฃน๊ฐ„ ๋น„๊ต์  ๋น„์Šทํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๋…ธ์˜ค๋Š” ๊ฒƒ์„ ํ™•์ธํ•ด ๋ณผ ์ˆ˜ ์žˆ๋‹ค. black ๋ณ€์ˆ˜์—์„œ๋Š” ๋‹ค๋ฅธ ๊ฒฝํ–ฅ์„ ๋ณด์ด๋Š”๋ฐ, ์ด๋Š” ์ƒ˜ํ”Œ์˜ ๊ฐœ์ˆ˜๊ฐ€ ์•ฝ 400๊ฐœ๋กœ ์ž‘๊ธฐ ๋•Œ๋ฌธ์ž„์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ํ‘œ๋ณธ์ด ํฌ๋‹ค๋ฉด ์ด๋Ÿฌํ•œ ์ฐจ์ด๋Š” ๋งŽ์ด ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š”๋‹ค. 

 

 

 

โ‘ข  The Ideal Experiment 


 

•  Randomised experiments, Randomised Controlled Trials: RCT ๊ฐ€ ์ธ๊ณผํšจ๊ณผ๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ€์žฅ ์‹ ๋ขฐํ• ๋งŒํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์€ ๋น„์šฉ์ด ๋งŽ์ด ๋“ค๊ณ , ๋น„์œค๋ฆฌ์„ฑ์„ ๊ฐ€์ง€๊ฒŒ ๋  ์ˆ˜ ์žˆ๋‹ค. 

 

 

 

 

โ‘ฃ  The assignment mechanism 


 

•  Randomised experiments ์—์„œ ๋ˆ„๊ตฌ์—๊ฒŒ ์ฒ˜์น˜๋ฅผ ์ง„ํ–‰ํ•  ๊ฒƒ์ธ๊ฐ€๋Š” ์™„์ „ํ•œ ๋žœ๋ค์ด๋‹ค. 

•  ๋ชจ๋“  ์ธ๊ณผ์ถ”๋ก  ๊ธฐ์ˆ ๋“ค์€ ๋ˆ„๊ตฌ์—๊ฒŒ ์ฒ˜์น˜๋ฅผ ์ง„ํ–‰ํ•˜๋Š”์ง€๋ฅผ ์•Œ๊ณ  ์‹ถ์–ด ํ•œ๋‹ค. Assignment Mechanism์„ ์ž˜ ์ดํ•ดํ•˜๊ฒŒ ๋œ๋‹ค๋ฉด ์ฒ˜์น˜๊ฐ€ ๋žœ๋คํ•˜์ง€ ์•Š์•„๋„ ์ธ๊ณผ์ถ”๋ก ์€ ์‹ ๋ขฐํ•  ๋งŒ ํ• ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ดํŽด๋ณธ๋‹ค๊ณ  ํ•ด์„œ ์ด๋ฅผ ์‰ฝ๊ฒŒ ๋ฐœ๊ฒฌํ•˜๊ธฐ๋Š” ์–ด๋ ต๋‹ค. 

 

•  ๋จธ์‹ ๋Ÿฌ๋‹์€  ์ ์ ˆํ•œ ์ˆœ์„œ์— ๋”ฐ๋ผ ๋ฒ„ํŠผ๋“ค์„ ๋ˆ„๋ฅด๋Š” ๊ฒƒ์— ๋ถˆ๊ณผํ•˜์ง€๋งŒ, ์ธ๊ณผ ์ถ”๋ก ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์ƒ์‚ฐ๋˜๋Š” ๊ณผ์ •์— ๋Œ€ํ•ด ์ง„์ง€ํ•œ ์‚ฌ๊ณ ๋ฅผ ์š”ํ•œ๋‹ค

 

 

 

 

 

 

728x90

๋Œ“๊ธ€