๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

์ธ๊ณผ์ถ”๋ก ์˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ - ๋ฌด์ž‘์œ„ ํ†ต์ œ ์‹คํ—˜

by isdawell 2023. 4. 21.
728x90

์ฐธ๊ณ ์˜์ƒ : Bootcamp 2-2. ๋ฌด์ž‘์œ„ ํ†ต์ œ์‹คํ—˜ 

 

 

 

1. Random assignment 


 

•  ๋žœ๋คํ•˜๊ฒŒ group ์„ ํ• ๋‹นํ•˜๋ฉด ์ง‘๋‹จ ๊ฐ„ ํŠน์„ฑ์ด ๋น„์Šทํ•ด์ง„๋‹ค. 

 

 

โ—ฏ  Potential Outcomes ๊ด€์ ์—์„œ ์ธ๊ณผ์ถ”๋ก ์˜ ์ˆ˜์ค€ 

 

 

 

 

•  ์•„๋ž˜๋กœ ๊ฐˆ์ˆ˜๋ก ์ธ๊ณผ์ถ”๋ก ์„ ์ฆ๋ช…ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฐฉ๋ฒ•๋ก , ์œ„๋กœ ๊ฐˆ์ˆ˜๋ก ์ฆ๋ช…ํ•˜๊ธฐ ์‰ฌ์šด ๋ฐฉ๋ฒ•๋ก 

 

•  ๊ฐ€์žฅ ์ธ๊ณผ์ถ”๋ก ์˜ ์ˆ˜์ค€์ด ๋†’์€ ๊ฒƒ์€ Randomized Controlled trial ์ด๋‹ค. (RCT) 

 

•  ํ˜„์‹ค ์ƒํ™ฉ์—์„œ๋Š” ๋ฌด์ž‘์œ„ ์‹คํ—˜์„ ํ•˜๊ธฐ ์–ด๋ ค์šด ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค. ๋”ฐ๋ผ์„œ, ์‹คํ—˜๊ณผ ์œ ์‚ฌํ•œ ์ƒํ™ฉ์„ ๋„์ž…ํ•˜๋Š” ๊ฒƒ์„ ์ค€์‹คํ—˜ (Quasi-Experiment) ๋ฅผ ์ˆ˜ํ–‰ํ•œ๋‹ค. ๋งŒ์•ฝ ์ค€์‹คํ—˜๋„ ์‹คํ–‰ํ•˜๊ธฐ ์–ด๋ ค์šด ์ƒํ™ฉ์ด๋ผ๋ฉด, ๋‚ด์ƒ์„ฑ์„ ์ œ๊ฑฐํ•˜๊ธฐ ์œ„ํ•œ ํ†ต๊ณ„์ ์ธ ๋„๊ตฌ์ธ Instrumental variable ๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. 

 

•  ์ค€์‹คํ—˜๋„ ํ•˜๊ธฐ ์–ด๋ ต๊ณ  ์ ์ ˆํ•œ ๋„๊ตฌ๋ณ€์ˆ˜๋„ ์ฐพ๊ธฐ ์–ด๋ ต๋‹ค๋ฉด ๋งˆ์ง€๋ง‰์œผ๋กœ ๊ณ ๋ คํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” Regression ๊ณผ Matching ์ด ์žˆ๋‹ค. ์ถ”๋ก  ์ง€์‹์ด๋‚˜ ์ด๋ก ์— ์˜ํ•ด ์ž˜ ๋””์ž์ธ๋œ ํšŒ๊ท€๋‚˜ ๋งค์นญ์„ ํ™œ์šฉํ•œ๋‹ค๋ฉด ์–ด๋Š์ •๋„๋Š” ์ธ๊ณผ์ถ”๋ก ์„ ํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค. 

 

 

 

•  Random assignment ๋Š” ๋™์ „๋˜์ง€๊ธฐ์™€ ๋น„์Šทํ•˜๋‹ค. ํ†ต๊ณ„ํ•™์˜ ํฐ ์ˆ˜์˜ ๋ฒ•์น™์„ ์ƒ๊ฐํ•˜๋ฉด ๋œ๋‹ค. 

 

•  ๊ฐ€๋ น ๋™์ „์„ ๋˜์ ธ์„œ ์•ž๋ฉด์ด ๋‚˜์˜ค๋ฉด treatment ์— ํ• ๋‹นํ•˜๊ณ , ๋’ท๋ฉด์ด ๋‚˜์˜ค๋ฉด control ์— ํ• ๋‹นํ•จ์œผ๋กœ์จ treatment ๋ฅผ ์ œ์™ธํ•œ ๋‚˜๋จธ์ง€ ์š”์ธ๋“ค์„ ๊ฐ group ์— ๋ฐ˜๋ฐ˜์œผ๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ๋‹ค. Ceteris Paribus ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š” group ์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค. 

 

 

•  random ํ•˜๊ฒŒ ์ž˜ ๋ถ„๋ฆฌ๋œ ๊ทธ๋ฃน์œผ๋กœ ์‹คํ—˜์„ ์ง„ํ–‰ํ•˜๋ฉด, treatment (cause) ๋กœ ์ธํ•ด Potential outcome ์— ์ฐจ์ด๊ฐ€ ๋‚œ ๊ฒƒ์ด๋ผ๊ณ  ํ•ฉ๋ฆฌ์ ์œผ๋กœ ํ•ด์„ํ•ด ๋ณผ ์ˆ˜ ์žˆ๋‹ค. 

 

 

 

 

 

2. Example of a randomized experiment 


 

•  726๋ช…์˜ ์œก๊ตฐ์‚ฌ๊ด€ํ•™๊ต ํ•™์ƒ๋“ค์ด ๊ฒฝ์ œํ•™ ๊ด€๋ จ ์‹œํ—˜์„ ๋ณผ ๋•Œ, ๊ณผ์—ฐ ํ…Œ๋ธ”๋ฆฟ์ด๋‚˜ ๋žฉํƒ‘์˜ ์‚ฌ์šฉ์ด ๊ธฐ๋ง๊ณ ์‚ฌ ์‹œํ—˜์— ๊ธ์ •์ ์ธ ์˜ํ–ฅ์„ ๋ผ์น˜๋Š”์ง€์— ๋Œ€ํ•œ ์‹คํ—˜์„ ์ง„ํ–‰ํ–ˆ๊ณ , ๊ฐ group ์˜ ๋ฐฐ์ •์€ random ํ•˜๊ฒŒ ์ง„ํ–‰ํ–ˆ๋‹ค. 

 

 

โ‡จ  ๋žฉํƒ‘๊ณผ ํƒœ๋ธ”๋ฆฟ์„ ํ—ˆ์šฉํ•œ ๊ทธ๋ฃน : Treatment group1 

โ‡จ  ํƒœ๋ธ”๋ฆฟ ์‚ฌ์šฉ์„ ํ—ˆ์šฉํ•˜์ง€๋งŒ ์•ฝ๊ฐ„์˜ ์ œ์•ฝ์ด ์žˆ๋Š” ๊ทธ๋ฃน : Treatment group2 

โ‡จ  ์ปดํ“จํ„ฐ ์‚ฌ์šฉ์ด ๊ธˆ์ง€๋œ ๊ทธ๋ฃน : Control group 

 

 

•  Randomization ์ด ์ž˜ ๋˜์—ˆ๋”๋ผ๋ฉด ๊ทธ๋ฃน ๋‚ด์—์„œ ๋‚˜์ด, ํ•™๋…„, ์ด์ „์˜ GPA ์˜ ์š”์ธ๋“ค์ด ๋น„์Šทํ•ด์ ธ์•ผ ํ•จ : ์ฆ‰, selection bias ๊ฐ€ ์—†์–ด์•ผ ํ•œ๋‹ค. treatment ๋ฅผ ์ œ์™ธํ•œ ๋‚˜๋จธ์ง€ ์š”์ธ๋“ค์ด ๊ทธ๋ฃน ๋‚ด์—์„œ ๋น„์Šทํ•˜๋‹ค๋ผ๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ฃผ์–ด์•ผ ํ•œ๋‹ค. ์œ„์™€ ๊ฐ™์€ ํ‘œ๋ฅผ ํ†ตํ•ด ์„ฑ์ ์— ์˜ํ–ฅ์„ ์ค„ ์ˆ˜ ์žˆ๋Š” ์—ฌ๋Ÿฌ๊ฐ€์ง€ ํŠน์„ฑ๋“ค์˜ ์œ ์‚ฌ์„ฑ์„ ๋ณด์—ฌ์ฃผ์–ด์•ผ ํ•œ๋‹ค. 

 

์‹คํ—˜๊ฒฐ๊ณผ

 

•  ๋งŒ์•ฝ Randomization ์ด ์ž˜ ๋œ ๊ฒƒ์ด๋ผ๋ฉด Demographic controls ๋ฅผ ์ถ”๊ฐ€์‹œํ‚จ ๋ฒ„์ „๊ณผ ์ถ”๊ฐ€์‹œํ‚ค์ง€ ์•Š์€ ๋ฒ„์ „์˜ ๊ฒฐ๊ณผ๊ฐ€ ์œ ์‚ฌํ•ด์•ผ ํ•  ๊ฒƒ์ด๋‹ค. 

 

•  RCT ๊ฐ€ ๋งŒ์กฑ๋œ๋‹ค๋ฉด ์ธ๊ณผ์ถ”๋ก  ์—ฐ๊ตฌ๋Š” ์ „ํ˜€ ๋ฌธ์ œ๋  ๊ฒƒ์ด ์—†๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํ˜„์‹ค์—์„œ๋Š” RCT ๊ฐ€ ๋ถˆ๊ฐ€๋Šฅํ•œ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค โ‡จ ์ธ๊ณผ์ถ”๋ก ์ด ๊ณ„์† ๋ฐœ์ „ํ•ด์•ผ ํ•˜๋Š” ์ด์œ  

 

 

 

 

 

 

728x90

๋Œ“๊ธ€