๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

[The Brave and True] 4. Graphical causal model

by isdawell 2023. 6. 26.
728x90

 

๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”!

 

 

 

 

โ‘   ์ธ๊ณผ์— ๋Œ€ํ•ด ์ƒ๊ฐํ•ด๋ณด๊ธฐ 


 

โ—ฏ  Potential outcome ์— ๋Œ€ํ•œ ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ ๊ฐ€์ • 

 

 

•  ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ ๊ฐ€์ •์€ ์˜ค์ง ์ฒ˜์น˜์— ์˜ํ•œ ํšจ๊ณผ๋ฅผ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค  

•  X์— ๋Œ€ํ•œ conditioning : ๊ฐ€๋ น ์•ฝ์„ ์ฒ˜๋ฐฉํ•  ๋•Œ, ์‹ฌ๊ฐํ•œ ์ผ€์ด์Šค์˜ ํ™˜์ž์™€ ๋œ ์‹ฌ๊ฐํ•œ ์ผ€์ด์Šค์˜ ํ™˜์ž๋กœ ํ•˜์œ„ ๊ทธ๋ฃน์„ ๋‚˜๋ˆ„๊ณ  ์•ฝ์˜ ํšจ๊ณผ๋ฅผ ๋ถ„์„ํ•œ๋‹ค๋ฉด ๋” ๋ช…ํ™•ํ•œ ๊ทธ๋ฆผ์„ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค. 

 

 

โ—ฏ  ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ๋ชจํ˜• 

 

 

 

 

โ‘ก  ๊ทธ๋ž˜ํ”„ ๋ชจ๋ธ 


 

•  [์ฐธ๊ณ ] Coursera Stanford ๊ฐ•์˜ : Probabilistic Graphical models  

 

•  ๊ทธ๋ž˜ํ”„ ๋ชจํ˜•์ด ์ˆ˜๋ฐ˜ํ•˜๋Š” ๋…๋ฆฝ์„ฑ๊ณผ ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ์„ฑ ๊ฐ€์ •์ด ๋ฌด์—‡์ธ์ง€์— ๋Œ€ํ•ด ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ๋งค์šฐ ์ค‘์š”ํ•˜๋‹ค. 

 

 

โ—ฏ Blocked

 

 

•   Y๊ฐ€ ์กฐ๊ฑดํ™” ๋˜์—ˆ์„ ๋Œ€, X์™€ Z๋Š” ์„œ๋กœ ๋…๋ฆฝ์ด๋‹ค. 

 

 

•   ๋งค๊ฐœ๋ณ€์ˆ˜ B๋ฅผ ์กฐ๊ฑดํ™” ํ•˜๋ฉด A์—์„œ C๋กœ ํ–ฅํ•˜๋Š” ์ง์„ ์— ํ๋ฅด๋Š” ์˜์กด์„ฑ์ด ์ฐจ๋‹จ๋œ๋‹ค : A⊥C | B : blocked

 

 

โ—ฏ Fork  

 

 

•   ํ•œ ๋ณ€์ˆ˜๊ฐ€ ๋‘ ๊ฐœ์˜ ๋‹ค๋ฅธ ๋ณ€์ˆ˜์˜ ์›์ธ์ด ๋˜๋Š” ๊ฒฝ์šฐ, ์˜์กด์„ฑ์€ ํ™”์‚ดํ‘œ์˜ ์—ญ๋ฐฉํ–ฅ์œผ๋กœ ํ๋ฅด๊ณ  ์ด๋ฅผ backdoor path ๋ผ ๋ถ€๋ฅธ๋‹ค. 

•   ํ†ต๊ณ„ํ•™ ์ง€์‹์ด ์ธ๊ณผ์ถ”๋ก ๊ณผ ๊ธฐ๊ณ„ํ•™์Šต์— ๋Œ€ํ•ด ๋” ์ž˜ ์•Œ๊ฒŒํ•˜๋Š” ์›์ธ์ด ๋œ๋‹ค๊ณ  ํ•ด๋ณด์ž. ๋งŒ์•ฝ ํŠน์ • ํ•™์ƒ์˜ ํ†ต๊ณ„ํ•™ ์ง€์‹์˜ ์ˆ˜์ค€์— ๋Œ€ํ•ด ์ž˜ ์•Œ์ง€ ๋ชปํ•œ๋‹ค๊ณ  ํ•˜๊ณ , ์ธ๊ณผ์ถ”๋ก ์— ๋Šฅํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์•Œ๊ณ  ์žˆ๋‹ค๋ฉด ๊ธฐ๊ณ„ํ•™์Šต์„ ์ž˜ ํ•  ๊ฒƒ์ด๋ผ๊ณ  ์—ฌ๊ธธ ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋•Œ ํ†ต๊ณ„ํ•™ ์ง€์‹์„ ์กฐ๊ฑดํ™” ์‹œํ‚จ๋‹ค๋ฉด, ๊ธฐ๊ณ„ํ•™์Šต์— ๋Œ€ํ•œ ์ง€์‹๊ณผ ์ธ๊ณผ์ถ”๋ก ์— ๋Œ€ํ•œ ์ง€์‹์€ ๋…๋ฆฝ์ด ๋œ๋‹ค. 

 

•   A⊥B | C

 

 

โ—ฏ Collider 

 

•   ๋‘ ๊ฐœ์˜ ํ™”์‚ดํ‘œ๊ฐ€ ํ•˜๋‚˜์˜ ๋ณ€์ˆ˜์—์„œ ์ถฉ๋Œํ•˜๋Š” ๊ฒฝ์šฐ 

 

 

•   ์Šน์ง„์„ ํ•˜๊ธฐ ์œ„ํ•œ ๋‘ ๊ฐœ์˜ ๊ธธ๋กœ, ํ†ต๊ณ„ํ•™์„ ์ž˜ํ•˜๊ฑฐ๋‚˜ ์•„์ฒจ์„ ์ž˜ํ•˜๋Š” ๊ฒƒ์ด ์žˆ๋‹ค๊ณ  ํ•ด๋ณด์ž. ๋งŒ์•ฝ ์Šน์ง„์— ๋Œ€ํ•ด ์กฐ๊ฑดํ™”ํ•˜์ง€ ์•Š๋Š”๋‹ค๋ฉด,  ์Šน์ง„ ํ• ์ง€ ์•ˆํ• ์ง€ ์ „ํ˜€ ์•Œ ์ˆ˜ ์—†๊ณ , ํ†ต๊ณ„ํ•™ ์ˆ˜์ค€๊ณผ ์•„์ฒจํ•˜๋Š” ๊ฒƒ์€ ์„œ๋กœ ๋…๋ฆฝ์ด ๋œ๋‹ค. ์ฆ‰, ํ†ต๊ณ„ํ•™์„ ์ž˜ํ•˜๋Š”์ง€ ์•„๋Š” ๊ฒƒ์€ ์ƒ์‚ฌ์—๊ฒŒ ์•„์ฒจ์„ ์–ผ๋งˆ๋‚˜ ์ž˜ํ•˜๋Š”์ง€์— ๋Œ€ํ•ด ์•Œ๋ ค์ฃผ๋Š” ๋ฐ”๊ฐ€ ์—†๋‹ค. ํ•œํŽธ ๋งŒ์•ฝ ์Šน์ง„ํ–ˆ๋‹ค๋ฉด (์กฐ๊ฑดํ™” ํ•œ๋‹ค๋ฉด), ํ†ต๊ณ„ํ•™ ์ˆ˜์ค€์„ ์•„๋Š” ๊ฒƒ์€ ์•„์ฒจ ์ˆ˜์ค€์— ๋Œ€ํ•ด์„œ๋„ ๋งํ•ด์ค„ ์ˆ˜ ์žˆ๋‹ค. ํ†ต๊ณ„๋ฅผ ์ž˜ ๋ชปํ•˜๋Š”๋ฐ ์Šน์ง„ํ–ˆ๋‹ค๋ฉด, ์•„์ฒจ์„ ์ž˜ํ•˜๋Š” ์‚ฌ๋žŒ์ด์–ด์„œ ์Šน์ง„ํ–ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค (๋ฐ˜๋Œ€๋„ ๋งˆ์ฐฌ๊ฐ€์ง€) 

 

•   collider ์— ๋Œ€ํ•ด ์กฐ๊ฑดํ™” ํ•˜๋Š” ๊ฒƒ์€ dependence path ๋ฅผ ์—ด์–ด์ค€๋‹ค : A⊥B 

Aใ…—B ์™€ ๊ฐ™์Œ

 

→ C (์Šน์ง„) ์„ ์กฐ๊ฑดํ™” ํ•œ๋‹ค๋ฉด, A (ํ†ต๊ณ„๋ฅผ ์ž˜ํ•˜๋Š”๊ฑฐ) ์™€ B (์•„์ฒจ์„ ์ž˜ํ•˜๋Š”๊ฑฐ) ๋Š” ์˜์กด์ด ๋œ๋‹ค.

 

 

โ—ฏ ๊ทธ๋ž˜ํ”„์—์„œ ๋…๋ฆฝ์„ฑ๊ณผ ์˜์กด์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ทธ๋ฆผ

 

๋๋ถ€๋ถ„์— ์„ ์ด ๊ทธ์–ด์ง„ ํ™”์‚ดํ‘œ๋Š” ๋…๋ฆฝ์„ ์˜๋ฏธ, ์„ ์ด ์—†๋Š” ํ™”์‚ดํ‘œ๋Š” ์˜์กด์„ ์˜๋ฏธ

 

 

 

 

 

 

 

โ‘ข  ๊ต๋ž€ํŽธํ–ฅ : Confounding Bias


 

•   ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ๋ชจํ˜•์€ ์ธ๊ณผ์ถ”๋ก ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ํŽธํ–ฅ์„ ๋ฐœ๊ฒฌํ•˜๋Š” ๋„๊ตฌ๊ฐ€ ๋œ๋‹ค. 

 

 

 

 

•   ํŽธํ–ฅ์˜ ์ค‘์š”ํ•œ ์›์ธ ์ค‘ ์ฒซ๋ฒˆ์งธ๋Š” ๊ต๋ž€๋ณ€์ˆ˜ (confounding) ์ด๋‹ค. Confounder ๋Š” Treatment ์™€ Outcome ๋ชจ๋‘๊ฐ€ X (์›์ธ) ์— ์˜ํ•ด ์˜ํ–ฅ์„ ๋ฐ›์„ ๋•Œ ๋ฐœ์ƒํ•œ๋‹ค. 

โ†ช ex. T : ๊ต์œก, Y : ์ž„๊ธˆ, X : ์ง€๋Šฅ โ‡จ ๊ต์œก ๋ฐ›์€ ์‚ฌ๋žŒ๋“ค์ด ๋˜‘๋˜‘ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋” ๋งŽ์€ ๋ˆ์„ ๋ฒ„๋Š” ๊ฒƒ์ธ์ง€, ๊ต์œก์„ ๋” ๋ฐ›์€ ๊ฒƒ ๋•Œ๋ฌธ์— ์ž„๊ธˆ์ด ๋†’์•„์ง„ ๊ฒƒ์€ ์•„๋‹ˆ๋ผ๊ณ  ์ฃผ์žฅํ•  ์ˆ˜ ์žˆ๋‹ค. 

 

•   ์ธ๊ณผํšจ๊ณผ๋ฅผ ๊ทœ๋ช…ํ•˜๋ ค๋ฉด ์ฒ˜์น˜์™€ ๊ฒฐ๊ณผ ์‚ฌ์ด์˜ ๋ชจ๋“  backdoor path ๋ฅผ ๋ง‰์•„์•ผ ํ•œ๋‹ค : T → Y

โ†ช ex. ์ง€๋Šฅ ์ˆ˜์ค€์„ ํ†ต์ œํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด, ์ฆ‰, ๋™์ผ ์ˆ˜์ค€์˜ ์ง€๋Šฅ์„ ๊ฐ€์ง€์ง€๋งŒ ๊ต์œก ์ˆ˜์ค€์ด ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์„ ๋น„๊ต ํ•œ๋‹ค๋ฉด ์ž„๊ธˆ ์ฐจ์ด์˜ ๊ฒฐ๊ณผ๋Š” ์˜ค์ง ๊ต์œก ์ˆ˜์ค€์˜ ์ฐจ์ด์— ์˜ํ•ด ๊ฒฐ์ •๋  ๊ฒƒ์ด๋‹ค. 

 

 

•   ๊ทธ๋Ÿฌ๋‚˜ ๋ชจ๋“  ๊ณตํ†ต ์›์ธ์„ ํ•ญ์ƒ ํ†ต์ œํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค. ๊ฐ€๋” ์•Œ๋ ค์ง€์ง€ ์•Š์€ ์›์ธ, ์ธก์ •ํ•  ์ˆ˜ ์—†๋Š” (์œ„์˜ ์˜ˆ์‹œ์—์„œ ์ง€๋Šฅ๊ณผ ๊ฐ™์€ ๋ณ€์ˆ˜ = U ๋กœ ํ‘œ๊ธฐ) ์›์ธ๋„ ์žˆ๋‹ค. 

 

 

•   ์—ฌ๊ธฐ์„œ ์ธก์ •ํ•  ์ˆ˜ ์—†๋Š” ์ง€๋Šฅ ๋Œ€์‹ ์—, SAT ์‹œํ—˜์ ์ˆ˜ (= Proxy) ๋ฅผ ํ†ต์ œํ•  ์ˆ˜๋Š” ์žˆ๋‹ค. ์ง€๋Šฅ์ด SAT ์‹œํ—˜์—์„œ ์ข‹์€ ์ ์ˆ˜๋ฅผ ๋ฐ›๋Š”๋ฐ์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๊ณ  SAT ์€ ์ข‹์€ ๋Œ€ํ•™์— ๊ฐˆ ๊ฐ€๋Šฅ์„ฑ์„ ์—ด์–ด ๊ต์œก ์ˆ˜์ค€์„ ๊ฒฐ์ •ํ•œ๋‹ค. ์œ„์˜ ๊ทธ๋ž˜ํ”„์—์„œ X1๊ณผ X2 ํ˜น์€ SAT ๊ณผ ๊ฐ€์กฑ์˜ ์†Œ๋“์ˆ˜์ค€์— ๋Œ€ํ•ด ์กฐ๊ฑดํ™” ํ•˜๋Š” ๊ฒƒ์€ ์ฒ˜์น˜์™€ ๊ฒฐ๊ณผ ์‚ฌ์ด์˜ backdoor path ๋ฅผ ๋ง‰๊ธฐ์— ์ถฉ๋ถ„ํ•˜๋‹ค โ‡จ (Y0, Y1) ⊥ T | X1, X2

 

•   ๋ชจ๋“  ๊ณตํ†ต์˜ ์›์ธ์„ ๋‹ค ์ธก์ •ํ•˜์ง€๋Š” ๋ชปํ•˜์ง€๋งŒ, ์ธก์ • ๋ถˆ๊ฐ€๋Šฅํ•œ ๋ณ€์ˆ˜๋“ค์ด ์ฒ˜์น˜์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ๋งค๊ฐœํ•˜๋Š” ์ธก์ • ๊ฐ€๋Šฅํ•œ ๋ณ€์ˆ˜๋“ค์„ ํ†ตํ•ด ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค. 

 

 

•   ๋งŒ์•ฝ, ์ธก์ • ๋ถˆ๊ฐ€๋Šฅํ•œ ๋ณ€์ˆ˜๊ฐ€ ์ฒ˜์น˜์™€ ๊ฒฐ๊ณผ์˜ "์ง์ ‘์ ์ธ" ์›์ธ์„ ๊ฐ€์ง„๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ๋ ๊นŒ : ๊ต๋ž€ ๋ณ€์ˆ˜์˜ proxy ๊ฐ€ ๋˜๋Š” ๋‹ค๋ฅธ ์ธก์ • ๋ณ€์ˆ˜๋“ค์ด ์žˆ๋‹ค. ์•„๋ž˜ ๊ทธ๋ž˜ํ”„์™€ ๊ฐ™์€ ๊ฒฝ์šฐ์—์„œ backdoor path ์— ์žˆ์ง€๋Š” ์•Š์ง€๋งŒ, ์ด๋Ÿฐ ๋ณ€์ˆ˜๋“ค์„ ํ†ต์ œํ•˜๋Š” ๊ฒƒ ์ž์ฒด๊ฐ€ ํŽธํ–ฅ์„ ์ค„์ด๋Š”๋ฐ์—๋Š” ๋„์›€์ด ๋œ๋‹ค. ์ด๋Ÿฌํ•œ ๋ณ€์ˆ˜๋“ค์„ ๋Œ€๋ฆฌ ๊ต๋ž€ ๋ณ€์ˆ˜ (surrogate confounders) ๋ผ๊ณ ๋„ ๋ถ€๋ฅธ๋‹ค. ๋Œ€๋ฆฌ๋ณ€์ˆ˜๋“ค์„ ํ†ต์ œํ•˜๋Š” ๊ฒƒ์€ ํŽธํ–ฅ์„ ์•„์˜ˆ ์ œ๊ฑฐํ•˜์ง„ ๋ชปํ•˜์ง€๋งŒ ๋„์›€์€ ๋œ๋‹ค. 

 

 

 

 

โ‘ฃ  ์„ ํƒํŽธํ–ฅ : Selection bias


 

•  ๊ทธ๋ ‡๋‹ค๋ฉด, Confounding bias ๋ฅผ ์ œ๊ฑฐํ•˜๊ธฐ ์œ„ํ•ด ์ธก์ • ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ๋ณ€์ˆ˜๋ฅผ ๋ชจ๋ธ์— ์ถ”๊ฐ€ํ•˜๋Š” ๊ฒƒ์ด ์ข‹์€ ์•„์ด๋””์–ด๋ผ๊ณ  ์ƒ๊ฐํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค → ๋‹น์—ฐํžˆ ์•„๋‹ˆ๋‹ค! 

 

•  ํŽธํ–ฅ์„ ๋ฐœ์ƒ์‹œํ‚ค๋Š” ๋‘ ๋ฒˆ์งธ ์ค‘์š”ํ•œ ์›์ธ์€ "Selection bias" ๋‹ค. ๊ต๋ž€ ํŽธํ–ฅ์ด ๊ณตํ†ต ์›์ธ์„ ํ†ต์ œํ•˜์ง€ ์•Š์„ ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ๊ฒƒ์ด๋ผ๋ฉด, ์„ ํƒ ํŽธํ–ฅ์€ ๊ทธ๊ฒƒ์˜ ํšจ๊ณผ์™€ ๋” ๊ด€๋ จ์ด ์žˆ๋‹ค.

 

 

 

•  Randomized experiment ๊ฐ€ ๊ฐ€๋Šฅํ•œ ์ƒํ™ฉ์—์„œ ๊ต์œก์ด ์ž„๊ธˆ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์ธก์ •ํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•ด๋ณด์ž. ๊ต๋ž€์„ ์ œ๊ฑฐํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๋ณ€์ˆ˜๋ฅผ ํ†ต์ œํ•œ๋‹ค๊ณ  ํ•  ๋•Œ, "ํˆฌ์ž" ๋ณ€์ˆ˜๋ฅผ ํ†ต์ œํ•œ๋‹ค๊ณ  ํ•ด๋ณด์ž. ๊ทธ๋Ÿฌ๋‚˜ ํˆฌ์ž ๋ณ€์ˆ˜๋Š” ๊ต์œก๊ณผ ์ž„๊ธˆ์˜ ๊ณตํ†ต ์›์ธ์ด ๋˜์ง€ ์•Š๋Š”๋‹ค. ์‚ฌ์‹ค ๊ฒฐ๊ณผ์— ๊ฐ€๊นŒ์šด ๋ณ€์ˆ˜์ด๋‹ค. ์ฆ‰, Collider ์— ๊ฐ€๊นŒ์šด ๋ณ€์ˆ˜์ด๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ฅผ ์กฐ๊ฑดํ™” ํ•œ๋‹ค๋ฉด Treatment ์™€ Outcome ์‚ฌ์ด์— ๋˜ ๋‹ค๋ฅธ ๊ฒฝ๋กœ๋ฅผ ์—ด๊ฒŒ ๋˜๊ณ  ๋”ฐ๋ผ์„œ ์ง์ ‘์ ์ธ ์ธก์ •์„ ํ•˜๊ธฐ๊ฐ€ ๋” ์–ด๋ ค์›Œ์ง„๋‹ค. 

 

 

 

•  ๋น„์Šทํ•œ ์ƒํ™ฉ์œผ๋กœ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์กฐ๊ฑดํ™” ํ•  ๋•Œ์—๋„ selection bias ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. ๋งค๊ฐœ๋ณ€์ˆ˜๋ž€, ์ฒ˜์น˜์™€ ๊ฒฐ๊ณผ ์‚ฌ์ด์— ์กด์žฌํ•˜๋Š” ๋ณ€์ˆ˜๋กœ ์ธ๊ณผ์  ํšจ๊ณผ๋ฅผ ๋งค๊ฐœํ•œ๋‹ค. ๊ฐ€๋ น ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ ํ™”์ดํŠธ์นผ๋ผ ์ง์—…์˜ ์—ฌ๋ถ€๋ผ๊ณ  ํ•œ๋‹ค๋ฉด, Treatment ์— ์ž‘์šฉํ•˜๋Š” ์ฑ„๋„ ์ค‘ ํ•˜๋‚˜๋ฅผ ๋ง‰์•„๋ฒ„๋ฆฐ๋‹ค. ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์กฐ๊ฑดํ™” ์‹œํ‚จ๋‹ค๋ฉด ์Œ์ˆ˜ ํŽธํ–ฅ์„ ์ผ์œผ์ผœ ๊ต์œก์˜ ํšจ๊ณผ๋ฅผ ์‹ค์ œ๋ณด๋‹ค ๋” ์ž‘๊ฒŒ ๋งŒ๋“ ๋‹ค. (์—ฌ๊ธฐ์„œ๋Š” ์ธ๊ณผ ํšจ๊ณผ๊ฐ€ ๊ต์œก์„ ๋” ๋งŽ์ด ๋ฐ›์œผ๋ฉด ์ž„๊ธˆ์ด ๋†’์•„์ง„๋‹ค๋Š” ์–‘์ˆ˜์ด๊ธฐ ๋•Œ๋ฌธ์— ์Œ์ˆ˜ ํŽธํ–ฅ์„ ๋ฐœ์ƒ์‹œํ‚จ๋‹ค๊ณ  ํ•ด์„ํ•œ๋‹ค. ๋งŒ์•ฝ ํšจ๊ณผ๊ฐ€ ์Œ์˜ ๊ฒฝ์šฐ์—๋Š” ๋งค๊ฐœ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ์กฐ๊ฑดํ™”๊ฐ€ ์–‘์˜ ํŽธํ–ฅ์„ ๊ฐ€์ง„๋‹ค๊ณ  ์ด์•ผ๊ธฐ ํ•œ๋‹ค) ๋ชจ๋“  ์ด๋Ÿฌํ•œ ์ข…๋ฅ˜์˜ ์กฐ๊ฑดํ™”๋Š” ํšจ๊ณผ๋ฅผ ์‹ค์ œ๋ณด๋‹ค ์•ฝํ•˜๊ฒŒ ๋ณด์ด๊ฒŒ ๋งŒ๋“ ๋‹ค. 

 

 

 

 

๐Ÿ‘€ ํ•ต์‹ฌ ์ •๋ฆฌ


 

โ‘  ๊ทธ๋ž˜ํ”„์—์„œ ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ์˜ ๊ทœ์น™ 

 

โ‘ก ํŽธํ–ฅ์œผ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ๋Š” 3๊ฐ€์ง€ ๊ตฌ์กฐ

  •  Confounding : ์ฒ˜์น˜์™€ ๊ฒฐ๊ณผ๊ฐ€ ์šฐ๋ฆฌ๊ฐ€ ๊ณ„์‚ฐํ•˜๊ฑฐ๋‚˜ ํ†ต์ œํ•  ์ˆ˜ ์—†๋Š” ๊ณตํ†ต์˜ ์›์ธ์„ ๊ฐ€์ง€๊ณ  ์žˆ์„ ๋•Œ ๋ฐœ์ƒ 

  •  Selection bias : ๋™์ผํ•œ ํšจ๊ณผ์— ๋Œ€ํ•œ ์กฐ๊ฑดํ™”๋กœ ์ธํ•ด ๋ฐœ์ƒ ( conditioning on a common effect ) 

  •  Selection bias ์˜ ํ•œ ํ˜•ํƒœ๋กœ ๋งค๊ฐœ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๊ณผ๋„ํ•œ ํ†ต์ œ๋กœ ๋ฐœ์ƒ 

 

 

 

 

 

728x90

๋Œ“๊ธ€