๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

์ธ๊ณผ์ถ”๋ก ์˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ - ์ธ๊ณผ๊ทธ๋ž˜ํ”„

by isdawell 2023. 4. 28.
728x90

์ฐธ๊ณ ์˜์ƒ : Bootcamp 5-1. ์ธ๊ณผ๊ทธ๋ž˜ํ”„ 

 

 

โ–ธ Causal graph : Directed Acyclic graph and Bayesian network 

 

 

 

 

1. Causal graph (diagram) 


 

•  ์ธ๊ณผ๊ด€๊ณ„ ๊ตฌ์กฐ๋ฅผ ๊ทธ๋ž˜ํ”„๋กœ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ• 

 

 

 

โ—ฏ  Directed Acyclic Graph (DAG) 

 

•  Graph : ๊ฐ ๋…ธ๋“œ๋Š” ๊ฐ ๋ณ€์ˆ˜๋ฅผ ๋œปํ•˜๊ณ , ๋…ธ๋“œ๋“ค ๊ฐ„์˜ ์—ฃ์ง€๊ฐ€ ๋ณ€์ˆ˜๋“ค ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. 

•  Directed : ์—ฃ์ง€์— ๋ฐฉํ–ฅ์„ฑ์ด ์žˆ๋‹ค๋Š” ๋œป์œผ๋กœ, ์›์ธ๊ณผ ๊ฒฐ๊ณผ์˜ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. 

•  Acyclic : Cyclic ์˜ ๋ฐ˜๋Œ€๋ง๋กœ, ์ˆœํ™˜๊ณ ๋ฆฌ๊ฐ€ ์—†๋‹ค๋Š” ๋œป์ด๋‹ค. ์—ญ์ธ๊ณผ๊ด€๊ณ„๊ฐ€ ์„ฑ๋ฆฝํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค. 

 

 

 

โ—ฏ  Bayesian Network (Belief Network) 

 

•  DAG ๋ฅผ ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ๋กœ ๋„์‹ํ™”ํ•œ ๊ฒƒ 

•  ๋ฒ ์ด์ง€์•ˆ ๋„คํŠธ์›Œํฌ 

 

 

 

 

 

 

2. Relationship types in causal graph 


 

โ—ฏ  ์ธ๊ณผ๊ทธ๋ž˜ํ”„ ์ข…๋ฅ˜ 

 

 

 

•  Direct causal effect : ์›์ธ๋ณ€์ˆ˜๊ฐ€ ๊ฒฐ๊ณผ๋ณ€์ˆ˜์— ์ง์ ‘ ์˜ํ–ฅ์„ ์ฃผ๋Š” ๊ฒฝ์šฐ

 

•  Mediator (Chain) : ๊ฐ„์ ‘์ ์œผ๋กœ ์ค‘์žฌ์š”์ธ mediator๋ฅผ ํ†ตํ•ด ์˜ํ–ฅ์„ ์ฃผ๋Š” ๊ฒฝ์šฐ 

โ†ช  ์šด๋™์ด ํ์•”๋ฐœ๋ณ‘์— ์ง์ ‘์ ์œผ๋กœ ์˜ํ–ฅ์„ ์ค„ ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ฉด์—ญ์ฒด๊ณ„ ๊ฐœ์„ ์ด๋ผ๋Š” mediator๋ฅผ ํ†ตํ•ด ๊ฐ„์ ‘์ ์œผ๋กœ ์˜ํ–ฅ์„ ์ค„ ์ˆ˜ ์žˆ๋‹ค. 

 

•  Confounder (Fork) : ์›์ธ๋ณ€์ˆ˜์™€ ๊ฒฐ๊ณผ๋ณ€์ˆ˜ ๋ชจ๋‘์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ๋ณ€์ˆ˜ 

โ†ช  ํก์—ฐํ•˜๋Š” ์‚ฌ๋žŒ๋“ค์€ ์ƒ๋Œ€์ ์œผ๋กœ ์šด๋™์„ ๋œํ•˜๊ณ , ํ์•” ๋ฐœ๋ณ‘ ํ™•๋ฅ ์„ ๋†’์ธ๋‹ค. 

โ†ช  confounder ๋Š” treatment ์ด์ „์— ๋‚˜ํƒ€๋‚œ๋‹ค → pre-treatment variable 

 

•  Collider (immorality) : ์›์ธ๋ณ€์ˆ˜์™€ ๊ฒฐ๊ณผ๋ณ€์ˆ˜ ๋ชจ๋‘์— ์˜ํ–ฅ์„ ๋ฐ›๋Š” ๋ณ€์ˆ˜ (๊ณตํ†ต์˜ ๊ฒฐ๊ณผ)

โ†ช  ๊ต๋Œ€๊ทผ๋ฌด๊ฐ€ ์ˆ˜๋ฉด์„ฑ ๋ฌดํ˜ธํก์ฆ์— ์ง์ ‘์ ์œผ๋กœ ์˜ํ–ฅ์„ ์ค„ ์ˆ˜ ์žˆ๋‹ค. ๋ฐ˜๋ฉด ๊ต๋Œ€๊ทผ๋ฌด๋ฅผ ํ•˜๋ฉด ์กธ์Œ์ฆ์ด ๋†’์•„์ง€๊ณ  ๋งˆ์ฐฌ๊ฐ€์ง€๊ณ  ์ˆ˜๋ฉด์„ฑ ๋ฌดํ˜ธํก์ฆ์ด ์กธ์Œ์ฆ์— ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ๋‹ค. 

โ†ช  Collider ๋Š” treatment๋ฅผ ๋ฐ›์€ ๊ฒฐ๊ณผ์ด๊ธฐ ๋•Œ๋ฌธ์— ์ดํ›„์— ๋‚˜ํƒ€๋‚œ๋‹ค → post-treatment variable 

 

 

•  ์ด๋Ÿฌํ•œ ๊ทธ๋ž˜ํ”„๋ฅผ ๊ทธ๋ฆฌ๋Š” ์ด์œ ๋Š” causal effect ๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ฐœํ˜„๋˜๊ณ , ๋ฐฉํ•ด๋˜๋Š” ์š”์ธ๋“ค์€ ๋ฌด์—‡์ด๊ณ , ์ƒ๊ด€๊ด€๊ณ„๋Š” ์–ด๋–ป๊ฒŒ ๋˜๋Š”์ง€ ๋ถ„์„ํ•˜๊ธฐ ์œ„ํ•จ 

 

 

 

 

 

 

3. Association in Causal Graph 


 

โ—ฏ  Backdoor paths 

 

•  ๊ทธ๋ž˜ํ”„ ์ƒ์—์„œ์˜ ์ •๋ณด์˜ ํ๋ฆ„์„ ํ†ตํ•ด ๋ณ€์ˆ˜๋“ค ๊ฐ„ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ์ดํ•ดํ•ด ๋ณผ ์ˆ˜ ์žˆ๋‹ค. 

•  ๊ฐ ๋…ธ๋“œ๋Š” ํ™”์‚ดํ‘œ๋ฅผ ํ†ตํ•ด ํ˜๋Ÿฌ๊ฐ„๋‹ค. 

•  X : ์›์ธ๋ณ€์ˆ˜, Y : ๊ฒฐ๊ณผ๋ณ€์ˆ˜ 

 

 

•  B์˜ ์ •๋ณด๋Š” A๋ฅผ ํ†ตํ•ด X ๋กœ ํ˜๋Ÿฌ๊ฐ€๊ณ , Z๋ฅผ ํ†ตํ•ด์„œ Y๋กœ ํ˜๋Ÿฌ๊ฐ„๋‹ค. X์™€ Y๋Š” ๊ณตํ†ต์ ์œผ๋กœ B์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ๊ณตํ†ต์˜ ์ •๋ณด์˜ ํ๋ฆ„์ด ์—ฐ๊ฒฐ๋˜๋Š” ๊ฒƒ์„ path๋ผ๊ณ  ํ•œ๋‹ค. X-A-B-Z-Y ๊ฐ€ ํ•˜๋‚˜์˜ path ๊ฐ€ ๋œ๋‹ค. ์ด๋Ÿฌํ•œ path๋Š” ์—ฌ๋Ÿฌ ๊ฐœ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค. 

 

•  X→W→Y ๊ฐ€ causal path ๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๊ณ , ์ด๋ฅผ ์ œ์™ธํ•œ ๋‚˜๋จธ์ง€์˜ non-causal path๋ฅผ backdoor path ๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. backdoor path๋ฅผ ์ „๋ถ€ ์ฐจ๋‹จํ•  ์ˆ˜ ์žˆ๋‹ค๋ฉด, ํ™•์‹คํ•œ causal path๋ฅผ ์–ป์–ด๋‚ผ ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰, ์ธ๊ณผ์ถ”๋ก ์˜ ํ•ต์‹ฌ์€ ์ด backdoor path๋ฅผ ์–ด๋–ป๊ฒŒ ์ฐจ๋‹จํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ธ๊ฐ€์— ๋‹ฌ๋ ค์žˆ๋‹ค. 

 

 

 

โ—ฏ  ์šฉ์–ด์ •๋ฆฌ 

 

 

•  d-separated : causal graph ์—์„œ X, Y ๋‘ ๋ณ€์ˆ˜ ๊ฐ„์˜ ์ •๋ณด์˜ ํ๋ฆ„์ด ๋ง‰ํ˜€์žˆ๋Š” ์ƒํ™ฉ์„ ์˜๋ฏธํ•œ๋‹ค. path๊ฐ€ ์ฐจ๋‹จ๋˜์–ด ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐฉํ–ฅ์ ์œผ๋กœ ๋ถ„๋ฆฌ๋˜์–ด ์žˆ๋‹ค๊ณ  ํ‘œํ˜„ํ•œ๋‹ค. 

โ†ช  (X-C-D), E, Y : D์—์„œ Y๋กœ ๊ฐˆ ์ˆ˜ ์—†๊ณ , E์—์„œ๋„ X๋กœ ๊ฐˆ ์ˆ˜ ์—†๋‹ค. 

 

•  d-connected : path ๊ฐ€ ์—ฐ๊ฒฐ๋˜์–ด ์ž‡๋Š” ๊ฒฝ์šฐ๋ฅผ ์˜๋ฏธํ•œ๋‹ค. 

โ†ช  X-A-B-Y

 

•  ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ  ๊ด€์ ์—์„œ, ์กฐ๊ฑด์— ํ•ด๋‹นํ•˜๋Š” ๋ถ€๋ถ„์ด conditioning ๋˜์–ด ์žˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๊ณ , ํ•ด๋‹น ๋ณ€์ˆ˜์— ์˜ํ•ด ์ •๋ณด์˜ ํ๋ฆ„์ด ์ฐจ๋‹จ๋˜์—ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ๊ฐ€๋ น ํ‘œ์˜ ์™ผ์ชฝ์— (implied) ํ•ด๋‹นํ•˜๋Š” ์‹์ฒ˜๋Ÿผ A๋ฅผ ์ฐจ๋‹จํ•˜๊ฑฐ๋‚˜, AB๋ฅผ ์ฐจ๋‹จํ•˜๊ฑฐ๋‚˜ BE๋ฅผ ์ฐจ๋‹จํ•˜๋Š” ๊ฒฝ์šฐ์— X์™€ Y๋กœ ๊ฐ€๋Š” ๊ธธ์ด ์ฐจ๋‹จ๋˜์–ด ์žˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์˜ค๋ฅธ์ชฝ (not implied)์˜ ๊ฒฝ์šฐ์—๋Š” C ํ˜น์€ CE ํ˜น์€ AD๋ฅผ ์ฐจ๋‹จํ•˜๋Š” ๊ฒฝ์šฐ์— connected ๋˜์–ด์žˆ๋‹ค, ์ฆ‰ X์™€ Y ์‚ฌ์ด์˜ path ๊ฐ€ ๋šซ๋ ค์žˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ๊ฐ€๋ น C๋ฅผ ์ฐจ๋‹จํ•ด๋„ ์œ„์˜ X-A-B-Y path๋Š” ์‚ด์•„์žˆ๊ธฐ ๋•Œ๋ฌธ์— connected ๊ฐ€ ์œ ์ง€๋œ๋‹ค. AD๋ฅผ ์ฐจ๋‹จํ•˜๋Š” ๊ฒฝ์šฐ๋Š” A๋ฅผ ์ฐจ๋‹จํ•˜๋ฉด ์œ—๊ธธ์ด ๋ง‰ํžˆ๊ธด ํ•˜์ง€๋งŒ, D๋ฅผ ์ฐจ๋‹จํ•˜๋ฉด X-C-E-Y๋กœ ๊ธธ์ด ๋šซ๋ฆฐ๋‹ค. 

 

 

 

โ—ฏ  Association in Causal Graph by Structure 

 

 

•  Mediator ์˜ ๊ฒฝ์šฐ X์™€ Y๋Š” ๊ฐ™์€ ์ •๋ณด M์„ ๊ณต์œ ํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์—ฐ๊ฒฐ๋˜์–ด d-connected ๋˜์–ด์žˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. 

•  Confounder ์˜ ๊ฒฝ์šฐ ์ •๋ณด๊ฐ€ X๋กœ๋„ ๊ฐ€๊ณ , Y๋กœ๋„ ๊ฐ€๊ธฐ ๋•Œ๋ฌธ์— X์™€ Y๋Š” ์„œ๋กœ ์ •๋ณด๋ฅผ ๊ณต์œ ํ•˜์—ฌ association ์ด ์ƒ๊ธด๋‹ค. d-connected.

•  Collider ์˜ ๊ฒฝ์šฐ์—๋Š”, X์˜ ์ •๋ณด๊ฐ€ Z๋กœ ๊ฐ€์ง€๋งŒ ๋” ํ˜๋Ÿฌ๊ฐ€๋Š” ํ™”์‚ดํ‘œ๊ฐ€ ์—†๋‹ค. ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ Y์˜ ์ •๋ณด๋„ Z๋กœ ๊ฐ€์ง€๋งŒ ๋ฐ˜๋Œ€๋กœ ํ˜๋Ÿฌ๊ฐ€๋Š” ํ™”์‚ดํ‘œ๊ฐ€ ์—†๋‹ค. ๋”ฐ๋ผ์„œ X์™€ Y๊ฐ€ ์ •๋ณด๋ฅผ ๊ณต์œ ํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— d-separated ๋˜์–ด์žˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. 

 

 

 

•  Conditioning (=blocking) variable : regression์—์„œ control variable์„ ๋„ฃ๋Š” ๊ฒŒ ๊ฐ€์žฅ ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ์•ˆ์ด๊ณ , ํ•ด๋‹น ๋ณ€์ˆ˜์— ๋Œ€ํ•ด ๊ฐ’์ด ๋™์ผํ•˜๋„๋ก ๋งค์นญํ•˜๋Š” ๊ฒƒ๋„ ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ๋ฒ•์ด๋‹ค. 

 

•  Mediator conditioning : X์˜ ์ •๋ณด๊ฐ€ Y๋กœ ํ˜๋Ÿฌ๊ฐ€๋Š” path ๊ฐ€ ๋ง‰ํžˆ๊ธฐ ๋•Œ๋ฌธ์— d-separated ๋œ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ mediator๋Š” ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ์ธ๊ณผํšจ๊ณผ๊ธฐ ๋•Œ๋ฌธ์— ์ฐจ๋‹จํ•˜๋ฉด ์•ˆ ๋œ๋‹ค. 

 

•  Confounder conditioning  : X์™€ Y ๋Š” d-saparated ๊ฐ€ ๋œ๋‹ค. ๋Œ€ํ‘œ์ ์ธ non-causal path (backdoor path) ์ด๊ธฐ ๋•Œ๋ฌธ์— ์ด๋Ÿฐ confounder๋Š” ์ฐจ๋‹จํ•ด์•ผ ํ•œ๋‹ค. 

 

•  Collider conditioning : ์ž‘์šฉ ๋ฐ˜์ž‘์šฉ ์˜ˆ์‹œ๋ฅผ ๋– ์˜ฌ๋ฆฌ๋ฉด ์‰ฝ๋‹ค. collider๋ฅผ ์ฐจ๋‹จํ•˜๋ฉด, ์ •๋ณด๊ฐ€ X๋‚˜ Y๋กœ ๋ฐ˜๋Œ€๋กœ ํ˜๋Ÿฌ๋“ค์–ด ๊ฐ„๋‹ค. ์ฆ‰, Z๋ฅผ ํ†ต์ œํ•˜๋ฉด, ๊ฐ™์€ ๊ฐ’์˜ Z๋ฅผ ๋‚ด๊ธฐ ์œ„ํ•ด X์™€ Y๊ฐ’์ด ์กฐ์ •๋˜์–ด์•ผ ๋˜๊ธฐ ๋•Œ๋ฌธ์— ์ผ๋ จ์˜ ๊ด€๊ณ„๊ฐ€ ์ƒ๊ธฐ๊ฒŒ ๋œ๋‹ค. ๋”ฐ๋ผ์„œ collider๋Š” ํ†ต์ œํ•˜๋ฉด ์•ˆ ๋œ๋‹ค. 

 

 

 

 

 

 

 

 

 

 

 

 

728x90

๋Œ“๊ธ€