์ฐธ๊ณ ์์ : Bootcamp 5-1. ์ธ๊ณผ๊ทธ๋ํ
โธ Causal graph : Directed Acyclic graph and Bayesian network
1. Causal graph (diagram)
• ์ธ๊ณผ๊ด๊ณ ๊ตฌ์กฐ๋ฅผ ๊ทธ๋ํ๋ก ํํํ๋ ๋ฐฉ๋ฒ
โฏ Directed Acyclic Graph (DAG)
• Graph : ๊ฐ ๋ ธ๋๋ ๊ฐ ๋ณ์๋ฅผ ๋ปํ๊ณ , ๋ ธ๋๋ค ๊ฐ์ ์ฃ์ง๊ฐ ๋ณ์๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค.
• Directed : ์ฃ์ง์ ๋ฐฉํฅ์ฑ์ด ์๋ค๋ ๋ป์ผ๋ก, ์์ธ๊ณผ ๊ฒฐ๊ณผ์ ๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค.
• Acyclic : Cyclic ์ ๋ฐ๋๋ง๋ก, ์ํ๊ณ ๋ฆฌ๊ฐ ์๋ค๋ ๋ป์ด๋ค. ์ญ์ธ๊ณผ๊ด๊ณ๊ฐ ์ฑ๋ฆฝํ์ง ์๋๋ค๋ ๊ฒ์ ์๋ฏธํ๋ค.
โฏ Bayesian Network (Belief Network)
• DAG ๋ฅผ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ก ๋์ํํ ๊ฒ
• ๋ฒ ์ด์ง์ ๋คํธ์ํฌ
2. Relationship types in causal graph
โฏ ์ธ๊ณผ๊ทธ๋ํ ์ข ๋ฅ
• Direct causal effect : ์์ธ๋ณ์๊ฐ ๊ฒฐ๊ณผ๋ณ์์ ์ง์ ์ํฅ์ ์ฃผ๋ ๊ฒฝ์ฐ
• Mediator (Chain) : ๊ฐ์ ์ ์ผ๋ก ์ค์ฌ์์ธ mediator๋ฅผ ํตํด ์ํฅ์ ์ฃผ๋ ๊ฒฝ์ฐ
โช ์ด๋์ด ํ์๋ฐ๋ณ์ ์ง์ ์ ์ผ๋ก ์ํฅ์ ์ค ์ ์์ง๋ง, ๋ฉด์ญ์ฒด๊ณ ๊ฐ์ ์ด๋ผ๋ mediator๋ฅผ ํตํด ๊ฐ์ ์ ์ผ๋ก ์ํฅ์ ์ค ์ ์๋ค.
• Confounder (Fork) : ์์ธ๋ณ์์ ๊ฒฐ๊ณผ๋ณ์ ๋ชจ๋์ ์ํฅ์ ์ฃผ๋ ๋ณ์
โช ํก์ฐํ๋ ์ฌ๋๋ค์ ์๋์ ์ผ๋ก ์ด๋์ ๋ํ๊ณ , ํ์ ๋ฐ๋ณ ํ๋ฅ ์ ๋์ธ๋ค.
โช confounder ๋ treatment ์ด์ ์ ๋ํ๋๋ค → pre-treatment variable
• Collider (immorality) : ์์ธ๋ณ์์ ๊ฒฐ๊ณผ๋ณ์ ๋ชจ๋์ ์ํฅ์ ๋ฐ๋ ๋ณ์ (๊ณตํต์ ๊ฒฐ๊ณผ)
โช ๊ต๋๊ทผ๋ฌด๊ฐ ์๋ฉด์ฑ ๋ฌดํธํก์ฆ์ ์ง์ ์ ์ผ๋ก ์ํฅ์ ์ค ์ ์๋ค. ๋ฐ๋ฉด ๊ต๋๊ทผ๋ฌด๋ฅผ ํ๋ฉด ์กธ์์ฆ์ด ๋์์ง๊ณ ๋ง์ฐฌ๊ฐ์ง๊ณ ์๋ฉด์ฑ ๋ฌดํธํก์ฆ์ด ์กธ์์ฆ์ ์ํฅ์ ๋ฏธ์น ์ ์๋ค.
โช Collider ๋ treatment๋ฅผ ๋ฐ์ ๊ฒฐ๊ณผ์ด๊ธฐ ๋๋ฌธ์ ์ดํ์ ๋ํ๋๋ค → post-treatment variable
• ์ด๋ฌํ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๋ ์ด์ ๋ causal effect ๊ฐ ์ด๋ป๊ฒ ๋ฐํ๋๊ณ , ๋ฐฉํด๋๋ ์์ธ๋ค์ ๋ฌด์์ด๊ณ , ์๊ด๊ด๊ณ๋ ์ด๋ป๊ฒ ๋๋์ง ๋ถ์ํ๊ธฐ ์ํจ
3. Association in Causal Graph
โฏ Backdoor paths
• ๊ทธ๋ํ ์์์์ ์ ๋ณด์ ํ๋ฆ์ ํตํด ๋ณ์๋ค ๊ฐ ์๊ด๊ด๊ณ๋ฅผ ์ดํดํด ๋ณผ ์ ์๋ค.
• ๊ฐ ๋ ธ๋๋ ํ์ดํ๋ฅผ ํตํด ํ๋ฌ๊ฐ๋ค.
• X : ์์ธ๋ณ์, Y : ๊ฒฐ๊ณผ๋ณ์
• B์ ์ ๋ณด๋ A๋ฅผ ํตํด X ๋ก ํ๋ฌ๊ฐ๊ณ , Z๋ฅผ ํตํด์ Y๋ก ํ๋ฌ๊ฐ๋ค. X์ Y๋ ๊ณตํต์ ์ผ๋ก B์ ๋ํ ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ์๋ค. ๊ณตํต์ ์ ๋ณด์ ํ๋ฆ์ด ์ฐ๊ฒฐ๋๋ ๊ฒ์ path๋ผ๊ณ ํ๋ค. X-A-B-Z-Y ๊ฐ ํ๋์ path ๊ฐ ๋๋ค. ์ด๋ฌํ path๋ ์ฌ๋ฌ ๊ฐ๊ฐ ์์ ์ ์๋ค.
• X→W→Y ๊ฐ causal path ๋ผ๊ณ ๋ณผ ์ ์๊ณ , ์ด๋ฅผ ์ ์ธํ ๋๋จธ์ง์ non-causal path๋ฅผ backdoor path ๋ผ๊ณ ๋ณผ ์ ์๋ค. backdoor path๋ฅผ ์ ๋ถ ์ฐจ๋จํ ์ ์๋ค๋ฉด, ํ์คํ causal path๋ฅผ ์ป์ด๋ผ ์ ์๋ค. ์ฆ, ์ธ๊ณผ์ถ๋ก ์ ํต์ฌ์ ์ด backdoor path๋ฅผ ์ด๋ป๊ฒ ์ฐจ๋จํ ์ ์์ ๊ฒ์ธ๊ฐ์ ๋ฌ๋ ค์๋ค.
โฏ ์ฉ์ด์ ๋ฆฌ
• d-separated : causal graph ์์ X, Y ๋ ๋ณ์ ๊ฐ์ ์ ๋ณด์ ํ๋ฆ์ด ๋งํ์๋ ์ํฉ์ ์๋ฏธํ๋ค. path๊ฐ ์ฐจ๋จ๋์ด ์๋ค๋ ๊ฒ์ ๋ฐฉํฅ์ ์ผ๋ก ๋ถ๋ฆฌ๋์ด ์๋ค๊ณ ํํํ๋ค.
โช (X-C-D), E, Y : D์์ Y๋ก ๊ฐ ์ ์๊ณ , E์์๋ X๋ก ๊ฐ ์ ์๋ค.
• d-connected : path ๊ฐ ์ฐ๊ฒฐ๋์ด ์๋ ๊ฒฝ์ฐ๋ฅผ ์๋ฏธํ๋ค.
โช X-A-B-Y
• ์กฐ๊ฑด๋ถ ํ๋ฅ ๊ด์ ์์, ์กฐ๊ฑด์ ํด๋นํ๋ ๋ถ๋ถ์ด conditioning ๋์ด ์๋ค๊ณ ๋ณผ ์ ์๊ณ , ํด๋น ๋ณ์์ ์ํด ์ ๋ณด์ ํ๋ฆ์ด ์ฐจ๋จ๋์๋ค๊ณ ๋ณผ ์ ์๋ค. ๊ฐ๋ น ํ์ ์ผ์ชฝ์ (implied) ํด๋นํ๋ ์์ฒ๋ผ A๋ฅผ ์ฐจ๋จํ๊ฑฐ๋, AB๋ฅผ ์ฐจ๋จํ๊ฑฐ๋ BE๋ฅผ ์ฐจ๋จํ๋ ๊ฒฝ์ฐ์ X์ Y๋ก ๊ฐ๋ ๊ธธ์ด ์ฐจ๋จ๋์ด ์๋ค๊ณ ๋ณผ ์ ์๋ค. ์ค๋ฅธ์ชฝ (not implied)์ ๊ฒฝ์ฐ์๋ C ํน์ CE ํน์ AD๋ฅผ ์ฐจ๋จํ๋ ๊ฒฝ์ฐ์ connected ๋์ด์๋ค, ์ฆ X์ Y ์ฌ์ด์ path ๊ฐ ๋ซ๋ ค์๋ค๊ณ ๋ณผ ์ ์๋ค. ๊ฐ๋ น C๋ฅผ ์ฐจ๋จํด๋ ์์ X-A-B-Y path๋ ์ด์์๊ธฐ ๋๋ฌธ์ connected ๊ฐ ์ ์ง๋๋ค. AD๋ฅผ ์ฐจ๋จํ๋ ๊ฒฝ์ฐ๋ A๋ฅผ ์ฐจ๋จํ๋ฉด ์๊ธธ์ด ๋งํ๊ธด ํ์ง๋ง, D๋ฅผ ์ฐจ๋จํ๋ฉด X-C-E-Y๋ก ๊ธธ์ด ๋ซ๋ฆฐ๋ค.
โฏ Association in Causal Graph by Structure
• Mediator ์ ๊ฒฝ์ฐ X์ Y๋ ๊ฐ์ ์ ๋ณด M์ ๊ณต์ ํ๊ณ ์๊ธฐ ๋๋ฌธ์ ์ฐ๊ฒฐ๋์ด d-connected ๋์ด์๋ค๊ณ ๋ณผ ์ ์๋ค.
• Confounder ์ ๊ฒฝ์ฐ ์ ๋ณด๊ฐ X๋ก๋ ๊ฐ๊ณ , Y๋ก๋ ๊ฐ๊ธฐ ๋๋ฌธ์ X์ Y๋ ์๋ก ์ ๋ณด๋ฅผ ๊ณต์ ํ์ฌ association ์ด ์๊ธด๋ค. d-connected.
• Collider ์ ๊ฒฝ์ฐ์๋, X์ ์ ๋ณด๊ฐ Z๋ก ๊ฐ์ง๋ง ๋ ํ๋ฌ๊ฐ๋ ํ์ดํ๊ฐ ์๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก Y์ ์ ๋ณด๋ Z๋ก ๊ฐ์ง๋ง ๋ฐ๋๋ก ํ๋ฌ๊ฐ๋ ํ์ดํ๊ฐ ์๋ค. ๋ฐ๋ผ์ X์ Y๊ฐ ์ ๋ณด๋ฅผ ๊ณต์ ํ์ง ์๊ธฐ ๋๋ฌธ์ d-separated ๋์ด์๋ค๊ณ ๋ณผ ์ ์๋ค.
• Conditioning (=blocking) variable : regression์์ control variable์ ๋ฃ๋ ๊ฒ ๊ฐ์ฅ ๋ํ์ ์ธ ๋ฐฉ์์ด๊ณ , ํด๋น ๋ณ์์ ๋ํด ๊ฐ์ด ๋์ผํ๋๋ก ๋งค์นญํ๋ ๊ฒ๋ ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ด๋ค.
• Mediator conditioning : X์ ์ ๋ณด๊ฐ Y๋ก ํ๋ฌ๊ฐ๋ path ๊ฐ ๋งํ๊ธฐ ๋๋ฌธ์ d-separated ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก mediator๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ์ธ๊ณผํจ๊ณผ๊ธฐ ๋๋ฌธ์ ์ฐจ๋จํ๋ฉด ์ ๋๋ค.
• Confounder conditioning : X์ Y ๋ d-saparated ๊ฐ ๋๋ค. ๋ํ์ ์ธ non-causal path (backdoor path) ์ด๊ธฐ ๋๋ฌธ์ ์ด๋ฐ confounder๋ ์ฐจ๋จํด์ผ ํ๋ค.
• Collider conditioning : ์์ฉ ๋ฐ์์ฉ ์์๋ฅผ ๋ ์ฌ๋ฆฌ๋ฉด ์ฝ๋ค. collider๋ฅผ ์ฐจ๋จํ๋ฉด, ์ ๋ณด๊ฐ X๋ Y๋ก ๋ฐ๋๋ก ํ๋ฌ๋ค์ด ๊ฐ๋ค. ์ฆ, Z๋ฅผ ํต์ ํ๋ฉด, ๊ฐ์ ๊ฐ์ Z๋ฅผ ๋ด๊ธฐ ์ํด X์ Y๊ฐ์ด ์กฐ์ ๋์ด์ผ ๋๊ธฐ ๋๋ฌธ์ ์ผ๋ จ์ ๊ด๊ณ๊ฐ ์๊ธฐ๊ฒ ๋๋ค. ๋ฐ๋ผ์ collider๋ ํต์ ํ๋ฉด ์ ๋๋ค.
๋๊ธ