์ฐธ๊ณ ์์ : Bootcamp 5-1. ์ธ๊ณผ๊ทธ๋ํ
โธ Causal graph : Directed Acyclic graph and Bayesian network
1. Causal graph (diagram)
โข ์ธ๊ณผ๊ด๊ณ ๊ตฌ์กฐ๋ฅผ ๊ทธ๋ํ๋ก ํํํ๋ ๋ฐฉ๋ฒ
โฏ Directed Acyclic Graph (DAG)
โข Graph : ๊ฐ ๋ ธ๋๋ ๊ฐ ๋ณ์๋ฅผ ๋ปํ๊ณ , ๋ ธ๋๋ค ๊ฐ์ ์ฃ์ง๊ฐ ๋ณ์๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค.
โข Directed : ์ฃ์ง์ ๋ฐฉํฅ์ฑ์ด ์๋ค๋ ๋ป์ผ๋ก, ์์ธ๊ณผ ๊ฒฐ๊ณผ์ ๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค.
โข Acyclic : Cyclic ์ ๋ฐ๋๋ง๋ก, ์ํ๊ณ ๋ฆฌ๊ฐ ์๋ค๋ ๋ป์ด๋ค. ์ญ์ธ๊ณผ๊ด๊ณ๊ฐ ์ฑ๋ฆฝํ์ง ์๋๋ค๋ ๊ฒ์ ์๋ฏธํ๋ค.

โฏ Bayesian Network (Belief Network)
โข DAG ๋ฅผ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ก ๋์ํํ ๊ฒ
โข ๋ฒ ์ด์ง์ ๋คํธ์ํฌ

2. Relationship types in causal graph
โฏ ์ธ๊ณผ๊ทธ๋ํ ์ข ๋ฅ

โข Direct causal effect : ์์ธ๋ณ์๊ฐ ๊ฒฐ๊ณผ๋ณ์์ ์ง์ ์ํฅ์ ์ฃผ๋ ๊ฒฝ์ฐ
โข Mediator (Chain) : ๊ฐ์ ์ ์ผ๋ก ์ค์ฌ์์ธ mediator๋ฅผ ํตํด ์ํฅ์ ์ฃผ๋ ๊ฒฝ์ฐ
โช ์ด๋์ด ํ์๋ฐ๋ณ์ ์ง์ ์ ์ผ๋ก ์ํฅ์ ์ค ์ ์์ง๋ง, ๋ฉด์ญ์ฒด๊ณ ๊ฐ์ ์ด๋ผ๋ mediator๋ฅผ ํตํด ๊ฐ์ ์ ์ผ๋ก ์ํฅ์ ์ค ์ ์๋ค.
โข Confounder (Fork) : ์์ธ๋ณ์์ ๊ฒฐ๊ณผ๋ณ์ ๋ชจ๋์ ์ํฅ์ ์ฃผ๋ ๋ณ์
โช ํก์ฐํ๋ ์ฌ๋๋ค์ ์๋์ ์ผ๋ก ์ด๋์ ๋ํ๊ณ , ํ์ ๋ฐ๋ณ ํ๋ฅ ์ ๋์ธ๋ค.
โช confounder ๋ treatment ์ด์ ์ ๋ํ๋๋ค โ pre-treatment variable
โข Collider (immorality) : ์์ธ๋ณ์์ ๊ฒฐ๊ณผ๋ณ์ ๋ชจ๋์ ์ํฅ์ ๋ฐ๋ ๋ณ์ (๊ณตํต์ ๊ฒฐ๊ณผ)
โช ๊ต๋๊ทผ๋ฌด๊ฐ ์๋ฉด์ฑ ๋ฌดํธํก์ฆ์ ์ง์ ์ ์ผ๋ก ์ํฅ์ ์ค ์ ์๋ค. ๋ฐ๋ฉด ๊ต๋๊ทผ๋ฌด๋ฅผ ํ๋ฉด ์กธ์์ฆ์ด ๋์์ง๊ณ ๋ง์ฐฌ๊ฐ์ง๊ณ ์๋ฉด์ฑ ๋ฌดํธํก์ฆ์ด ์กธ์์ฆ์ ์ํฅ์ ๋ฏธ์น ์ ์๋ค.
โช Collider ๋ treatment๋ฅผ ๋ฐ์ ๊ฒฐ๊ณผ์ด๊ธฐ ๋๋ฌธ์ ์ดํ์ ๋ํ๋๋ค โ post-treatment variable
โข ์ด๋ฌํ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๋ ์ด์ ๋ causal effect ๊ฐ ์ด๋ป๊ฒ ๋ฐํ๋๊ณ , ๋ฐฉํด๋๋ ์์ธ๋ค์ ๋ฌด์์ด๊ณ , ์๊ด๊ด๊ณ๋ ์ด๋ป๊ฒ ๋๋์ง ๋ถ์ํ๊ธฐ ์ํจ
3. Association in Causal Graph
โฏ Backdoor paths
โข ๊ทธ๋ํ ์์์์ ์ ๋ณด์ ํ๋ฆ์ ํตํด ๋ณ์๋ค ๊ฐ ์๊ด๊ด๊ณ๋ฅผ ์ดํดํด ๋ณผ ์ ์๋ค.
โข ๊ฐ ๋ ธ๋๋ ํ์ดํ๋ฅผ ํตํด ํ๋ฌ๊ฐ๋ค.
โข X : ์์ธ๋ณ์, Y : ๊ฒฐ๊ณผ๋ณ์

โข B์ ์ ๋ณด๋ A๋ฅผ ํตํด X ๋ก ํ๋ฌ๊ฐ๊ณ , Z๋ฅผ ํตํด์ Y๋ก ํ๋ฌ๊ฐ๋ค. X์ Y๋ ๊ณตํต์ ์ผ๋ก B์ ๋ํ ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ์๋ค. ๊ณตํต์ ์ ๋ณด์ ํ๋ฆ์ด ์ฐ๊ฒฐ๋๋ ๊ฒ์ path๋ผ๊ณ ํ๋ค. X-A-B-Z-Y ๊ฐ ํ๋์ path ๊ฐ ๋๋ค. ์ด๋ฌํ path๋ ์ฌ๋ฌ ๊ฐ๊ฐ ์์ ์ ์๋ค.
โข XโWโY ๊ฐ causal path ๋ผ๊ณ ๋ณผ ์ ์๊ณ , ์ด๋ฅผ ์ ์ธํ ๋๋จธ์ง์ non-causal path๋ฅผ backdoor path ๋ผ๊ณ ๋ณผ ์ ์๋ค. backdoor path๋ฅผ ์ ๋ถ ์ฐจ๋จํ ์ ์๋ค๋ฉด, ํ์คํ causal path๋ฅผ ์ป์ด๋ผ ์ ์๋ค. ์ฆ, ์ธ๊ณผ์ถ๋ก ์ ํต์ฌ์ ์ด backdoor path๋ฅผ ์ด๋ป๊ฒ ์ฐจ๋จํ ์ ์์ ๊ฒ์ธ๊ฐ์ ๋ฌ๋ ค์๋ค.
โฏ ์ฉ์ด์ ๋ฆฌ

โข d-separated : causal graph ์์ X, Y ๋ ๋ณ์ ๊ฐ์ ์ ๋ณด์ ํ๋ฆ์ด ๋งํ์๋ ์ํฉ์ ์๋ฏธํ๋ค. path๊ฐ ์ฐจ๋จ๋์ด ์๋ค๋ ๊ฒ์ ๋ฐฉํฅ์ ์ผ๋ก ๋ถ๋ฆฌ๋์ด ์๋ค๊ณ ํํํ๋ค.
โช (X-C-D), E, Y : D์์ Y๋ก ๊ฐ ์ ์๊ณ , E์์๋ X๋ก ๊ฐ ์ ์๋ค.
โข d-connected : path ๊ฐ ์ฐ๊ฒฐ๋์ด ์๋ ๊ฒฝ์ฐ๋ฅผ ์๋ฏธํ๋ค.
โช X-A-B-Y
โข ์กฐ๊ฑด๋ถ ํ๋ฅ ๊ด์ ์์, ์กฐ๊ฑด์ ํด๋นํ๋ ๋ถ๋ถ์ด conditioning ๋์ด ์๋ค๊ณ ๋ณผ ์ ์๊ณ , ํด๋น ๋ณ์์ ์ํด ์ ๋ณด์ ํ๋ฆ์ด ์ฐจ๋จ๋์๋ค๊ณ ๋ณผ ์ ์๋ค. ๊ฐ๋ น ํ์ ์ผ์ชฝ์ (implied) ํด๋นํ๋ ์์ฒ๋ผ A๋ฅผ ์ฐจ๋จํ๊ฑฐ๋, AB๋ฅผ ์ฐจ๋จํ๊ฑฐ๋ BE๋ฅผ ์ฐจ๋จํ๋ ๊ฒฝ์ฐ์ X์ Y๋ก ๊ฐ๋ ๊ธธ์ด ์ฐจ๋จ๋์ด ์๋ค๊ณ ๋ณผ ์ ์๋ค. ์ค๋ฅธ์ชฝ (not implied)์ ๊ฒฝ์ฐ์๋ C ํน์ CE ํน์ AD๋ฅผ ์ฐจ๋จํ๋ ๊ฒฝ์ฐ์ connected ๋์ด์๋ค, ์ฆ X์ Y ์ฌ์ด์ path ๊ฐ ๋ซ๋ ค์๋ค๊ณ ๋ณผ ์ ์๋ค. ๊ฐ๋ น C๋ฅผ ์ฐจ๋จํด๋ ์์ X-A-B-Y path๋ ์ด์์๊ธฐ ๋๋ฌธ์ connected ๊ฐ ์ ์ง๋๋ค. AD๋ฅผ ์ฐจ๋จํ๋ ๊ฒฝ์ฐ๋ A๋ฅผ ์ฐจ๋จํ๋ฉด ์๊ธธ์ด ๋งํ๊ธด ํ์ง๋ง, D๋ฅผ ์ฐจ๋จํ๋ฉด X-C-E-Y๋ก ๊ธธ์ด ๋ซ๋ฆฐ๋ค.
โฏ Association in Causal Graph by Structure

โข Mediator ์ ๊ฒฝ์ฐ X์ Y๋ ๊ฐ์ ์ ๋ณด M์ ๊ณต์ ํ๊ณ ์๊ธฐ ๋๋ฌธ์ ์ฐ๊ฒฐ๋์ด d-connected ๋์ด์๋ค๊ณ ๋ณผ ์ ์๋ค.
โข Confounder ์ ๊ฒฝ์ฐ ์ ๋ณด๊ฐ X๋ก๋ ๊ฐ๊ณ , Y๋ก๋ ๊ฐ๊ธฐ ๋๋ฌธ์ X์ Y๋ ์๋ก ์ ๋ณด๋ฅผ ๊ณต์ ํ์ฌ association ์ด ์๊ธด๋ค. d-connected.
โข Collider ์ ๊ฒฝ์ฐ์๋, X์ ์ ๋ณด๊ฐ Z๋ก ๊ฐ์ง๋ง ๋ ํ๋ฌ๊ฐ๋ ํ์ดํ๊ฐ ์๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก Y์ ์ ๋ณด๋ Z๋ก ๊ฐ์ง๋ง ๋ฐ๋๋ก ํ๋ฌ๊ฐ๋ ํ์ดํ๊ฐ ์๋ค. ๋ฐ๋ผ์ X์ Y๊ฐ ์ ๋ณด๋ฅผ ๊ณต์ ํ์ง ์๊ธฐ ๋๋ฌธ์ d-separated ๋์ด์๋ค๊ณ ๋ณผ ์ ์๋ค.

โข Conditioning (=blocking) variable : regression์์ control variable์ ๋ฃ๋ ๊ฒ ๊ฐ์ฅ ๋ํ์ ์ธ ๋ฐฉ์์ด๊ณ , ํด๋น ๋ณ์์ ๋ํด ๊ฐ์ด ๋์ผํ๋๋ก ๋งค์นญํ๋ ๊ฒ๋ ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ด๋ค.
โข Mediator conditioning : X์ ์ ๋ณด๊ฐ Y๋ก ํ๋ฌ๊ฐ๋ path ๊ฐ ๋งํ๊ธฐ ๋๋ฌธ์ d-separated ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก mediator๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ์ธ๊ณผํจ๊ณผ๊ธฐ ๋๋ฌธ์ ์ฐจ๋จํ๋ฉด ์ ๋๋ค.
โข Confounder conditioning : X์ Y ๋ d-saparated ๊ฐ ๋๋ค. ๋ํ์ ์ธ non-causal path (backdoor path) ์ด๊ธฐ ๋๋ฌธ์ ์ด๋ฐ confounder๋ ์ฐจ๋จํด์ผ ํ๋ค.
โข Collider conditioning : ์์ฉ ๋ฐ์์ฉ ์์๋ฅผ ๋ ์ฌ๋ฆฌ๋ฉด ์ฝ๋ค. collider๋ฅผ ์ฐจ๋จํ๋ฉด, ์ ๋ณด๊ฐ X๋ Y๋ก ๋ฐ๋๋ก ํ๋ฌ๋ค์ด ๊ฐ๋ค. ์ฆ, Z๋ฅผ ํต์ ํ๋ฉด, ๊ฐ์ ๊ฐ์ Z๋ฅผ ๋ด๊ธฐ ์ํด X์ Y๊ฐ์ด ์กฐ์ ๋์ด์ผ ๋๊ธฐ ๋๋ฌธ์ ์ผ๋ จ์ ๊ด๊ณ๊ฐ ์๊ธฐ๊ฒ ๋๋ค. ๋ฐ๋ผ์ collider๋ ํต์ ํ๋ฉด ์ ๋๋ค.
๋๊ธ