์ฐธ๊ณ ์์ : Bootcamp 5-2. ๋์์ธ ๊ธฐ๋ฐ์ ์ธ๊ณผ์ถ๋ก ์์์ ์ธ๊ณผ๊ทธ๋ํ ํ์ฉ
1. Structure-based Research design
โฏ ์ Research design ์ ์ค๊ณํ๋ ๊ฒ์ด ์ค์ํ๊ฐ
• ๊ฐฑ๋ ๊ธฐ ํธ๋ฅด๋ชฌ ์น๋ฃ๊ฐ ์๊ถ์์ ์ ๋ฐํ๋ ๊ฒ์ ๋ํ ์ธ๊ณผ์ถ๋ก
• ์ฐ๊ตฌ์๋ค์ ๊ธฐ์กด์ ์ฐ๊ตฌ๊ฒฐ๊ณผ์ ๋ํด ์ด์๋ฅผ ์ ๊ธฐ
โช ์์ผ๋ํ๊ต ์ฐ๊ตฌ : ํธ๋ฅด๋ชฌ ์น๋ฃ์ฝ์ด ์๊ถ์ถํ์ ์ผ๊ธฐํ๊ณ , ๋ฐ๋ผ์ ์ถํ์ด ์์ผ๋ฉด ๊ฒ์ฌ๋ฅผ ๋ฐ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ ์ ๋ณตํด์๋ ์๊ถ์์ ๋ฐ๊ฒฌํ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ์ฆ, ํธ๋ฅด๋ชฌ ์น๋ฃ๊ฐ ์๊ถ์์ ์ ๋ฐํ๋ ๊ฒ์ด ์๋๊ณ , ์ถํ์ด ๋ฐ์ํ์ฌ ๊ฒ์ฌ๋ฅผ ๋ฐ์๋ณด๋ ์ ๋ณตํ๋ ์๊ถ์์ ๋ฐ๊ฒฌํ๋ค๋ ์ฃผ์ฅ์ธ ๊ฒ์ด๋ค.
• ์๊ถ์ถํ์ด๋ผ๋ ์์ธ์ ํต์ ํจ์ผ๋ก์จ ์ด๋ฌํ ํจ๊ณผ๋ฅผ ๋ฐฐ์ ํ๊ณ ์ค์ ํธ๋ฅด๋ชฌ ์น๋ฃ๊ฐ ์๊ถ์ ์ ๋ฐ์ ๋ํ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์ถ์ ํ ์ ์๋ค๊ณ ์ด์ผ๊ธฐ ํ๋ค → ๊ทธ๋ฌ๋ ๋ค๋ฅธ ์ฐ๊ตฌ์๋ค์ด ๋ฐ๋ฐ์ ์ ๊ธฐ
โช ํ๋ฒ๋ ๋ฐ ๋ณด์คํด ๋ํ ์ฐ๊ตฌ : ํธ๋ฅด๋ชฌ ์น๋ฃ์ ๋ํ ๋ฌด์์ ์คํ์ด ๊ฐ์ฅ ํ์คํ ์ฐ๊ตฌ ๋ฐฉ๋ฒ์ด๊ธด ํ์ง๋ง, ์ ๋ฐ๋ณ ํ๋ฅ ์ ๊ฒ์ฆํ๊ธฐ ์ํ ์คํ์ ์ค๋ฆฌ์ ์ผ๋ก ๋ฌธ์ ๊ฐ ๋ ์ ๋ฐ์ ์๋ค. ๋ฌด์์ ์คํ ์์ด ์ธ๊ณผ๊ด๊ณ๋ฅผ ์ถ๋ก ํ๊ธฐ ์ํด์ ์ ์ ํ ์ฐ๊ตฌ ๋์์ธ์ ๊ณ ์ํด์ผ ํ๋ค.
๐ Causal structure , Causal Design ์ด ๋งค์ฐ ์ค์ํ๋ค.
โฏ Effect of estrogen and uterine cancer ์ ๋ํ ์๋ก ๋ค๋ฅธ causal diagram ๊ณผ research design
• ์ผ๋ฐ์ ์ผ๋ก ์์ํ๋ ์ธ๊ณผ๊ด๊ณ
• ์์ผ๋ํ๊ต ์ฃผ์ฅ : ํธ๋ฅด๋ชฌ ์น๋ฃ์ ๋ก ์ํ ์๊ถ์ถํ์ด ์๊ถ์ ์ง๋จ์ ์ ๋ฐํ๋ Noncausal association ์ด ์๊ธด ๊ฒ์ด๋ค.
๋ฐ๋ผ์ ์๋์ ๊ฐ์ด ์๊ถ์ถํ ์์ธ์ ํต์ ํ๋ ๊ฒ๋ง์ผ๋ก๋ ํธ๋ฅด๋ชฌ์ ์ ์ ์ง๋จ์ ์ธ๊ณผ์ ์ธ ํจ๊ณผ๋ฅผ ์ดํด๋ณผ ์ ์๋ค.
• ํ๋ฒ๋ ๋ฐ ๋ณด์คํด ๋ํ๊ต ์ฌ๋๋ค์ ๋ฐ๋ฐ : ์๊ถ์ ๋ฐ๋ณ ๋ํ ์๊ถ ์ถํ์ ์ ๋ฐํ ์ ์๊ธฐ ๋๋ฌธ์, ์ถํ์ ํต์ ํ๋๋ผ๋ ์ธ๊ณผํจ๊ณผ๋ฅผ ์ป์ด๋ด๊ธฐ๋ ์ด๋ ต๋ค.
์๊ถ์ถํ ์ฌ๋ถ๋ฅผ ํต์ ํ๊ฒ ๋๋ฉด, backdoor path ๋ block ๋ ์ ์์ง๋ง ์ฌ์ฑ ํธ๋ฅด๋ชฌ๊ณผ ์๊ถ์ ๋ฐ๋ณ์ collider ์ญํ ์ ํ๋ ์๊ถ์ถํ์ conditioning ํ๋ฉด path ๊ฐ ์คํ๋ ค ์ด๋ฆฌ๊ฒ ๋๋ค.
์๋์ ๊ฐ์ด ๋ ๋ค๋ฅธ path (ํธ๋ฅด๋ชฌ-์ถํ-์๊ถ์-์ง๋จ) ๊ฐ ์ด๋ฆฌ๊ฒ ๋ ์ ์๋ค.
• ๋ฐ๋ผ์ ๋ณ์ ์์ฒด๋ฅผ ํต์ ํ๊ธฐ ๋ณด๋จ, ์ฐ๊ตฌ ๋์์ธ์ ํตํด์ ์ฌ์ฑ ํธ๋ฅด๋ชฌ์ด ์๊ถ์ถํ์ ๋ฏธ์น๋ ํจ๊ณผ๋ฅผ ์ฐ๊ฒฐ๊ณ ๋ฆฌ๋ฅผ ๋์ด๋ฒ๋ฆฌ๋๊ฒ ๋์์ด ๋ ์ ์๋ค.
2. Design of Control variables / Conditioning strategies
โฏ Design
• selection on observable strategies ์ ์ฃผ์ ๊ฐ์ : ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ณ์๋ค๋ก selection bias ๋ฅผ ๋ชจ๋ ์ค๋ช ํ ์ ์๋ค๊ณ ๊ฐ์ โจ causal graph ๊ฐ ์ด๋ฌํ ์ธก๋ฉด์์ ๋งค์ฐ ์ ์ฉํ ์ ์๋ค.
• causal graph ๋ฅผ ํตํด ํต์ ๋ณ์์ ๋ํ ๋์์ธ, conditioning ์ ๋ต์ ์ธ์ ์ธ๊ณผ์ถ๋ก ์ ์์ค์ ๋์ผ ์ ์๋ค.
โฏ ๋ชจ๋ control variable ์ ์ฌ์ฉํ๋๊ฒ ๊ฐ์ฅ best ํ ๋ฐฉ๋ฒ์ ์๋๋ค.
• SOD : ์ผ๋ถ์ญ์ทจ (์์ธ๋ณ์) , SBP : ํ์ (๊ฒฐ๊ณผ๋ณ์)
• AGE (๋์ด) : confounder, pre-treatment variable
• PRO (๋จ๋ฐฑ์ง) : collider, post-treatment variable
• ์๋์ ๊ตฌ์กฐ ํ์์ ์๋ฎฌ๋ ์ด์ ๋ฐ์ดํฐ๋ฅผ ์์ฑํด์ ๋ถ์
• True effect = 2 : ์๋ฎฌ๋ ์ด์ ์์์ regression coefficient ๊ฐ 2์ ๊ฐ๊น์์ผ์ง ์ค์ ๊ฒฐ๊ณผ์ ๊ฐ๊น์ด ๊ฒ
โจ ์ด๋ค ๋ถ๋ถ์ ํต์ ํ๋๋์ ๋ฐ๋ผ ํ๊ท๋ถ์ ๊ฒฐ๊ณผ๊ฐ ์ด๋ป๊ฒ ๋ฌ๋ผ์ง๋์ง ์ดํด๋ด
โช Model1 : ํต์ ํ์ง ์์ ์ํ์์๋ ๊ฒฐ๊ณผ๊ฐ true causal effect ๋ณด๋ค over-estimate ๋๊ณ ์๋ค.
โช Model2 : confounder ๋ฅผ conditioning ํ์ ๋, true causal effect ์ ๊ฐ๊น๊ฒ ๊ณ์๊ฐ ์ถ์ ๋จ์ ๋ณผ ์ ์๋ค.
โช Model3 : collider ์ ๊ฒฝ์ฐ๋, conditioning ์ ํ๋ฉด path ๊ฐ ์ด๋ฆฌ๊ธฐ ๋๋ฌธ์ ํ๊ท๋ถ์ ๊ฒฐ๊ณผ๊ฐ ์์ ๋ชจ๋ธ๋ณด๋ค ์์ ํ ์ ๋ฐ๋์ ๋ชจ์ต์ ๋๊ณ ์์์ ๋ณผ ์ ์๋ค. ํ๊ท๋ถ์์์ ๋ชจ๋ ๋ณ์๋ฅผ control ํ๋๊ฒ ๋ฅ์ฌ๋ ์๋๋ค!
causal graph ๋ฅผ ์ ๊ทน์ ์ผ๋ก ํ์ฉํด ์ ์ฉํ control ๋ณ์๋ฅผ ์ ์ ํ ์ฌ์ฉํ๋ ๊ฒ์ด ์ค์ํ๋ค.
Backdoor path ๋ฅผ ์ผ๊ธฐํ๋ Confounder ๋ค์ ๋ชจ๋ control ํ๋ ๊ฒ์ด ์ข๋ค. ๋ฐ๋ฉด์ ํน์ํ ๊ฒฝ์ฐ๋ฅผ ์ ์ธํ๊ณค causal path ์ ์ค๊ฐ์ ์๋ mediator ๋ ํต์ ํ๋ฉด ์๋๋ค. ๊ทธ๋ฆฌ๊ณ collider (post-treatment) ์ ๊ฒฝ์ฐ๋ conditioning ์ ํ๋ฉด ์คํ๋ ค backdoor path ๊ฐ ์๊ธฐ๊ธฐ ๋๋ฌธ์ control ํ๋ฉด ์๋๋ค.
3. Communicating identification assumption
โฏ Identification assumption : ์ธ๊ณผ์ถ๋ก ์ ํ์ํ ๊ฐ์ ๋ค
• ํต๊ณ์ ์ธ test ์ ์์ญ์ด๋ผ๊ธฐ ๋ณด๋จ, ์ด๋ก ์ ์ธ ์ ๋น์ฑ์ ์์ญ์ด๋ค. ๊ฐ์ฅ ๋ํ์ ์ธ ๊ฒ์ด ๋๊ตฌ๋ณ์์ด๋ค.
โช ๋๊ตฌ๋ณ์์ ๊ฐ์ : (1) IV ๊ฐ treatment group ์ ์ค๋ช ํ ์ ์์ด์ผ ํ๋ค, (2) IV ๊ฐ ๊ฒฐ๊ณผ๋ณ์์ ์ํฅ์ ์ฃผ๋ unobserved factor ์ ๊ด๊ณ์๋ error term ๊ณผ ์๊ด์ด ์์ด์ผ ํ๋ค โจ ์ฒซ๋ฒ์งธ ๊ฐ์ ์ ํต๊ณ์ ์ผ๋ก ๊ฒ์ฆํ ์ ์์ง๋ง ๋๋ฒ์งธ ๊ฐ์ ์ ํต๊ณ์ ์ผ๋ก ๊ฒ์ฆํด๋ด๊ธฐ ์ฝ์ง ์๋ค.
• ํต๊ณ์ ์ธ ๊ฐ์ ์ ๊ตฌ๋ถ
โ Violation of Exclusion restriction : ๋๊ตฌ๋ณ์๊ฐ ์ค์ ๋ก ๊ฒฐ๊ณผ๋ณ์์ ์ํฅ์ ๋ฏธ์ณ์ผ ๋๋๋ฐ, treatment variable ์ ํตํด์๋ง ๊ฒฐ๊ณผ๋ณ์์ ์ํฅ์ ๋ฏธ์ณ์ผ ํ๋ค.
โก Violation of Exogeneity of IV : ๋๊ตฌ๋ณ์๊ฐ ๊ฒฐ๊ณผ๋ณ์์ธ y์ ์๋ฌด๋ฐ ๊ด๊ณ๊ฐ ์์ด์ผ ํ๋ค. ์ฆ, confounder ๊ฐ ์์ด์ผ ํ๋ค.
→ 1๋ฒ, 2๋ฒ ๋ชจ๋ ํต๊ณ์ ์ผ๋ก error term ๊ณผ ๊ด๊ณ๊ฐ ์์ด์ผ ํ๋ค๋ ๋ด์ฉ์ผ๋ก ์๋ฏธํ๋๋ฐ๋ ๋์ผํ์ง๋ง, ๊ทธ๋ํ๋ฅผ ํ์ฉํด์ condtition ์ ๋ค๋ฅด๊ฒ ํํํ ์ ์๋ค.
4. Transportability : From RCTs to Observational studies
• ์คํ์ ์ธ ์ ๊ทผ๋ฐฉ๋ฒ์ ํตํ ์ธ๊ณผ์ถ๋ก ์ ํ๊ณ ์ ํ๋ ๋ฐฉ๋ฒ
• ํน์ ์ง๋จ, ์ํฉ์์์ ์ธ๊ณผ์ถ๋ก ์ ๋ค๋ฅธ ์ํฉ์ด๋ ์ง๋จ์ ์ ์ฉ๋์ง ์์ ์ ์๋ค
• Transportability : RCT ๋ causal inference ์ ๊ฒฐ๊ณผ๋ฅผ ๋ค๋ฅธ ์ง๋จ์ ์ ์ฉํ ์ ์๋์ง์ ์ฌ๋ถ
• ์คํ์์์ ๊ฒฐ๊ณผ๋ causal experiment ์ ๊ฒฐ๊ณผ๋ฅผ ๋ค๋ฅธ setting ์ ์ ์ฉํ๋ ๊ฒ์ ํฐ ์ ์ฌ์ฑ์ด ์๋ค.
๋๊ธ