1๏ธโฃ AI•DS/๐ฅ Casual inference47 [industry] ์ธ๊ณผ์ถ๋ก ํ์ฉ : Best practice ๐ ์ธ๊ณผ์ถ๋ก ๊ฐ์ธ ๊ณต๋ถ์ฉ ํฌ์คํธ ๊ธ์ ๋๋ค. ์ถ์ฒ๋ ์ฒจ๋ถํ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์ธ์! โ ๋ฐํ ๋ฐฐ๊ฒฝ ttps://playinpap.gitbook.io/dowhy/ DoWhy | ์ธ๊ณผ์ถ๋ก ์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ - DoWhy | ์ธ๊ณผ์ถ๋ก ์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ DoWhy๋ ์ธ๊ณผ์ถ๋ก ์ ์ํ ๋ฉ์ปค๋์ฆ์ 4๋จ๊ณ๋ก ๊ตฌ์ฑํ์ต๋๋ค. 1๋จ๊ณ (Model)์์๋ ๋ฐ์ดํฐ๋ฅผ ์ธ๊ณผ ๊ทธ๋ํ๋ก ์ธ์ฝ๋ฉํ๊ณ , 2๋จ๊ณ (Identify)์์๋ ๋ชจ๋ธ์ ์ธ๊ณผ ๊ด๊ณ๋ฅผ ์๋ณํ๊ณ ์์ธ์ ์ถ์ ํฉ๋๋ค. 3๋จ๊ณ playinpap.gitbook.io โช Microsoft์ ์ธ๊ณผ์ถ๋ก ์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ DoWhy์ ๊ฐ์ด๋๋ฅผ ์คํฐ๋ํ๋ฉฐ ํ๊ตญ์ด ์๋ฃ๋ก ์์ฑํ ๊น๋ถ โป ๋ผ์ด๋ธ๋ฌ๋ฆฌ โป ๋ ผ๋ฌธ โก ์ค๋ฌด ์ธ๊ณผ์ถ๋ก ์ ์๊ณ โฏ ์ธ๊ณผ์ถ๋ก ์ best practice • ๊ฐ๋ฅํ๋ค๋ฉด Rando.. 2023. 6. 20. [industry] ์ธ๊ณผ์ถ๋ก ์์ ๋๋ฉ์ธ์ ์ญํ ๊ณผ ๊ต๋๋ณ์ ๋ณด์ ์ถ์ฒ ๐ ์ธ๊ณผ์ถ๋ก ๊ฐ์ธ ๊ณต๋ถ์ฉ ํฌ์คํธ ๊ธ์ ๋๋ค. ์ถ์ฒ๋ ์ฒจ๋ถํ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์ธ์! โ ๋๋ฉ์ธ๊ณผ ์ธ๊ณผ์ถ๋ก โฏ ์ธ๊ณผ์ถ๋ก ์ ๋๋ฉ์ธ์ ์๋น ๋ถ๋ถ ์์กดํ๋ ๋ฐฉ๋ฒ๋ก ์ด๋ค. Outcome ๊ณผ treatment ๊ทธ๋ฆฌ๊ณ confounder (๊ต๋๋ณ์) ๋ฅผ ํ์ ํ๋๋ฐ ์์ด ๋๋ฉ์ธ ์ง์์ ํ์๋ค. โฏ data-driven ํ๊ฒ ๋ณ์ ๊ฐ ๊ทธ๋ํ ๊ตฌ์กฐ๋ฅผ ์๋ณํ๊ธฐ ์ํ ์๋๋ก causal discovery ๋ผ๋ ๋ฐฉ๋ฒ์ด ์๋ค. ๊ทธ๋ฌ๋ ์ด ๋ฐฉ๋ฒ๋ ์ ์ฝ์ด ์์ผ๋ฉด ์๋ํ๊ธฐ ์ด๋ ต๊ณ , ๋ณ์ ๊ฐ์ ๋ชจ๋ ์กฐํฉ์ ๊ณ ๋ คํ๋ ๊ฒ์ ๊ณ์ฐ๋์ด ๋๋ฌด ๋ง๋ค. โฏ ์ธ๊ณผ์ถ๋ก : ์คํ/์ฒ์น/ํ๋/์ ์ฑ ์ด ๊ฐ์ ธ์จ ํจ๊ณผ๋ฅผ ์ ๋์ ์ผ๋ก ๋ถ์ → ๋ณ์๋ค ๊ฐ์ ๋ชจ๋ ๊ด๊ณ๋ฅผ ์ ํ์๋ ์๋ค. treatment ๋ฅผ ์ถ์ ํ ๋ ๊ต๋๋ณ์๋ฅผ ๋ณด์ (๋ชจํ์ ์ถ๊ฐ) ํ๋ค๋ ์ฌ์ค์ด ์ค์.. 2023. 6. 15. [industry] ํ๋ก๋ํธ ์ ๋๋ฆฌํฑ์ค์์์ ์ธ๊ณผ์ถ๋ก ์ ํ์ฉ ์ฌ๋ก์ ํฅํ ๊ณผ์ ๐ ์ธ๊ณผ์ถ๋ก ๊ฐ์ธ ๊ณต๋ถ์ฉ ํฌ์คํธ ๊ธ์ ๋๋ค. ์ถ์ฒ๋ ์ฒจ๋ถํ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์ธ์! โ ํ๋ก๋ํธ ์ ๋๋ฆฌํฑ์ค ์๊ฐ์ ์ธ๊ณผ์ถ๋ก ์ ์ค์์ฑ โฏ Product : ์ฌํ, ์๋น์ค, ์์ด๋์ด, ์ ํ โฏ Product Analytics • ๋ฐ์ดํฐ๋ฅผ ํตํด ์ฌ์ฉ์์ ํ๋ก๋ํธ ์ํธ์์ฉ์ ์ดํดํ๋ ๊ณผ์ • ์ ์ฌ ๊ฐ๋ โช Mobile and Web Analytics (๊ตฌ๊ธ์ ๋๋ฆฌํฑ์ค์ ๋น์ทํ ๊ฐ๋ ) : ๋ง์ผํ ๋น์ฉ, SEO, ํ์ด์ง ๋จ์์งํ ๋ถ์ ↔ Product Analytics : ํ๋ ๋ฐ์ดํฐ์ ๋ ๊น์ ๋ ๋ฒจ์ ๋ฐ์ดํฐ ํ์ โช Marketing Analytics : Traffic, Acquisition โจ where : ์ ์ ๋ค์ด ์ด๋์์ ์๋๊ฐ์ ๋ํด ๋๋ต ↔ Product Analytics : Engagement, Retenti.. 2023. 6. 1. ์ธ๊ณผ์ถ๋ก ๊ณผ ๋ฐ์ดํฐ์ฌ์ด์ธ์ค ๐ ์ธ๊ณผ์ถ๋ก ๊ฐ์ธ ๊ณต๋ถ์ฉ ํฌ์คํธ ๊ธ์ ๋๋ค. ์ถ์ฒ๋ ์ฒจ๋ถํ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์ธ์! โ ๊ธ1 : ์ธ๊ณผ์ฑ, ์ธ๊ณต์ง๋ฅ, ๊ธฐ๊ณํ์ต, ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค • ์ธ๊ณต์ง๋ฅ์ ์ด๋ค ์์ด์ ํธ๊ฐ ๋ชฉํ๋ฅผ ์ฑ์ทจํ๊ธฐ ์ํด ์ฃผ์ด์ง ํ๊ฒฝ์์ ํฉ๋ฆฌ์ ์ธ ์ก์ ์ ์ทจํ๋ ๊ฒ์ด๋ค. ์ด๋ ํ๊ฒฝ์ ๋ณํ๋ฅผ ์ฃผ์ด, ์ํ๋ ์ํ๋ก ๋ณํ์ํค๋ ์ธ๊ณผ๊ด๊ณ๋ก ํด์์ด ๊ฐ๋ฅํ๋ค. ๊ธฐ๊ณํ์ต์ ๋ฐ์ดํฐ์ ์๊ด์ฑ์ ํ์ตํ๋ ๊ฒ์ธ๋ฐ, ์ด๋ ์ธ๊ณผ๊ด๊ณ๋ฅผ ํตํด ํด์ํ๋ ๊ฒ๋ ๊ฐ๋ฅํ๋ค. ๋ฐ์ดํฐ๋ฅผ ํตํด ํ๊ณ ์ ํ๋ ์ง๋ฌธ์ ๋ฐ๋ผ ๋ค๋ฅด๊ฒ ์ง๋ง, ์ด๋ค ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ์ฒ๋ฆฌ, ๋ถ์ํ๊ณ ํด๋น ๊ฒฐ๊ณผ๋ฅผ ์ธ๊ฐ๊ณผ ์ด๋ป๊ฒ ์ํธ์์ฉํ ๊ฒ์ธ๊ฐ ํ๋ ๋ง์ ๋ถ๋ถ์์ ์๊ด์ฑ๊ณผ ์ธ๊ณผ์ฑ ๋ชจ๋ ๋ณตํฉ์ ์ผ๋ก ๊ณ ๋ คํ๋ค. โฏ Pearl's Causal Hierarchy (1) Associational or Observati.. 2023. 5. 12. [Causal ML] Causal inference ๊ณ ๋ ค๋ ์ฐ๊ณต ์ธ๋ฏธ๋ ๋ด์ฉ์ ๋ฆฌ • ๋ณธ๋ฌธ ๋ด์ฉ์ ๋ํ ์ถ์ฒ โ ์๊ด๊ด๊ณ์ ์ธ๊ณผ๊ด๊ณ โฏ ์๊ด๊ด๊ณ์ ์ธ๊ณผ๊ด๊ณ • ์๊ด๊ด๊ณ : ํต๊ณ์ ๋ณ์์ ๋ค๋ฅธ ๋ณ์๋ค์ด covariance (๊ณต๋ณ) ํ๋ ๊ด๊ณ โจ ์์ธก ๋ชฉ์ • ์ธ๊ณผ๊ด๊ณ : ์ ํํ๋ ํ ๋ณ์๊ฐ ํํํ๋ ๋ค๋ฅธ ๋ณ์์ ์์ธ์ด ๋๊ณ ์๋ค๊ณ ๋ฏฟ์ด์ง๋ ๊ด๊ณ โจ ์์ธ์ค๋ช ๋ชฉ์ • AI ๋ ๋ฐ์ดํฐ์ ์๊ด๊ด๊ณ ํจํด์ ํ์ตํ๋ค. ์ธ๋ถ ํ๊ฒฝ์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ์ ๋ณํ๋ ํจํด ๋ณํ๊ฐ ์ ์ ๋ถ์ผ์์๋ ์๊ด๊ด๊ณ๋ฅผ ํ์ตํ๋ ๊ฒ๋ง์ผ๋ก๋ ์ฑ๋ฅ์ด ๋ฐ์ด๋๋ค (NLP, vision, collaboration filtering) • ๊ทธ๋ฌ๋ ์ ๊ทธ๋ฌํ ๊ฒฐ๊ณผ๊ฐ ๋์๋์ง์ ๋ํด์๋ ์ค๋ช ํ์ง ๋ชปํ๋ค. โฏ ์์ • ๊ตฌ๋ ๊ฐฑ์ ์ฌ๋ถ๋ฅผ ์์ธกํ๋ ๋ชจ๋ธ๋ง์ ์งํํ ํ SHAP ๊ธฐ๋ฐ์ ๋ณ์ ์ค์๋๋ฅผ ๊ทธ๋ ค๋ณธ ๊ทธ๋ฆผ์ ์๋์ ๊ฐ๋ค. ๊ด๊ณ ์ง์ถ, ๋ฒ๊ทธ ๋ฆฌํฌํธ,.. 2023. 5. 7. [Causal ML] ๊ฐ์ฐ์๋ฃ ์ ๋ฆฌ โฏ Causal representation learning ์ถ์ฒ • ๋ณต์กํ ํ์ต ๋ชจ๋ธ์ ํน์ฑ์ ๋ํด ์ดํดํ๊ธฐ ์ํด ์ต๊ทผ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ์ธ๊ณผ์ถ๋ก ์ ๋ํ ๊ด์ฌ์ด ๋์์ง๊ณ ์๋ค. • causality ๋ฅผ ํ์ฉํ๋ค๋ฉด ๊ด์ฐฐ๋ ์ํฉ๊ณผ ๋ค๋ฅธ ํ๊ฒฝ์์๋ robust ํ ์์ธก์ ํ ์ ์์ผ๋ฉฐ ๋ฐ์ดํฐ ์ฌ์ด์ ์ธ๊ณผ๊ด๊ณ๋ ํ์ ํ ์ ์๊ธฐ ๋๋ฌธ์ causality ๊ด์ ์ด ๋ฐ๋์ ํ์ํ๋ค. causality ๋ฅผ ํตํด ML ์ ํ๊ณ์ ์ ๊ทน๋ณตํ ์ ์๋ค. • ๋ฅ๋ฌ๋ ์ฐฝ์์ ์์์ ๋ฒค์ง์ค๋ AI ๋ฅผ ๊ฐ๋ฐํ ๋ ์ธ์ง๋ฅ๋ ฅ์ ๋ํ๋ค๋ฉด ๋จธ์ ๋ฌ๋๊ณผ ๊ด๋ จ๋ ๋ฌธ์ ๋ค์ด ์ค๋ช ๊ฐ๋ฅํ๊ฒ ๋ ๊ฒ์ด๋ผ ์ ๋งํ๋ค. ์ฌ๋์ด ์์ํ๋ ์ธ์ง๋ฅ๋ ฅ์ ์คํํ ์ ์๋ ์๋ก์ด ํ์ต ๋ชจ๋ธ์ด ํ์ํ๋ค๋ฉฐ ์ธ๊ณผํ์ต์ ์ค์์ฑ์ ์ธ๊ธํ๋ค. โฏ Causal machine learn.. 2023. 5. 6. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๊ตฌ์กฐ์ ์ธ๊ณผ๋ชจํ์ ํ์ฉํ ์ธ๊ณผ์ถ๋ก ๊ฒฐ๊ณผ์ ๋ค๋ฅธ ์ง๋จ์ผ๋ก์ ์ ์ฉ ์ฐธ๊ณ ์์ : Bootcamp 5-4. Transporting • Transporting Causal effects across populations using structural causal modeling: the example of work-from-home productivity • ์ฐ๊ตฌ๋๊ธฐ : ์ธ๊ณผ๊ด๊ณ ์ถ๋ก ์ ์ํด์ ๊ฐ์ฅ ํ๋นํ๋ค๊ณ ์ฌ๊ฒจ์ง๋ ๋ฐฉ๋ฒ์ RCT ๋ฅผ ์ด์ฉํ ์ถ๋ก ์ด๋ค. ๊ด์ฌ์๋ ๋ถ๋ถ์ด ์ธ๊ณผํจ๊ณผ๋ผ๋ฉด, ์ธ๋ถ ์์ธ๋ค์ ํต์ ํจ์ผ๋ก์จ ์ถ๋ก ์ ํ๋น์ฑ์ ์ป์ ์ ์๋ค. ๊ทธ๋ฌ๋ ์คํ์ ๊ฒฐ๊ณผ๋ฅผ ๋ ๋ค๋ฅธ ์ธํ ์ ์ ์ฉํ์ ๋ ๊ทธ๊ฒ์ด ๋ฌด์กฐ๊ฑด ํ๋นํ์ง ์๋ค. ๊ทธ๋ฌ๋ ์ฐ๊ตฌ์๋ค์ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ์ข ๋ general ํ๊ฒ ์ฌ์ฉํ๊ณ ์ถ์ดํ๋ค. 1. Motivation: types of external validity (์ธ.. 2023. 5. 4. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๊ตฌ์กฐ์ ์ธ๊ณผ๋ชจํ ์ฐธ๊ณ ์์ : Bootcamp 5-3. ๊ตฌ์กฐ์ ์ธ๊ณผ๋ชจํ 1. Structural model โฏ Causal inference = How to address endogeneity • treatment ์ ๋ํ selection process (data generation process) ๋ฅผ ์๊ธฐ ์ด๋ ค์ด ๊ฒฝ์ฐ๊ฐ ๋ง์์, ์ธ๊ณผ์ถ๋ก ์ด ์ด๋ ค์ ์ง๋ ๊ฒ์ด๋ค. ๋ฐ๋ผ์ ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์ฌ๋ฌ ๋ฐฉ๋ฒ๋ก ๋ค์ด ๋ฑ์ฅํ ๊ฒ์ด๋ค. • Design based approach : selection process ๋ฅผ ์ ์ ์๋ research design ์ ํ์ฉํ๋ ๋ฐฉ๋ฒ • Selection model : selection process ๋ฅผ ํต๊ณ์ ์ผ๋ก ๋ชจ๋ธ๋ง ํจ์ผ๋ก์จ selection process ์์ selection bias .. 2023. 5. 1. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ๋์์ธ ๊ธฐ๋ฐ์ ์ธ๊ณผ์ถ๋ก ์์์ ์ธ๊ณผ ๊ทธ๋ํ ํ์ฉ ์ฐธ๊ณ ์์ : Bootcamp 5-2. ๋์์ธ ๊ธฐ๋ฐ์ ์ธ๊ณผ์ถ๋ก ์์์ ์ธ๊ณผ๊ทธ๋ํ ํ์ฉ 1. Structure-based Research design โฏ ์ Research design ์ ์ค๊ณํ๋ ๊ฒ์ด ์ค์ํ๊ฐ • ๊ฐฑ๋ ๊ธฐ ํธ๋ฅด๋ชฌ ์น๋ฃ๊ฐ ์๊ถ์์ ์ ๋ฐํ๋ ๊ฒ์ ๋ํ ์ธ๊ณผ์ถ๋ก • ์ฐ๊ตฌ์๋ค์ ๊ธฐ์กด์ ์ฐ๊ตฌ๊ฒฐ๊ณผ์ ๋ํด ์ด์๋ฅผ ์ ๊ธฐ โช ์์ผ๋ํ๊ต ์ฐ๊ตฌ : ํธ๋ฅด๋ชฌ ์น๋ฃ์ฝ์ด ์๊ถ์ถํ์ ์ผ๊ธฐํ๊ณ , ๋ฐ๋ผ์ ์ถํ์ด ์์ผ๋ฉด ๊ฒ์ฌ๋ฅผ ๋ฐ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ ์ ๋ณตํด์๋ ์๊ถ์์ ๋ฐ๊ฒฌํ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ์ฆ, ํธ๋ฅด๋ชฌ ์น๋ฃ๊ฐ ์๊ถ์์ ์ ๋ฐํ๋ ๊ฒ์ด ์๋๊ณ , ์ถํ์ด ๋ฐ์ํ์ฌ ๊ฒ์ฌ๋ฅผ ๋ฐ์๋ณด๋ ์ ๋ณตํ๋ ์๊ถ์์ ๋ฐ๊ฒฌํ๋ค๋ ์ฃผ์ฅ์ธ ๊ฒ์ด๋ค. • ์๊ถ์ถํ์ด๋ผ๋ ์์ธ์ ํต์ ํจ์ผ๋ก์จ ์ด๋ฌํ ํจ๊ณผ๋ฅผ ๋ฐฐ์ ํ๊ณ ์ค์ ํธ๋ฅด๋ชฌ ์น๋ฃ๊ฐ ์๊ถ์ ์ ๋ฐ์ ๋ํ ์ธ๊ณผ๊ด.. 2023. 5. 1. ์ธ๊ณผ์ถ๋ก ์ ๋ฐ์ดํฐ ๊ณผํ - ์ธ๊ณผ๊ทธ๋ํ ์ฐธ๊ณ ์์ : Bootcamp 5-1. ์ธ๊ณผ๊ทธ๋ํ โธ Causal graph : Directed Acyclic graph and Bayesian network 1. Causal graph (diagram) • ์ธ๊ณผ๊ด๊ณ ๊ตฌ์กฐ๋ฅผ ๊ทธ๋ํ๋ก ํํํ๋ ๋ฐฉ๋ฒ โฏ Directed Acyclic Graph (DAG) • Graph : ๊ฐ ๋ ธ๋๋ ๊ฐ ๋ณ์๋ฅผ ๋ปํ๊ณ , ๋ ธ๋๋ค ๊ฐ์ ์ฃ์ง๊ฐ ๋ณ์๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค. • Directed : ์ฃ์ง์ ๋ฐฉํฅ์ฑ์ด ์๋ค๋ ๋ป์ผ๋ก, ์์ธ๊ณผ ๊ฒฐ๊ณผ์ ๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค. • Acyclic : Cyclic ์ ๋ฐ๋๋ง๋ก, ์ํ๊ณ ๋ฆฌ๊ฐ ์๋ค๋ ๋ป์ด๋ค. ์ญ์ธ๊ณผ๊ด๊ณ๊ฐ ์ฑ๋ฆฝํ์ง ์๋๋ค๋ ๊ฒ์ ์๋ฏธํ๋ค. โฏ Bayesian Network (Belief Network) • DAG ๋ฅผ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ก ๋์ํํ .. 2023. 4. 28. ์ด์ 1 2 3 4 5 ๋ค์ 728x90