๐ ์ธ๊ณผ์ถ๋ก ๊ฐ์ธ ๊ณต๋ถ์ฉ ํฌ์คํธ ๊ธ์ ๋๋ค. ์ถ์ฒ๋ ์ฒจ๋ถํ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํด์ฃผ์ธ์!
โ ๋ฐํ ๋ฐฐ๊ฒฝ
ttps://playinpap.gitbook.io/dowhy/
โช Microsoft์ ์ธ๊ณผ์ถ๋ก ์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ DoWhy์ ๊ฐ์ด๋๋ฅผ ์คํฐ๋ํ๋ฉฐ ํ๊ตญ์ด ์๋ฃ๋ก ์์ฑํ ๊น๋ถ
โป ๋ผ์ด๋ธ๋ฌ๋ฆฌ
โป ๋ ผ๋ฌธ
โก ์ค๋ฌด ์ธ๊ณผ์ถ๋ก ์ ์๊ณ
โฏ ์ธ๊ณผ์ถ๋ก ์ best practice
• ๊ฐ๋ฅํ๋ค๋ฉด Randomization ์ ํ์ฉํ๊ธฐ
• Randomization ์ด ๋ถ๊ฐ๋ฅํ๋ค๋ฉด, Natural experiment ๋ฅผ ํ์ฉํ๋ ๊ฒ์ ๊ณ ๋ คํ๊ธฐ
• Natural experiment ๋ฅผ ํ์ฉํ๋ ๊ฒ์ด ์ด๋ ต๋ค๋ฉด, Conditioning Method ๋ฅผ ๊ณ ๋ คํ๊ธฐ
โฏ Randomization
• A/B ํ ์คํธ์ ๊ฐ์ ์๋ฏธ๋ก, ํ์ ์์๋ Agile ํ A/B ํ ์คํธ ํ์ดํ๋ผ์ธ์ ๊ตฌ์ถํ๋๋ฐ ์ต์ ์ ๋คํ๋ ๊ฒ์ด ์ข๋ค. MAB, Uplift modeling ์ ํตํด Randomization ์ ํจ์จ์ ๋์ฌ์ฃผ๊ฑฐ๋ ์ถ๊ฐ์ ์ธ ๊ฐ์น๋ฅผ ๋ํด์ค ์ ์๋ค.
โฏ Natural experiment
• ์คํ์ ์ํฉ์ ๊ฐ๊น์ด ๋ถ๋ถ์ ์ธ ๋ฐ์ดํฐ์ ์ ์ฐพ์๋ ๊ด์ (As-if-random)
• ๊ด์ธก๋์ง ์๋ ๋ณ์ (Unobserved confounder) ๋ ์์ผ๋ ๋ค ํต์ ํ ์ ์๋ ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ ์ ์๋ ๋ฐฉ์์ด๋ผ ์ ํธ๋๋ค.
โฏ Conditioning methods
• ๊ฐ์ ๋ค์ ๊ธฐ๋ฐ์ผ๋ก ๋ณ์๋ค์ ํต์ ํ๋ ๊ด์
• DoWhy ์์๋ 5๊ฐ์ง ๋ฐฉ์์ ์ ๊ณต
Matching and Stratification (Propensity score) |
Weighting (Propensity score) |
Regression |
Doubly Robust |
Synthetic Controls |
โฏ ์๊ณ : ์๋จ์ ์๋ ๋ฐฉ๋ฒ๋ค์ด ์ฌ์ฉํ๊ธฐ์๋ ์ข์
โข ํ ์ ์๋ ๋ฌธ์ ์ ํ๊ณผ ์ฌ๋ก๋ถ์
โฏ ๋ฌธ์ ์ ์ ํ
โด A/B ํ ์คํธ๋ฅผ ์งํํด๋ ์ ์ ๊ฐ ์ฒ์น๋ฅผ ๋ฐ์ง ์์ ์ ์๋ค. ์ด๋ ์ฒ์น์ ํจ๊ณผ๋ฅผ ์ด๋ป๊ฒ ํ์ธํ ๊น
โช ๋ฐ์ดํฐ ํํ : ์คํ
โช ๋ฐฉ๋ฒ๋ก : ๋๊ตฌ๋ณ์
โต ๋น์ฉ์ด ์๋ฐ๋๋ A/B ํ ์คํธ๋ฅผ ์งํํ๋ค. ์ด๋ค ์ ์ ์๊ฒ ๊ฐ์ฅ ์ฒ์น์ ํจ์จ์ ๊ทน๋ํ์ํฌ ์ ์์๊น
โช ๋ฐ์ดํฐ ํํ : ์คํ
โช ๋ฐฉ๋ฒ๋ก : ์ ๋ฆฌํํธ ๋ชจ๋ธ๋ง
โถ A/B ํ ์คํธ๋ฅผ ์งํํ์ง ์์๋ค. ์ฒ์น์ ํจ๊ณผ๋ฅผ ์ด๋ป๊ฒ ํ์ธํ ์ ์์๊น
โช ๋ฐ์ดํฐ ํํ : ๊ด์ธก
โช ๋ฐฉ๋ฒ๋ก : ์ด์ค์ฐจ๋ถ๋ฒ, ๋งค์นญ
• ์ฒ์น : ํจ๊ณผ๋ฅผ ์ธก์ ํ๊ณ ์ ํ๋ ๋ณ์, ์คํ ๋จ์์ ๊ฐํ๋ ์กฐ๊ฑด (e.g. ํ๋ก๋ชจ์ , ๊ธฐ๋ฅ์ฌ์ฉ, ํ์ ์กฐํ, ํธ์ ํด๋ฆญ ๋ฑ)
• Experimental data : ์ฒ์น๊ฐ ์๊ณ ๋๋จธ์ง๋ ํต์ ๋ ์คํ๊ตฐ, ๋์กฐ๊ตฐ ์ง๋จ์ ๋ฐ์ดํฐ
• Observational data : ์ฒ์น์ ํต์ ๊ฐ ์์ด ๊ทธ์ ๊ด์ธก๋ ์ง๋จ์ ๋ฐ์ดํฐ
โฏ ๋ฐฉ๋ฒ๋ก 01. ๋๊ตฌ๋ณ์
โด KDD 2021 Trip advisor ์ฌ๋ก
โป DRIV : ์ธ๊ณผ์ถ๋ก + ๋จธ์ ๋ฌ๋ ๊ฒฐํฉ ๋ฐฉ๋ฒ
• ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ๋ก ์ ์ฉ์ด ๋ถ๊ฐ๋ฅํ ์ด์
โช ๋ฉค๋ฒ์ญ ๊ฐ์ ์ ์ vs ๋ฏธ๊ฐ์ ์ ์ ์ ์ฒด๋ฅ์๊ฐ ๋จ์ ๋น๊ต โจ confoundedness ์ด์ ๋ฐ์ : ๋ฉค๋ฒ์ญ์ ๊ฐ์ ํ ์ ์ ๋ ๊ฐ์ ํ์ง ์์ ์ ์ ๋ณด๋ค ์๋น์ค์ ๋ํ ์ ์ ์ ํธ๋๊ฐ ๋ณธ๋ ๋์ ๊ฒ. ์๋น์ค์ ๋ํ ์ ์ ์ ์ ํธ๋๊ฐ ๋์ผ๋ฉด, ์ฒด๋ฅ์๊ฐ๋ ๋์ ๊ฒ. ์ฆ User uffinity ๊ฐ Tripadvisor membership (treatment) ์ User engagement (Outcome) ๋ชจ๋์ ์ํฅ์ ๋ฏธ์น๋ confounder ๋ก ์์ฉํจ.
โช A/B test ์งํ โจ Imperfect compliance ์ด์ ๋ฐ์ : treatment ๊ฐ ๋ฉค๋ฒ์ญ ๊ฐ์ ์ด๋ผ ํ์ ๋, ๋๋ค ์ถ์ถ๋ ์ผ๋ถ ์ ์ ์๊ฒ ๋ฉค๋ฒ์ญ ๊ฐ์ ์ ๊ฐ์ ํ ์๋ ์์. ์ ์ ๊ฐ ์ฐธ์ฌ ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ ์ ์๋ ์ด๋ฒคํธ์ ๊ฒฝ์ฐ ํด๋น ๋ฌธ์ ๊ฐ ๋ฐ์
• Recommendation A/B ํ ์คํธ ์งํ
โช A/B ํ ์คํธ์์ ๋๊ตฌ๋ณ์๋ฅผ ํ์ฉํด ์๊ณ ์ ํ๋ ์ธ๊ณผ๊ด๊ณ ์ถ์ ์ ์งํํ๊ณ ์ ํจ
โช ๋๊ตฌ๋ณ์ : ์์ธ๋ณ์์์ ๋ด์์ฑ (confoundedness, selection bias, error term) ์ ๊ฐ์ง๋ ๋ถ๋ถ์ ์๋ผ๋ด๊ณ , ์ธ์์ฑ์ ๋ง์กฑํ๋ ๋ถ๋ถ์ผ๋ก๋ง ๊ฒฐ๊ณผ๋ณ์๋ฅผ ์์ธกํ๋ ๋ฉ์ปค๋์ฆ
โช ํ์ฉํ ๋๊ตฌ๋ณ์ : ๋ ๋น ๋ฅธ ๋ฉค๋ฒ์ญ ํ์๊ฐ์ ๊ณผ์
โช ์ค์ ํ ๋ชฉํ : ์๋กญ๊ฒ ๋ฐ๋ ํ์๊ฐ์ ๊ณผ์ ์ด ์ ์ ์ ๋ฆฌํ ์ ์ ํฅ์์ํค๋๊ฐ
โต 2021 ๋ก๋ธ๋ก์ค ์ฌ๋ก
• Recommendation A/B ํ ์คํธ ์งํ
โฏ ๋ฐฉ๋ฒ๋ก 02. ์ ๋ฆฌํํธ ๋ชจ๋ธ๋ง
โด KDD 2021 Uber Eats ์ฌ๋ก
• Uplift score = P(outcome | treatment, x) - P(outcome | no treatment,x)
• Uplift model ์ดํดํ๊ธฐ
โช ๊ด๊ณ ๋ฅผ ๋ณผ ๋ ๊ตฌ๋งคํ๊ณ , ๊ด๊ณ ๋ฅผ ๋ณด์ง ์์ ๋ ๊ตฌ๋งคํ์ง ์๋ Persuadables ์ ์ง์ค!
• Uplift modeling ๋ฉ์ปค๋์ฆ
โช ์ธ๊ณผํจ๊ณผ (์ฆ๋ถ, uplift score) ๋ฅผ ๋ชจ๋ธ๋ง
โช A/B ํ ์คํธ๋ฅผ ํตํ ์คํ ๋ฐ์ดํฐ๋ฅผ input ์ผ๋ก ๋ฐ์์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์บ ํ์ธ์ ํจ๊ณผ๋ฅผ ๋น๊ตํ๋ ๊ฒ์ ๊ทธ์น์ง ์๊ณ ์ค์ ๋น์ฆ๋์ค ๊ฐ์น๋ฅผ ๊ทน๋ํ ํด์ค ์ ์๋ ๊ธฐ๋ฒ
โช ๋ฐ์ดํฐ๋ฅผ ๊ณ์ธตํ stratify ํ๊ณ ๊ฐ ๊ณ์ธต strata ๋ด์์ ํ๊ท ์ฒ์นํจ๊ณผ (CATE) ๋ฅผ ๋จธ์ ๋ฌ๋์ ํตํด ์ถ์ ํ๊ณ ๊ณ์ธต๊ฐ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ๋ ๋ฉ์ปค๋์ฆ
• ํ์ฉ ๊ฒฐ๊ณผ : Uplift score ๊ฐ ์์ 60% ์ธ ์ ์ ๊น์ง๋ง, Gain ์ด ๊ฐ์ฅ ๋์ ๊ธฐ์ธ๊ธฐ๋ก ์ฆ๊ฐ (์ด ์ธ๊ทธ๋จผํธ๊น์ง ํ๊ฒํ ํ์ ๋ ์์ฐ์จ์ 40%๋ก ์ค์ด๋ฉด์ ์์ตํจ์จ์ 67% ์ฆ๊ฐ์ํฌ ์ ์์ ๊ฒ์ผ๋ก ์์) → ์ค์ ๋ก ์จ๋ผ์ธ ์คํ ์งํ์ ์์ฐ์ 46%๋ก ์ค์ด๋ฉฐ ์์ต ๊ธฐ์ค ROAS 93%๊น์ง ์ฆ๊ฐํจ
โต 2020 DoorDash ์ฌ๋ก
โป DoorDash ๋ ์์๋ฐฐ๋ฌ ์๋น์ค ํ์ฌ์
• LightGBM ์ ํ์ฉํ uplift modeling ์ผ๋ก ํ๋ก๋ชจ์ ์ ๋น์ฉํจ์จ์ ์ผ๋ก ๋ฐ์ํ๋ ์ธ๊ทธ๋จผํธ๋ฅผ ๋ฐ๊ฒฌ
โฏ ๋ฐฉ๋ฒ๋ก 03. DiD/Matching
โต Microsoft Dowhy ์ํ ๋ ธํธ๋ถ ์ฌ๋ก
โฃ ์ค๋ฌด์ ์ ์ฉํ ๋์ ์ด๋ ค์
• ์ธ๊ณผ์ถ๋ก ์ ์ํ ๊ฐ์ ๋ค
• ์ฌ๋์ ๋ํ ๋ฐ์ดํฐ๊ฐ ๊ฐ์ง๋ ๋ณธ์ง์ ์ธ ํ๊ณ
• Educational Gap
โค ATE, CATE, HTE ๊ฐ๋ ์ ๋ฆฌํ๊ธฐ
โฏ ATE, average treatment effect
• ๊ฐ์ ์ ์ธ๊ณผํจ๊ณผ๋ฅผ ์ ์ฒด ์ง๋จ์ ๋ ๋ฒจ์์ ์ค๋ช
โฏ CATE, conditional average treatment effect
• ์ ์ ์ ํน์ฑ (๊ณต๋ณ๋ ๋ณ์) ์ ๋ฐ๋ผ ํ์ ๋๋ ๊ตญ์ง์ ์ธ ์ธ๊ณผํจ๊ณผ๋ฅผ ์๋ฏธํ๋ค.
• covariates ์์ : ์ฑ๋ณ, ๋์ด, ์๋ ์์ค ๋ฑ
• CATE ๋ก ๊ณต๋ณ๋ ๋ณ์๋ฅผ ์ด๋ป๊ฒ ์ ์ํ๊ณ ์ชผ๊ฐ๋ณด๋๋์ ๋ฐ๋ผ ํ์ธํ ์ ์๋ ์ธ์ฌ์ดํธ๊ฐ ๋ฌ๋ผ์ง๋ค.
โฏ HTE, Heterogeneous treatment effect
• CATE ๊ฐ์ ์ฐจ์ด๋ฅผ ์๋ฏธํ๋ค. ๋ฐ์ดํฐ๋ฅผ ๊ณ์ธตํํ๊ณ ๊ฐ ๊ณ์ธต ๋ด์์ ATE ๋ฅผ ์ถ์ ํ์ฌ ๊ณ์ธต๊ฐ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ๋ค. subgroup analysis
• CATE ๋ฅผ ์ถ์ ํ๋ ๋ชจ๋ธ์ ๋ค์ํ๊ฒ ์๊ณ , ๊ทธ์ค ํ๋๊ฐ Uplift modeling ์ด๋ค. ๋จธ์ ๋ฌ๋์ ํตํด ์ธ๊ณผ ํจ๊ณผ๋ฅผ ์ถ๋ก ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์ข ๋ ์์ธํ๋, Meta-learner๋ฅผ ํ์ฉํด CATE๋ฅผ ์์ธกํ๋ ๋ฐฉ๋ฒ์ด๋ค.
• HTE ๋ชจ๋ธ์ subpopulation ์๊ฒ ์ ํ์ ์ผ๋ก Rollout ํจ์ผ๋ก์จ ํฅ์๋ ๊ฐ์ธํ๋ฅผ ๊ฐ์ ธ์จ๋ค.
๐ Uplift modeling ์ฐธ๊ณ ์๋ฃ
ํต๊ณ์ ํ๊ณผ ๋จธ์ ๋ฌ๋์ผ๋ก ํด๋น๊ณ ๊ฐ๊ณผ "๋น์ทํ ๊ณ ๊ฐ"์ด ํ๊ท ์ ์ผ๋ก ์ด๋ ์ธ๊ทธ๋จผํธ์ ์ํด ์๋์ง ๋ ์ ์ ์์ ๊ฒ์ด๋ค. ์ด๊ฒ์ด Uplift modeling์ด ์ฐ๋ฆฌ์๊ฒ ์๋ ค์ฃผ๋ ๊ฒ์ด๋ค. Uplift modeling์ ํน์ ๊ณ ๊ฐ์๊ฒ ์บ ํ์ธ์ ์ ๊ณตํ๋๊ฒ์ด ์ด๋์ธ์ง ์๋์ง๋ฅผ ๊ฒฐ์ ํ๋ task๋ฅผ ์ํด ๋ง๋ค์ด์ก๊ณ , ์ด๊ฒ์ ์ด๋ค ๊ณ ๊ฐ์ด ์ด๋ค ์ธ๊ทธ๋จผํธ์ ์ํ๋์ง ๊ฒฐ์ ํ๋ ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ ์ด๋ฉฐ, ๊ฒฐ๊ณผ์ ์ผ๋ก ๋ง์ผํ ์๋จ์ด ๊ณ ๊ฐ์ ๊ตฌ๋งค๋ก ์ด์ด์ง๋ ํ๋ฅ ์ ๊ฒฐ์ ํ๋ ๊ฒ์ ๋๋ ๋ชจ๋ธ๋ง ์ด๋ค.
'1๏ธโฃ AIโขDS > ๐ฅ Casual inference' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[The Brave and True] 2. Randomized Experiments (0) | 2023.06.21 |
---|---|
[The Brave and True] 1. Introduction to causality (0) | 2023.06.20 |
[industry] ์ธ๊ณผ์ถ๋ก ์์ ๋๋ฉ์ธ์ ์ญํ ๊ณผ ๊ต๋๋ณ์ ๋ณด์ (0) | 2023.06.15 |
[industry] ํ๋ก๋ํธ ์ ๋๋ฆฌํฑ์ค์์์ ์ธ๊ณผ์ถ๋ก ์ ํ์ฉ ์ฌ๋ก์ ํฅํ ๊ณผ์ (0) | 2023.06.01 |
์ธ๊ณผ์ถ๋ก ๊ณผ ๋ฐ์ดํฐ์ฌ์ด์ธ์ค (0) | 2023.05.12 |
๋๊ธ