• ๋ณธ๋ฌธ ๋ด์ฉ์ ๋ํ ์ถ์ฒ
โ ์๊ด๊ด๊ณ์ ์ธ๊ณผ๊ด๊ณ
โฏ ์๊ด๊ด๊ณ์ ์ธ๊ณผ๊ด๊ณ
• ์๊ด๊ด๊ณ : ํต๊ณ์ ๋ณ์์ ๋ค๋ฅธ ๋ณ์๋ค์ด covariance (๊ณต๋ณ) ํ๋ ๊ด๊ณ โจ ์์ธก ๋ชฉ์
• ์ธ๊ณผ๊ด๊ณ : ์ ํํ๋ ํ ๋ณ์๊ฐ ํํํ๋ ๋ค๋ฅธ ๋ณ์์ ์์ธ์ด ๋๊ณ ์๋ค๊ณ ๋ฏฟ์ด์ง๋ ๊ด๊ณ โจ ์์ธ์ค๋ช ๋ชฉ์
• AI ๋ ๋ฐ์ดํฐ์ ์๊ด๊ด๊ณ ํจํด์ ํ์ตํ๋ค. ์ธ๋ถ ํ๊ฒฝ์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ์ ๋ณํ๋ ํจํด ๋ณํ๊ฐ ์ ์ ๋ถ์ผ์์๋ ์๊ด๊ด๊ณ๋ฅผ ํ์ตํ๋ ๊ฒ๋ง์ผ๋ก๋ ์ฑ๋ฅ์ด ๋ฐ์ด๋๋ค (NLP, vision, collaboration filtering)
• ๊ทธ๋ฌ๋ ์ ๊ทธ๋ฌํ ๊ฒฐ๊ณผ๊ฐ ๋์๋์ง์ ๋ํด์๋ ์ค๋ช ํ์ง ๋ชปํ๋ค.
โฏ ์์
• ๊ตฌ๋ ๊ฐฑ์ ์ฌ๋ถ๋ฅผ ์์ธกํ๋ ๋ชจ๋ธ๋ง์ ์งํํ ํ SHAP ๊ธฐ๋ฐ์ ๋ณ์ ์ค์๋๋ฅผ ๊ทธ๋ ค๋ณธ ๊ทธ๋ฆผ์ ์๋์ ๊ฐ๋ค. ๊ด๊ณ ์ง์ถ, ๋ฒ๊ทธ ๋ฆฌํฌํธ, ๊ตฌ๋ ํ ์ธ์ด ์์ธก์ ์ค์ํ ๋ณ์๋ก ๋์๋ค.
• ๊ทธ๋ฌ๋ EconML ์ ํ์ฉํด์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์ดํด๋ณธ ๊ฒฐ๊ณผ, ๊ตฌ๋ ํ ์ธ๊ณผ๋ ์์ ์๊ด๊ด๊ณ์์ง๋ง ์์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ๊ฐ์ง ๊ฒ์ผ๋ก ๋ํ๋ฌ๊ณ , Sales Calls ๊ฐ ์คํ๋ ค ๊ตฌ๋ ๊ฐฑ์ ๊ณผ ๊ด๋ จํ์ ์์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ๊ฐ์ง๊ณ ์์์ ๋ฐ๊ฒฌํ๋ค.
โก ์ธ๊ณผ๊ด๊ณ ๋ถ์ ๋ฐฉ๋ฒ
1. Randomization: AB test, MAB
2. Causal graphical models (Bayesian network)
3. Potential outcome: ATE, CATE
โฏ Randomization
โด A/B test
• Randomized clinical test ๋ฌด์์ ์์์ํ โจ A/B test ๋ผ๊ณ ๋ ๋ถ๋ฆผ
• ์ธก์ ํ๊ณ ์ ํ๋ ๋ณ์ ์ด์ธ์๋ ๋ชจ๋ ๊ฒ๋ค์ ์ต๋ํ ๊ณ ์ ํ์ฌ ํ์ธํ ๋ณ์๋ง ๋ณ๊ฒฝํ๋ฉด์ ์คํํ๋ ๋ฐฉ๋ฒ โจ ์คํ๊ธฐ๋ฐ
• ๋ฌด์์ ๋ฐฐ์ ์ผ๋ก ํ๊ท ์ ์ธ ํจ๊ณผ ์ธก์ ์ด ๊ฐ๋ฅ
• ๋ฌด์์ ์์์ํ์ ๊ฒฐ๊ณผ๋ฅผ ํด์ํ ๋์๋ ํ๋ฉด์ ์ธ ๊ฒฐ๊ณผ ๋ฟ ์๋๋ผ, ํต๊ณ์ ์ผ๋ก๋ ์ ์ํ์ง ํ์ธํ๋ ๊ณผ์ ์ด ํ์ํ๋ค !
โต Multi-Armed Bandit (MAB)
• Exploration ํ์ (์๋ก์ด ์ ๋ณด๋ฅผ ์ฐพ์๋ด๊ธฐ ์ํด ํ์) : A๊ฐ ๋ ์ข์ ๊ฒ์ด๋ผ๋ ๊ฒ์ ์๊ณ ์์ด๋ B๋ฅผ test ํ๋ฉด์ ๋ชจ๋ Bandit machine ์ ๊ณ์ ๋น๊ธด๋ค - ์์๋๋ก A๊ฐ ์ข์๋ค. ์ด์ฐจํผ A๊ฐ ์ข์๊ธฐ ๋๋ฌธ์ B๋ฅผ ์ํํ๋ ๋น์ฉ์ด ๋ฐ์๋์๋ค.
• Exploitation ํ์ฉ (๊ทธ๋์์ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ต์ ์ ๊ฒฐ์ ์ ๋ด๋ฆผ) : ๋ชจ๋ Bandit machine ๋ฅผ ํ ๋๋ฒ๋ง ๋น๊ฒจ๋ณด๊ณ ๊ฐ์ฅ ์์ต๋ฅ ์ด ๋์ ๋จธ์ ์ ์ ํํ๋ค - ์ ๋ขฐ์ฑ ๋ฌธ์ - ๋ง์ฝ ํ ์คํธ๋ฅผ ์ค๋ํ๋ค๋ฉด ์ด๋ค ๊ฒฐ๊ณผ๊ฐ ๋์์๊น
• A/B test ๋ Exploration-Exploitation Tradeoff ๊ฐ ์กด์ฌํ๋ค โจ MAB ๋ ๊ฐํํ์ต ๊ธฐ๋ฐ์ผ๋ก ํ์๊ณผ ํ์ฉ์ ์ต์ ํ ํ์ฌ ์์ต๋ฅ ์ ๊ทน๋ํ ํ๋ค.
• MAB ์๊ณ ๋ฆฌ์ฆ: Greedy, Epsilon Greedy, Upper Confidence Bound
โช Greedy : ํ ๋ฒ์ฉ ํด๋ณด๊ณ Reward ๊ฐ ๊ฐ์ฅ ์ข์ ์๊ณ ๋ฆฌ์ฆ์ ์ ํ
โช Epsilon Greedy : ε ์ ํ๋ฅ ๋ก ๋๋คํ๊ฒ action ์ ์ ํ, 1 - ε ํ๋ฅ ๋ก๋ greedy ์๊ณ ๋ฆฌ์ฆ์ ์ํ
โช UCB : ํ์ฌ ์์ ๊น์ง ํ๋ a๋ฅผ ํ ํ์ Nt(a) ๋ฅผ ์ ์ํ์ฌ, ๋ถ๋ชจ์ ์ด๋ฅผ ๋ฃ์ด ํํํ์ง ์์ ํ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ค.
โฏ Causal Graphical models = Bayesian network
• ์ธ๊ณผ ๊ทธ๋ํ ๋ชจํ : Directed Acyclic Graphs (DAG)
• Randomization ์ ๊ฒฝ์ฐ์๋ ํ๊ท ์ ์ธ ์ธ๊ณผํจ๊ณผ๋ง ํ์ธ์ด ๊ฐ๋ฅํ๋ค. ์ด๋ค ์ฌ๋๋ค์๊ฒ ๋ ํจ๊ณผ์ ์ธ์ง ์ธ๋ถ์ ์ธ ์ ๋ณด์ ํ์ธ์ด ์ด๋ ต๋ค.
• ์ธ๊ณผ ๊ทธ๋ํ ๋ชจํ์ ์ธ๊ณผ๊ด๊ณ๋ฅผ DAG ๋ผ๋ ๊ทธ๋ํ๋ก ํํํ๋ ๋ฐฉ์์ผ๋ก, ๋ช ํํ ์ธ๊ณผ๊ด๊ณ ํ์ ์ด ๊ฐ๋ฅํ๋ค.
• ๋ณ์๋ค์ ๊ฒฐํฉํ๋ฅ ๋ถํฌ๋ฅผ DAG ๋ก ๋ํ๋ธ ๋ชจํ์ผ๋ก, ๋ฅ๋ฌ๋๊ณผ ๋ฌ๋ฆฌ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ด ํฌ๋ช ํ๊ฒ ๊ณต๊ฐ๋๋ฏ๋ก white-box model ์ด๋ผ ํ ์ ์๋ค.
โฏ Potential Outcome
• ์ธ๊ณผ๊ด๊ณ๋ ๋ชจ๋ ๊ฒฐ๊ณผ๋ฅผ ๊ด์ธกํ ์ ์๋ ํ๊ณ๊ฐ ์กด์ฌ (ํ์ค์์๋ ์๊ฐ์ ๋๋๋ฆฌ๊ธฐ๊ฐ ๋ถ๊ฐ๋ฅ)
• ๊ด์ธก๋์ง ์์ ๊ฐ์์ ๊ฒฐ๊ณผ Counterfactual ๋ฅผ ๊ณ ๋ คํด์ ์ฒ๋ฆฌํจ๊ณผ๋ฅผ ๊ณ์ฐํ๋ ๋ฐฉ์
• Treatment Effect ์ฒ๋ฆฌํจ๊ณผ : τ = Y(1) - Y(0) : (๋ํ์์ ์งํํ ์ฌ๋์ ๊ณ์ฝ์ฐ๋ด) - (๋ํ์์ ์งํํ์ง ์์ ์ฌ๋์ ๊ณ์ฝ์ฐ๋ด)
• ๋์์ ๊ด์ธก์ด ๋ถ๊ฐ๋ฅํ๋ฏ๋ก, Counterfactual ๋ฅผ ๋จธ์ ๋ฌ๋์ผ๋ก ์์ธกํด ์ฑ์๋ฃ๊ณ , ๊ฐ์ธ์ ๋ํ ํจ๊ณผ๋ฅผ ์ธก์ ํ๋ ๋์ ๋ชจ๋ ์ฌ๋์ ํจ๊ณผ๋ฅผ ๋น๊ตํ๊ต ํ๊ท ์ ๊ตฌํด๋ณด์ : ATE (average treatment effect)
• CATE : conditional ATE : ๊ต๋๋ณ์๋ฅผ ๊ณ ๋ คํ์ฌ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ก causal effect ๋ฅผ ๊ณ์ฐํ๋ค.
โช P(Y|T) vs P(Y|T,S)P(S)
• ์ ๋ฆฌ
• Machine learning Based
โช ๋จธ์ ๋ฌ๋ ๋ฐฉ๋ฒ์ ๊ธฐ๋ฐ์ผ๋ก CATE ๋ฅผ ์ถ์ ํ๋ ๋ฐฉ๋ฒ ์ค ํ๋ : Meta learners
โช T-learner : control ๊ณผ treatment ๊ฐ๊ฐ์ ๋ค๋ฅธ ๋ชจํ์ผ๋ก ํ์ต์์ผ ์ด๋ค์ ์ฐจ์ด๋ก CATE ์ถ์
โช S-learner : Y๋ฅผ ๋ฐ์๋ณ์, ์ฒ๋ฆฌ์ฌ๋ถ W๋ฅผ ์ค๋ช ๋ณ์๋ก ์ค์ ํด ๋จ์ผํ ๋ชจํ M ์ ํ์ตํ๋ค. W=1 ์ผ๋ ์ถ์ ๊ฐ์์ W=0 ์ผ๋ ์ถ์ ๊ฐ์ ์ฐจ์ด๋ก CATE ์ถ์
โช X-learner : T-learner ์ฒ๋ผ ํ์ตํ ๋ค, ๋ชจ๋ธ์ ์์ธก๊ฐ์ ๋ค์ Counterfactual ๋ก ์ฌ์ฉํด ์ฐจ์ด๋ฅผ ํ์ตํ๋ค. CATE0, CATE1์ด ๋ง๋ค์ด์ง๊ณ ์ด๋ฅผ ๊ฐ์คํ๊ท ํ์ฌ final CATE ๋ฅผ ๋ง๋ ๋ค. ์ด๋ฅผ ํตํด ๋ ์ง๋จ ๊ฐ ๋ฐ์ดํฐ ์์ ์ฐจ์ด๋ฅผ ํด๊ฒฐํ๋ค.
• Neural Net Based
โช NN ๊ธฐ๋ฐ์ CATE ์ถ์ ๋ฐฉ๋ฒ
โช Representation layer ๋ ๊ณต์ ํ๋ฉด์, control/treatment ์ง๋จ์ ๊ฒฐ๊ณผ๋ฅผ ๋๋์ด ์์ธกํ๋ค.
๋๊ธ