๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

[industry] ์ธ๊ณผ์ถ”๋ก  ํ™œ์šฉ : Best practice

by isdawell 2023. 6. 20.
728x90

 

 

๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”!

 

 

 

 

โ‘   ๋ฐœํ‘œ ๋ฐฐ๊ฒฝ 


 

 

ttps://playinpap.gitbook.io/dowhy/

 

DoWhy | ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ - DoWhy | ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ

DoWhy๋Š” ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•œ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ 4๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. 1๋‹จ๊ณ„ (Model)์—์„œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋กœ ์ธ์ฝ”๋”ฉํ•˜๊ณ , 2๋‹จ๊ณ„ (Identify)์—์„œ๋Š” ๋ชจ๋ธ์˜ ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ์‹๋ณ„ํ•˜๊ณ  ์›์ธ์„ ์ถ”์ •ํ•ฉ๋‹ˆ๋‹ค. 3๋‹จ๊ณ„

playinpap.gitbook.io

 

 

โ†ช Microsoft์˜ ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ DoWhy์˜ ๊ฐ€์ด๋“œ๋ฅผ ์Šคํ„ฐ๋””ํ•˜๋ฉฐ ํ•œ๊ตญ์–ด ์ž๋ฃŒ๋กœ ์ƒ์„ฑํ•œ ๊นƒ๋ถ

 

โ€ป ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ 

โ€ป ๋…ผ๋ฌธ 

 

 

 

 

 

 

โ‘ก  ์‹ค๋ฌด ์ธ๊ณผ์ถ”๋ก ์˜ ์œ„๊ณ„ 


 

โ—ฏ  ์ธ๊ณผ์ถ”๋ก ์˜ best practice

 

•  ๊ฐ€๋Šฅํ•˜๋‹ค๋ฉด Randomization ์„ ํ™œ์šฉํ•˜๊ธฐ 

•  Randomization ์ด ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค๋ฉด, Natural experiment ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์„ ๊ณ ๋ คํ•˜๊ธฐ

•  Natural experiment ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์ด ์–ด๋ ต๋‹ค๋ฉด, Conditioning Method ๋ฅผ ๊ณ ๋ คํ•˜๊ธฐ 

 

 

 

โ—ฏ  Randomization 

 

•  A/B ํ…Œ์ŠคํŠธ์™€ ๊ฐ™์€ ์˜๋ฏธ๋กœ, ํ˜„์—…์—์„œ๋Š” Agile ํ•œ A/B ํ…Œ์ŠคํŠธ ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌ์ถ•ํ•˜๋Š”๋ฐ ์ตœ์„ ์„ ๋‹คํ•˜๋Š” ๊ฒƒ์ด ์ข‹๋‹ค. MAB, Uplift modeling ์„ ํ†ตํ•ด Randomization ์˜ ํšจ์œจ์„ ๋†’์—ฌ์ฃผ๊ฑฐ๋‚˜ ์ถ”๊ฐ€์ ์ธ ๊ฐ€์น˜๋ฅผ ๋”ํ•ด์ค„ ์ˆ˜ ์žˆ๋‹ค. 

 

 

โ—ฏ  Natural experiment 

 

•  ์‹คํ—˜์˜ ์ƒํ™ฉ์— ๊ฐ€๊นŒ์šด ๋ถ€๋ถ„์ ์ธ ๋ฐ์ดํ„ฐ์…‹์„ ์ฐพ์ž๋Š” ๊ด€์  (As-if-random) 

•  ๊ด€์ธก๋˜์ง€ ์•Š๋Š” ๋ณ€์ˆ˜ (Unobserved confounder) ๋„ ์žˆ์œผ๋‹ˆ ๋‹ค ํ†ต์ œํ•  ์ˆ˜ ์—†๋Š” ๋ฌธ์ œ๋ฅผ ๊ทน๋ณตํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ์‹์ด๋ผ ์„ ํ˜ธ๋œ๋‹ค. 

 

 

โ—ฏ  Conditioning methods 

 

•  ๊ฐ€์ •๋“ค์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ณ€์ˆ˜๋“ค์„ ํ†ต์ œํ•˜๋Š” ๊ด€์  

•  DoWhy ์—์„œ๋Š” 5๊ฐ€์ง€ ๋ฐฉ์‹์„ ์ œ๊ณต 

 

Matching and Stratification (Propensity score)
Weighting (Propensity score) 
Regression
Doubly Robust
Synthetic Controls 

 

 

โ—ฏ  ์œ„๊ณ„ : ์ƒ๋‹จ์— ์žˆ๋Š” ๋ฐฉ๋ฒ•๋“ค์ด ์‚ฌ์šฉํ•˜๊ธฐ์—๋Š” ์ข‹์Œ 

 

 

 

 

 

 

โ‘ข  ํ’€ ์ˆ˜ ์žˆ๋Š” ๋ฌธ์ œ์œ ํ˜•๊ณผ ์‚ฌ๋ก€๋ถ„์„ 


 

โ—ฏ  ๋ฌธ์ œ์˜ ์œ ํ˜• 

 

โ‘ด A/B ํ…Œ์ŠคํŠธ๋ฅผ ์ง„ํ–‰ํ•ด๋„ ์œ ์ €๊ฐ€ ์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์„ ์ˆ˜ ์žˆ๋‹ค. ์ด๋•Œ ์ฒ˜์น˜์˜ ํšจ๊ณผ๋ฅผ ์–ด๋–ป๊ฒŒ ํ™•์ธํ• ๊นŒ

โ†ช ๋ฐ์ดํ„ฐ ํ˜•ํƒœ : ์‹คํ—˜

โ†ช ๋ฐฉ๋ฒ•๋ก  : ๋„๊ตฌ๋ณ€์ˆ˜ 

 

โ‘ต ๋น„์šฉ์ด ์ˆ˜๋ฐ˜๋˜๋Š” A/B ํ…Œ์ŠคํŠธ๋ฅผ ์ง„ํ–‰ํ–ˆ๋‹ค. ์–ด๋–ค ์œ ์ €์—๊ฒŒ ๊ฐ€์žฅ ์ฒ˜์น˜์˜ ํšจ์œจ์„ ๊ทน๋Œ€ํ™”์‹œํ‚ฌ ์ˆ˜ ์žˆ์„๊นŒ

โ†ช ๋ฐ์ดํ„ฐ ํ˜•ํƒœ : ์‹คํ—˜

โ†ช ๋ฐฉ๋ฒ•๋ก  : ์—…๋ฆฌํ”„ํŠธ ๋ชจ๋ธ๋ง 

 

โ‘ถ A/B ํ…Œ์ŠคํŠธ๋ฅผ ์ง„ํ–‰ํ•˜์ง€ ์•Š์•˜๋‹ค. ์ฒ˜์น˜์˜ ํšจ๊ณผ๋ฅผ ์–ด๋–ป๊ฒŒ ํ™•์ธํ•  ์ˆ˜ ์žˆ์„๊นŒ

โ†ช ๋ฐ์ดํ„ฐ ํ˜•ํƒœ : ๊ด€์ธก

โ†ช ๋ฐฉ๋ฒ•๋ก  : ์ด์ค‘์ฐจ๋ถ„๋ฒ•, ๋งค์นญ 

 

•  ์ฒ˜์น˜ : ํšจ๊ณผ๋ฅผ ์ธก์ •ํ•˜๊ณ ์ž ํ•˜๋Š” ๋ณ€์ˆ˜, ์‹คํ—˜ ๋‹จ์œ„์— ๊ฐ€ํ•˜๋Š” ์กฐ๊ฑด (e.g. ํ”„๋กœ๋ชจ์…˜, ๊ธฐ๋Šฅ์‚ฌ์šฉ, ํŒ์—…์กฐํšŒ, ํ‘ธ์‹œ ํด๋ฆญ ๋“ฑ)

•  Experimental data : ์ฒ˜์น˜๊ฐ€ ์žˆ๊ณ  ๋‚˜๋จธ์ง€๋Š” ํ†ต์ œ๋œ ์‹คํ—˜๊ตฐ, ๋Œ€์กฐ๊ตฐ ์ง‘๋‹จ์˜ ๋ฐ์ดํ„ฐ 

•  Observational data : ์ฒ˜์น˜์™€ ํ†ต์ œ๊ฐ€ ์—†์–ด ๊ทธ์ € ๊ด€์ธก๋œ ์ง‘๋‹จ์˜ ๋ฐ์ดํ„ฐ 

 

 

 

โ—ฏ  ๋ฐฉ๋ฒ•๋ก 01. ๋„๊ตฌ๋ณ€์ˆ˜ 

 

โ‘ด  KDD 2021 Trip advisor ์‚ฌ๋ก€ 

 

 

โ€ป DRIV : ์ธ๊ณผ์ถ”๋ก  + ๋จธ์‹ ๋Ÿฌ๋‹ ๊ฒฐํ•ฉ ๋ฐฉ๋ฒ• 

 

 

•  ์ผ๋ฐ˜์ ์ธ ๋ฐฉ๋ฒ•๋ก  ์ ์šฉ์ด ๋ถˆ๊ฐ€๋Šฅํ•œ ์ด์œ  

 

โ†ช  ๋ฉค๋ฒ„์‹ญ ๊ฐ€์ž… ์œ ์ € vs ๋ฏธ๊ฐ€์ž… ์œ ์ €์˜ ์ฒด๋ฅ˜์‹œ๊ฐ„ ๋‹จ์ˆœ ๋น„๊ต โ‡จ confoundedness ์ด์Šˆ ๋ฐœ์ƒ : ๋ฉค๋ฒ„์‹ญ์— ๊ฐ€์ž…ํ•œ ์œ ์ €๋Š” ๊ฐ€์ž…ํ•˜์ง€ ์•Š์€ ์œ ์ €๋ณด๋‹ค ์„œ๋น„์Šค์— ๋Œ€ํ•œ ์œ ์ € ์„ ํ˜ธ๋„๊ฐ€ ๋ณธ๋ž˜ ๋†’์„ ๊ฒƒ. ์„œ๋น„์Šค์— ๋Œ€ํ•œ ์œ ์ €์˜ ์„ ํ˜ธ๋„๊ฐ€ ๋†’์œผ๋ฉด, ์ฒด๋ฅ˜์‹œ๊ฐ„๋„ ๋†’์„ ๊ฒƒ. ์ฆ‰ User uffinity ๊ฐ€ Tripadvisor membership (treatment) ์™€ User engagement (Outcome) ๋ชจ๋‘์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š” confounder ๋กœ ์ž‘์šฉํ•จ. 

 

โ†ช  A/B test ์ง„ํ–‰  โ‡จ Imperfect compliance ์ด์Šˆ ๋ฐœ์ƒ : treatment ๊ฐ€ ๋ฉค๋ฒ„์‹ญ ๊ฐ€์ž…์ด๋ผ ํ–ˆ์„ ๋•Œ, ๋žœ๋ค ์ถ”์ถœ๋œ ์ผ๋ถ€ ์œ ์ €์—๊ฒŒ ๋ฉค๋ฒ„์‹ญ ๊ฐ€์ž…์„ ๊ฐ•์ œํ•  ์ˆ˜๋Š” ์—†์Œ. ์œ ์ €๊ฐ€ ์ฐธ์—ฌ ์—ฌ๋ถ€๋ฅผ ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์ด๋ฒคํŠธ์˜ ๊ฒฝ์šฐ ํ•ด๋‹น ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒ 

 

 

•  Recommendation A/B ํ…Œ์ŠคํŠธ ์ง„ํ–‰ 

 

โ†ช  A/B ํ…Œ์ŠคํŠธ์—์„œ ๋„๊ตฌ๋ณ€์ˆ˜๋ฅผ ํ™œ์šฉํ•ด ์•Œ๊ณ ์ž ํ•˜๋Š” ์ธ๊ณผ๊ด€๊ณ„ ์ถ”์ •์„ ์ง„ํ–‰ํ•˜๊ณ ์ž ํ•จ 

โ†ช ๋„๊ตฌ๋ณ€์ˆ˜ :  ์›์ธ๋ณ€์ˆ˜์—์„œ ๋‚ด์ƒ์„ฑ (confoundedness, selection bias, error term) ์„ ๊ฐ€์ง€๋Š” ๋ถ€๋ถ„์„ ์ž˜๋ผ๋‚ด๊ณ , ์™ธ์ƒ์„ฑ์„ ๋งŒ์กฑํ•˜๋Š” ๋ถ€๋ถ„์œผ๋กœ๋งŒ ๊ฒฐ๊ณผ๋ณ€์ˆ˜๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜ 

โ†ช  ํ™œ์šฉํ•œ ๋„๊ตฌ๋ณ€์ˆ˜ : ๋” ๋น ๋ฅธ ๋ฉค๋ฒ„์‹ญ ํšŒ์›๊ฐ€์ž… ๊ณผ์ • 

โ†ช  ์„ค์ •ํ•œ ๋ชฉํ‘œ : ์ƒˆ๋กญ๊ฒŒ ๋ฐ”๋€ ํšŒ์›๊ฐ€์ž… ๊ณผ์ •์ด ์œ ์ €์˜ ๋ฆฌํ…์…˜์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š”๊ฐ€ 

 

 

โ‘ต 2021 ๋กœ๋ธ”๋ก์Šค ์‚ฌ๋ก€ 

 

 

•  Recommendation A/B ํ…Œ์ŠคํŠธ ์ง„ํ–‰ 

 

 

 

 

โ—ฏ  ๋ฐฉ๋ฒ•๋ก 02์—…๋ฆฌํ”„ํŠธ ๋ชจ๋ธ๋ง 

 

โ‘ด  KDD 2021 Uber Eats ์‚ฌ๋ก€ 

 

 

•  Uplift score = P(outcome | treatment, x) - P(outcome | no treatment,x) 

 

 

 

•  Uplift model ์ดํ•ดํ•˜๊ธฐ 

 

 

โ†ช  ๊ด‘๊ณ ๋ฅผ ๋ณผ ๋• ๊ตฌ๋งคํ•˜๊ณ , ๊ด‘๊ณ ๋ฅผ ๋ณด์ง€ ์•Š์„ ๋• ๊ตฌ๋งคํ•˜์ง€ ์•Š๋Š” Persuadables ์— ์ง‘์ค‘! 

 

 

 

•  Uplift modeling ๋ฉ”์ปค๋‹ˆ์ฆ˜ 

 

โ†ช  ์ธ๊ณผํšจ๊ณผ (์ฆ๋ถ„, uplift score) ๋ฅผ ๋ชจ๋ธ๋ง 

โ†ช  A/B ํ…Œ์ŠคํŠธ๋ฅผ ํ†ตํ•œ ์‹คํ—˜ ๋ฐ์ดํ„ฐ๋ฅผ input ์œผ๋กœ ๋ฐ›์•„์„œ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์บ ํŽ˜์ธ์˜ ํšจ๊ณผ๋ฅผ ๋น„๊ตํ•˜๋Š” ๊ฒƒ์— ๊ทธ์น˜์ง€ ์•Š๊ณ  ์‹ค์ œ ๋น„์ฆˆ๋‹ˆ์Šค ๊ฐ€์น˜๋ฅผ ๊ทน๋Œ€ํ™” ํ•ด์ค„ ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋ฒ• 

โ†ช  ๋ฐ์ดํ„ฐ๋ฅผ ๊ณ„์ธตํ™” stratify ํ•˜๊ณ  ๊ฐ ๊ณ„์ธต strata ๋‚ด์—์„œ ํ‰๊ท ์ฒ˜์น˜ํšจ๊ณผ (CATE) ๋ฅผ ๋จธ์‹ ๋Ÿฌ๋‹์„ ํ†ตํ•ด ์ถ”์ •ํ•˜๊ณ  ๊ณ„์ธต๊ฐ„์˜ ์ฐจ์ด๋ฅผ ๋น„๊ตํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜ 

 

 

•  ํ™œ์šฉ ๊ฒฐ๊ณผ : Uplift score ๊ฐ€ ์ƒ์œ„ 60% ์ธ ์œ ์ €๊นŒ์ง€๋งŒ, Gain ์ด ๊ฐ€์žฅ ๋†’์€ ๊ธฐ์šธ๊ธฐ๋กœ ์ฆ๊ฐ€ (์ด ์„ธ๊ทธ๋จผํŠธ๊นŒ์ง€ ํƒ€๊ฒŸํŒ… ํ–ˆ์„ ๋•Œ ์˜ˆ์‚ฐ์œจ์„ 40%๋กœ ์ค„์ด๋ฉด์„œ ์ˆ˜์ตํšจ์œจ์„ 67% ์ฆ๊ฐ€์‹œํ‚ฌ ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ) → ์‹ค์ œ๋กœ ์˜จ๋ผ์ธ ์‹คํ—˜ ์ง„ํ–‰์‹œ ์˜ˆ์‚ฐ์„ 46%๋กœ ์ค„์ด๋ฉฐ ์ˆ˜์ต ๊ธฐ์ค€ ROAS 93%๊นŒ์ง€ ์ฆ๊ฐ€ํ•จ 

 

 

 

 

โ‘ต  2020 DoorDash ์‚ฌ๋ก€  

 

 

โ€ป DoorDash ๋Š” ์Œ์‹๋ฐฐ๋‹ฌ ์„œ๋น„์Šค ํšŒ์‚ฌ์ž„

 

•  LightGBM ์„ ํ™œ์šฉํ•œ uplift modeling ์œผ๋กœ ํ”„๋กœ๋ชจ์…˜์— ๋น„์šฉํšจ์œจ์ ์œผ๋กœ ๋ฐ˜์‘ํ•˜๋Š” ์„ธ๊ทธ๋จผํŠธ๋ฅผ ๋ฐœ๊ฒฌ 

 

 

 

โ—ฏ  ๋ฐฉ๋ฒ•๋ก 03DiD/Matching 

 

 

 

โ‘ด  ๋ฐœํ‘œ์ž ๊ฒฝํ—˜์‚ฌ๋ก€

 

 

 

โ‘ต  Microsoft Dowhy ์ƒ˜ํ”Œ ๋…ธํŠธ๋ถ ์‚ฌ๋ก€ 

 

 

 

 

 

 

โ‘ฃ  ์‹ค๋ฌด์— ์ ์šฉํ•  ๋•Œ์˜ ์–ด๋ ค์›€ 


•  ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•œ ๊ฐ€์ •๋“ค

 

 

 

•  ์‚ฌ๋žŒ์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฐ€์ง€๋Š” ๋ณธ์งˆ์ ์ธ ํ•œ๊ณ„ 

 

 

 

•  Educational Gap 

 

 

 

 

 

โ‘ค  ATE, CATE, HTE  ๊ฐœ๋… ์ •๋ฆฌํ•˜๊ธฐ 


 

โ—ฏ  ATE, average treatment effect 

 

•  ๊ฐœ์ž…์˜ ์ธ๊ณผํšจ๊ณผ๋ฅผ ์ „์ฒด ์ง‘๋‹จ์˜ ๋ ˆ๋ฒจ์—์„œ ์„ค๋ช… 

 

 

โ—ฏ  CATE, conditional average treatment effect 

 

•  ์œ ์ €์˜ ํŠน์„ฑ (๊ณต๋ณ€๋Ÿ‰ ๋ณ€์ˆ˜) ์— ๋”ฐ๋ผ ํ•œ์ •๋˜๋Š” ๊ตญ์ง€์ ์ธ ์ธ๊ณผํšจ๊ณผ๋ฅผ ์˜๋ฏธํ•œ๋‹ค. 

•  covariates ์˜ˆ์‹œ : ์„ฑ๋ณ„, ๋‚˜์ด, ์†Œ๋“ ์ˆ˜์ค€ ๋“ฑ 

•  CATE ๋กœ ๊ณต๋ณ€๋Ÿ‰ ๋ณ€์ˆ˜๋ฅผ ์–ด๋–ป๊ฒŒ ์ •์˜ํ•˜๊ณ  ์ชผ๊ฐœ๋ณด๋Š๋ƒ์— ๋”ฐ๋ผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋Š” ์ธ์‚ฌ์ดํŠธ๊ฐ€ ๋‹ฌ๋ผ์ง„๋‹ค. 

 

 

 

โ—ฏ  HTE, Heterogeneous treatment effect 

 

•  CATE ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ๋ฐ์ดํ„ฐ๋ฅผ ๊ณ„์ธตํ™”ํ•˜๊ณ  ๊ฐ ๊ณ„์ธต ๋‚ด์—์„œ ATE ๋ฅผ ์ถ”์ •ํ•˜์—ฌ ๊ณ„์ธต๊ฐ„์˜ ์ฐจ์ด๋ฅผ ๋น„๊ตํ•œ๋‹ค. subgroup analysis 

•  CATE ๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•˜๊ฒŒ ์žˆ๊ณ , ๊ทธ์ค‘ ํ•˜๋‚˜๊ฐ€ Uplift modeling ์ด๋‹ค. ๋จธ์‹  ๋Ÿฌ๋‹์„ ํ†ตํ•ด ์ธ๊ณผ ํšจ๊ณผ๋ฅผ ์ถ”๋ก ํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ข€ ๋” ์ž์„ธํžˆ๋Š”, Meta-learner๋ฅผ ํ™œ์šฉํ•ด CATE๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. 

•  HTE ๋ชจ๋ธ์€ subpopulation ์—๊ฒŒ ์„ ํƒ์ ์œผ๋กœ Rollout ํ•จ์œผ๋กœ์จ ํ–ฅ์ƒ๋œ ๊ฐœ์ธํ™”๋ฅผ ๊ฐ€์ ธ์˜จ๋‹ค. 

 

 

 

 

 

 

 

๐Ÿ‘€ Uplift modeling ์ฐธ๊ณ ์ž๋ฃŒ


 

๋ธ”๋กœ๊ทธ 

 

 

ํ†ต๊ณ„์˜ ํž˜๊ณผ ๋จธ์‹ ๋Ÿฌ๋‹์œผ๋กœ ํ•ด๋‹น๊ณ ๊ฐ๊ณผ "๋น„์Šทํ•œ ๊ณ ๊ฐ"์ด ํ‰๊ท ์ ์œผ๋กœ ์–ด๋Š ์„ธ๊ทธ๋จผํŠธ์— ์†ํ•ด ์žˆ๋Š”์ง€ ๋Š” ์•Œ ์ˆ˜ ์žˆ์„ ๊ฒƒ์ด๋‹ค. ์ด๊ฒƒ์ด Uplift modeling์ด ์šฐ๋ฆฌ์—๊ฒŒ ์•Œ๋ ค์ฃผ๋Š” ๊ฒƒ์ด๋‹ค. Uplift modeling์€ ํŠน์ •๊ณ ๊ฐ์—๊ฒŒ ์บ ํŽ˜์ธ์„ ์ œ๊ณตํ•˜๋Š”๊ฒƒ์ด ์ด๋“์ธ์ง€ ์•„๋‹Œ์ง€๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” task๋ฅผ ์œ„ํ•ด ๋งŒ๋“ค์–ด์กŒ๊ณ , ์ด๊ฒƒ์€ ์–ด๋–ค ๊ณ ๊ฐ์ด ์–ด๋–ค ์„ธ๊ทธ๋จผํŠธ์— ์†ํ•˜๋Š”์ง€ ๊ฒฐ์ •ํ•˜๋Š” ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ฒƒ ์ด๋ฉฐ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋งˆ์ผ€ํŒ… ์ˆ˜๋‹จ์ด ๊ณ ๊ฐ์˜ ๊ตฌ๋งค๋กœ ์ด์–ด์ง€๋Š” ํ™•๋ฅ ์„ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์„ ๋•๋Š” ๋ชจ๋ธ๋ง ์ด๋‹ค.

 

 

 

 

728x90

๋Œ“๊ธ€