๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference47

์ธ๊ณผ์ถ”๋ก ์˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ - ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์ธ๊ณผ์ถ”๋ก  ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! โ‘  Value of Causality • ์ธ๊ณผ์„ฑ์€ actionable ํ•œ ์ „๋žต์„ ์ œ๊ณตํ•œ๋‹ค. ์ƒ๊ด€์„ฑ์€ action ์œผ๋กœ ์ด์–ด์ง€๊ธฐ๊ฐ€ ์–ด๋ ต๋‹ค (e.g. ์ดˆ์ฝœ๋ฆฟ ์†Œ๋น„๊ฐ€ ๋งŽ์„์ˆ˜๋ก ๋…ธ๋ฒจ์ƒ ์ˆ˜์ƒ์ž๊ฐ€ ๋งŽ๋‹ค๋Š” ์ƒ๊ด€๊ด€๊ณ„) • ๊ทธ๋Ÿฌ๋‚˜ ์‹ค์ œ๋กœ ์ธ๊ณผ์„ฑ์„ ๋„์ถœํ•ด๋‚ด๋Š” ๊ฒƒ์€ ๋งค์šฐ ์–ด๋ ค์›€ (Prediction ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€) โ†ช ์‹ค์ œ ์„ธ์ƒ์€ ๋งค์šฐ ๋ณต์žกํ•˜๋ฉฐ dynamic ํ•œ system ์œผ๋กœ ๋™์ž‘ํ•œ๋‹ค. ํ•˜์ง€๋งŒ ๋ถ„์„์„ ํ•  ๋•Œ๋Š” ์ด๋Ÿฐ dynamic ํ•œ ํŠน์„ฑ์„ ์—†์• ๊ณ  static ํ•œ ๊ฐ€์ •์—์„œ ์ง„ํ–‰ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ด€์ ์ด ์ œํ•œ์ ์ผ ์ˆ˜ ์žˆ๋‹ค. • ๋˜ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ์™„์ „ํ•˜์ง€ ์•Š๋‹ค. (imperfect and proxy - e.g. ํ–‰๋ณต์ง€์ˆ˜) • ๋น„์ฆˆ๋‹ˆ์Šค๋Š” Causal law ๋ฅผ .. 2023. 6. 29.
[The Brave and True] 7. Beyond Confounders ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! ๐Ÿ“œ ์ •๋ฆฌ โ‘  ํฌํ•จํ•ด์•ผ ๋˜๋Š” ๋ณ€์ˆ˜ • Treatment ๋ฅผ ์˜ˆ์ธกํ•˜์ง€ ์•Š๋”๋ผ๋„ Outcome ์— ๋Œ€ํ•ด ์ข‹์€ ์˜ˆ์ธก์„ ํ•˜๋Š” ๋ณ€์ˆ˜ (โ‚ Y๋ฅผ ์˜ˆ์ธกํ•˜๋ฉด ๋ถ„์‚ฐ์ด ๋‚ฎ์•„์ง€๊ณ  ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ์ถ”์ •ํ•  ๋•Œ ํ†ต๊ณ„์ ์œผ๋กœ ์œ ์˜ํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜ํƒ€๋‚  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์•„์ง€๊ธฐ ๋•Œ๋ฌธ) • ๊ต๋ž€ ์š”์ธ โ‘ก ํฌํ•จ์‹œํ‚ค๋ฉด ์•ˆ๋˜๋Š” ๋ณ€์ˆ˜ • Treatment ๋ฅผ ์˜ˆ์ธกํ•˜์ง€๋งŒ Outcome ์„ ์˜ˆ์ธกํ•˜์ง€ ์•Š๋Š” ๋ณ€์ˆ˜ (โ‚ treatment์˜ ๋ณ€๋™์„ฑ์„ ์ค„์—ฌ ์ธ๊ณผํšจ๊ณผ๋ฅผ ์ฐพ๊ธฐ ์–ด๋ ต๊ฒŒ ๋งŒ๋“ค๊ธฐ ๋•Œ๋ฌธ) • Treatment ์™€ outcome ์‚ฌ์ด์˜ ๋งค๊ฐœ๋ณ€์ˆ˜ • Treatment ์™€ outcome ์˜ ๊ณตํ†ตํšจ๊ณผ์ธ ๋ณ€์ˆ˜ โ‘  Good controls โ—ฏ ํ†ต์ œ๋ณ€์ˆ˜ • ํ†ต์ œ๋ณ€์ˆ˜๊ฐ€ Confounder ์ธ ๊ฒฝ์šฐ ๋ชจํ˜•์— .. 2023. 6. 29.
[The Brave and True] 6. Grouped and Dummy Regression ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! โ‘  ๊ทธ๋ฃนํ™”๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•œ ํšŒ๊ท€ โ—ฏ ์ด๋ถ„์‚ฐ์„ฑ • ๋ถ„์‚ฐ์ด ๋‚ฎ์€ ์˜์—ญ๊ณผ ๋†’์€ ์˜์—ญ์„ ๋™์‹œ์— ๊ฐ–๋Š” ํ˜„์ƒ, ์ฆ‰ ๋ณ€์ˆ˜์˜ ๋ชจ๋“  ๊ฐ’์—์„œ ๋ถ„์‚ฐ์ด ์ผ์ •ํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ๋‹ค. • ๋ถ„์‚ฐ์ด ๋‹ฌ๋ผ์ง€๋Š” ๊ฐ€์žฅ ์ผ๋ฐ˜์ ์ธ ์ด์œ ๋Š” ๊ทธ๋ฃนํ™”๋œ ๋ฐ์ดํ„ฐ ๋•Œ๋ฌธ์ด๋‹ค. โ—ฏ smf.ols ์™€ smf.wls ์ฐจ์ด • smf.ols : OLS ํšŒ๊ท€๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•˜๋Š”๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. • smf.wls : ์ตœ์†Œ์ž์Šน๋ฒ•์˜ ๋ณ€ํ˜•์œผ๋กœ ์ž”์ฐจ์˜ ๊ฐ€์ค‘์น˜๋ฅผ ๊ณ ๋ คํ•ด ๋ชจ๋ธ์„ ์ ํ•ฉ์‹œํ‚จ๋‹ค. ๊ฐ€์ค‘์น˜๋Š” ๊ฐ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ์˜ ์ค‘์š”๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉฐ, ํŠน์ • ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ์— ๋” ํฐ ๊ฐ€์ค‘์น˜๋ฅผ ๋ถ€์—ฌํ•ด ๋ชจ๋ธ์ด ํ•ด๋‹น ํฌ์ธํŠธ์— ๋” ์ ํ•ฉํ•˜๊ฒŒ ๋งŒ๋“ ๋‹ค. ์˜ค์ฐจ์˜ ๋ถ„์‚ฐ์ด ๋‹ค๋ฅธ ๊ฒฝ์šฐ๋‚˜ ์ด์ƒ์น˜์— ๋œ ๋ฏผ๊ฐํ•œ ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•˜๊ณ ์ž ํ•  ๋•Œ ์œ ์šฉํ•˜๋‹ค. โ—ฏ .. 2023. 6. 28.
[The Brave and True] 5. The Unreasonable Effectiveness of Linear Regression ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! โ‘  All you need is regression โ—ฏ Review • ์ธ๊ณผ์ถ”๋ก ์—์„œ ๊ฐ ๊ฐœ์ธ์—๊ฒŒ์„œ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ๊ฒฐ๊ณผ ๊ฐ’์€ Y0 (์ฒ˜์น˜๋ฅผ ๋ฐ›์ง€ ์•Š์•˜์„ ๋•Œ ์–ป๋Š” ๊ฒฐ๊ณผ), Y1 (์ฒ˜์น˜๋ฅผ ๋ฐ›์•˜์„ ๋•Œ ๊ฒฐ๊ณผ) ์ด ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ T๊ฐ€ 0์ด๋‚˜ 1๋กœ ์ •ํ•ด์ง€๋ฉด ๋‹ค๋ฅธ ํ•˜๋‚˜์˜ ๊ฒฐ๊ณผ๋Š” ์˜์˜ ์•Œ ์ˆ˜ ์—†๊ฒŒ ๋œ๋‹ค. ๋•Œ๋ฌธ์— ๊ฐœ์ธ์— ๋Œ€ํ•œ ์ฒ˜์น˜ํšจ๊ณผ δi = Y1i - Y0i ๋Š” ์•Œ ์ˆ˜ ์—†๋‹ค. • ๊ทธ๋Ÿฌ๋‚˜ ํ‰๊ท ์ ์ธ ์ธ๊ณผ ํšจ๊ณผ ATE ๋Š” ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋‹ค : ATE = E[Y1 - Y0] • ์—ฌ๊ธฐ์„œ ์ผ์ •ํ•œ ์ฒ˜์น˜ํšจ๊ณผ k ๋Š” Y1i = Y0i + k ๋ฅผ ๋งŒ์กฑํ•œ๋‹ค. k ๊ฐ€ ์–‘์ˆ˜๋ผ๋ฉด ํ‰๊ท ์ ์œผ๋กœ ์ฒ˜์น˜๊ฐ€ ์–‘์˜ ํšจ๊ณผ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค๊ณ  ๋งํ•œ๋‹ค. • ํŽธํ–ฅ bias ๋•Œ๋ฌธ์— ํ‰๊ท ์˜ ์ฐจ์ด.. 2023. 6. 27.
์ธ๊ณผ์ถ”๋ก ์˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ - ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•œ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! • Econ ML : Microsoft EconML • Causal Graph : Microsoft DoWhy → ๋ฉ”๋‰ด์–ผ์„ ์ฝ๊ณ  ๋…ผ๋ฌธ์„ ์ฝ์–ด๋ณด๋Š” ๊ฒƒ์„ ์ถ”์ฒœ • Multi-armed Bandits : ์˜จ๋ผ์ธ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•์ด ๊นŒ๋‹ค๋กญ๊ณ  ์ด๋ฅผ ํ•  ์ˆ˜ ์žˆ๋Š” ์ฝ”๋”ฉ ๋Šฅ๋ ฅ์ด๋ฉด ํ”„๋ ˆ์ž„์€ ๋ณ„ ์˜๋ฏธ ์—†์Œ โ‘  ECON ML models (Potential outcomes) • ์ธ๊ณผ ๊ด€๊ณ„/๊ตฌ์กฐ๋ฅผ ์ด๋ฏธ ์•Œ๊ณ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•œ๋‹ค. • ์ ‘๊ทผ ๋ฐฉ์‹์€ ๊ฐ๊ธฐ ๋‹ค๋ฅด์ง€๋งŒ, ๋น„์Šทํ•œ ๋ชฉ์ ์„ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ์กด์žฌํ•˜๋Š” ๋ชจ๋ธ๋“ค์ด๋‹ค. A/B testing ์ด ๋˜๋Š” ํ™˜๊ฒฝ์—์„œ EconML ์„ ์ ์šฉํ•ด๋ณด๋ฉด ์ข‹๋‹ค. (Same Goal, Different approach) โ—ฏ ML ๋ชจ๋ธ ๊ธฐ.. 2023. 6. 26.
[The Brave and True] 4. Graphical causal model ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! โ‘  ์ธ๊ณผ์— ๋Œ€ํ•ด ์ƒ๊ฐํ•ด๋ณด๊ธฐ โ—ฏ Potential outcome ์— ๋Œ€ํ•œ ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ ๊ฐ€์ • • ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ ๊ฐ€์ •์€ ์˜ค์ง ์ฒ˜์น˜์— ์˜ํ•œ ํšจ๊ณผ๋ฅผ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค • X์— ๋Œ€ํ•œ conditioning : ๊ฐ€๋ น ์•ฝ์„ ์ฒ˜๋ฐฉํ•  ๋•Œ, ์‹ฌ๊ฐํ•œ ์ผ€์ด์Šค์˜ ํ™˜์ž์™€ ๋œ ์‹ฌ๊ฐํ•œ ์ผ€์ด์Šค์˜ ํ™˜์ž๋กœ ํ•˜์œ„ ๊ทธ๋ฃน์„ ๋‚˜๋ˆ„๊ณ  ์•ฝ์˜ ํšจ๊ณผ๋ฅผ ๋ถ„์„ํ•œ๋‹ค๋ฉด ๋” ๋ช…ํ™•ํ•œ ๊ทธ๋ฆผ์„ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค. โ—ฏ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„ ๋ชจํ˜• โ‘ก ๊ทธ๋ž˜ํ”„ ๋ชจ๋ธ • [์ฐธ๊ณ ] Coursera Stanford ๊ฐ•์˜ : Probabilistic Graphical models • ๊ทธ๋ž˜ํ”„ ๋ชจํ˜•์ด ์ˆ˜๋ฐ˜ํ•˜๋Š” ๋…๋ฆฝ์„ฑ๊ณผ ์กฐ๊ฑด๋ถ€ ๋…๋ฆฝ์„ฑ ๊ฐ€์ •์ด ๋ฌด์—‡์ธ์ง€์— ๋Œ€ํ•ด ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ๋งค์šฐ ์ค‘์š”ํ•˜๋‹ค. โ—ฏ Blocked • Y๊ฐ€ ์กฐ๊ฑดํ™”.. 2023. 6. 26.
[The Brave and True] 3. The-Most-Dangerous-Equation ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! โ‘  Intro • ์˜ˆ์ œ. ๊ต์œก ๋ฐ์ดํ„ฐ : ENEM ์ ์ˆ˜(SAT์™€ ์œ ์‚ฌํ•œ ๋ธŒ๋ผ์งˆ ํ‘œ์ค€ ๊ณ ๋“ฑํ•™๊ต ์ ์ˆ˜)๋ฅผ 3๋…„ ๋™์•ˆ ๋‹ค๋ฅธ ํ•™๊ต๋“ค์—์„œ ์ˆ˜์ง‘ โ‡จ ํ•™์ƒ ๊ทœ๋ชจ๊ฐ€ ์ž‘์„ ๋•Œ ์ƒ์œ„ 1%์— ํ•ด๋‹นํ•˜๋Š” ํ•™๊ต๊ฐ€ ๋งŽ์•˜๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํ•˜์œ„ 1% ํ•™๊ต๋ฅผ ์‚ดํŽด๋ณด์•˜์„ ๋•Œ๋„ ํ•™์ƒ์ˆ˜๊ฐ€ ๋งค์šฐ ์ ์—ˆ๋‹ค. ์ด๋Š” ํ•™์ƒ ์ˆ˜๊ฐ€ ์ ์€ ํ•™๊ต๋“ค์˜ ๊ฒฝ์šฐ, ๋ถ„์‚ฐ์ด ํฌ๊ธฐ ๋•Œ๋ฌธ์— ์˜ˆ์ธก์ด ๋ถˆํ™•์‹คํ•ด์„œ ์šด์— ์˜ํ•ด ๋งค์šฐ ๋†’๊ฑฐ๋‚˜ ๋‚ฎ์€ ๋ถ„ํฌ๋ฅผ ๋ณด์ธ ๊ฒƒ์ด๋‹ค. • ๋ถˆํ™•์‹ค์„ฑ์„ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜๋Š” ๋ถ„์‚ฐ์˜ ์ถ”์ •๋Ÿ‰์„ ๊ตฌํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๋ถˆํ™•์‹ค์„ฑ์€ ๊ด€์ธก๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ํด ์ˆ˜๋ก ์ค„์–ด๋“ ๋‹ค. ATE ๋ฅผ ํฌํ•จํ•œ ์–ด๋– ํ•œ ์š”์•ฝ ํ†ต๊ณ„์— ๋Œ€ํ•ด์„œ๋„ ์ด๋Š” ๋งˆ์ฐฌ๊ฐ€์ง€๋‹ค. ํ‘œ๋ณธ์ด ์ปค์งˆ์ˆ˜๋ก ๋ถ„์‚ฐ์€ ์ค„์–ด๋“ ๋‹ค. โ‘ก Standard error .. 2023. 6. 22.
์ธ๊ณผ์ถ”๋ก ์˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ - ML for Causal inference : ์ธ๊ณผ์ถ”๋ก  ๊ธฐ๋ฐ˜์˜ ์˜ˆ์ธก ๋ชจ๋ธ๋ง ํ‰๊ฐ€ ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! โ‘  Evaluating Recommendation algorithms in Netflix • ์‹ค์ œ๋กœ ์‚ฐ์—… ํ˜„์žฅ์—์„  ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•œ Evaluation ์ด A/B test ๋กœ ์ด๋ฃจ์–ด์ง€๊ณ  ์žˆ๋‹ค. • Test set ์—์„œ์˜ ํšจ๊ณผ๊ฐ€ ์‹ค์ œ ๋น„์ฆˆ๋‹ˆ์Šค ํ˜„์žฅ์— ์ ์šฉํ–ˆ์„ ๋•Œ๊นŒ์ง€ ๊ทธ๋Œ€๋กœ ๋‚˜ํƒ€๋‚˜๋ ค๋ฉด, ์‚ฌ๋žŒ๋“ค์ด ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•ด ์ด์ „๊ณผ ๋™์ผํ•œ ํ–‰๋™์–‘์ƒ์œผ๋กœ ๋Œ€์‘ํ•  ๊ฒƒ์ด๋ผ๋Š” ๊ฐ€์ •์ด ๋งŒ์กฑ๋˜์–ด์•ผ ํ•˜๋Š”๋ฐ, ์‹ค์ œ๋กœ๋Š” ๊ทธ๋ ‡์ง€ ์•Š๋‹ค. ๋”ฐ๋ผ์„œ Test set ์—์„œ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค ํ•˜๋”๋ผ๋„, ์‹ค์ œ๋กœ๋Š” performance ๊ฐ€ ๋‚˜์˜ค์ง€ ์•Š์„ ์ˆ˜ ์žˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ณผ๊ฑฐ ๋ฐ์ดํ„ฐ์—์„œ ofline experiment ๋ฅผ ํ•œ ํ›„์—, ๊ณผ๊ฑฐ์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ์ƒˆ๋กœ์šด ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์‚ฌ์ด์˜.. 2023. 6. 21.
[The Brave and True] 2. Randomized Experiments ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! โ‘  The golden standard • E(Y0 | T=0) = E(Y0 | T=1) ๋ฅผ ๋งŒ์กฑํ•  ๋•Œ Bias ๊ฐ€ ์—†๋‹ค. ์ฆ‰, ํƒ€๊ฒŸ๊ตฐ๊ณผ ๋Œ€์กฐ๊ตฐ์ด ์ฒ˜์น˜๋ฅผ ๋ฐ›์€ ๊ฒƒ์„ ์ œ์™ธํ•˜๊ณ  ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ์œ ์‚ฌํ•˜๋ฉด ์ธ๊ณผ๊ด€๊ณ„๊ฐ€ ์„ฑ๋ฆฝํ•œ๋‹ค. • ์œ„์™€ ๊ฐ™์€ ์ด๋ก ์„ ๋งŒ์กฑ์‹œํ‚ฌ ์ฒซ๋ฒˆ ์งธ ๋„๊ตฌ๋กœ๋Š” Randomized experiments ๊ฐ€ ์žˆ๋‹ค. ๋ฌด์ž‘์œ„ ์‹คํ—˜์€ Treatment Group๊ณผ Control group์— ๊ฐœ๊ฐœ์ธ์„ ๋žœ๋คํ•˜๊ฒŒ ๋ถ„๋ฐฐํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ด๋•Œ ์ฒ˜์น˜๋ฅผ ๋ฐ›๋Š” ํƒ€๊ฒŸ๊ตฐ์˜ ๋น„์œจ์ด ๊ผญ 50%์ผ ํ•„์š”๋Š” ์—†๋‹ค. ๋žœ๋คํ•˜๊ฒŒ ๋ถ„๋ฐฐํ•จ์œผ๋กœ์จ potential outcome ์„ treatment ๋กœ๋ถ€ํ„ฐ ๋…๋ฆฝ์ ์œผ๋กœ ๋งŒ๋“ค์–ด bias ๋ฅผ ์ œ๊ฑฐํ•œ๋‹ค. • ๋ฌด์ž‘์œ„ ์‹คํ—˜์—์„œ๋Š” tr.. 2023. 6. 21.
[The Brave and True] 1. Introduction to causality ๐Ÿ‘€ ์ธ๊ณผ์ถ”๋ก  ๊ฐœ์ธ ๊ณต๋ถ€์šฉ ํฌ์ŠคํŠธ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ถœ์ฒ˜๋Š” ์ฒจ๋ถ€ํ•œ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”! โ‘  ์ธ๊ณผ์ถ”๋ก ์— ๊ด€์‹ฌ์„ ๊ฐ€์ ธ์•ผ ํ•˜๋Š” ์ด์œ  • ๋จธ์‹ ๋Ÿฌ๋‹์€ ์ธ๊ณผ๊ด€๊ณ„ ์œ ํ˜•์˜ ๋ฌธ์ œ๋ฅผ ์ž˜ ๋‹ค๋ฃจ์ง€ ๋ชปํ•œ๋‹ค. ๊ฐ€๋ น ํ˜ธํ…” ์‚ฐ์—…์—์„ , ๊ฐ€๊ฒฉ์ด ๋น„์ˆ˜๊ธฐ์ผ๋•Œ ์ €๋ ดํ•˜๊ณ  ์„ฑ์ˆ˜๊ธฐ์ผ๋•Œ ๋†’๋‹ค. ๋จธ์‹ ๋Ÿฌ๋‹์ด Naive ํ•œ prediction ์„ ํ•˜๊ฒŒ ๋˜๋ฉด ๊ฐ€๊ฒฉ์„ ์ธ์ƒํ–ˆ์„ ๋•Œ ๋” ๋งŽ์€ ๊ฐ์‹ค์ด ํŒ”๋ฆด ๊ฒƒ์ด๋ผ ์ œ์•ˆํ•  ์ˆ˜ ์žˆ๋‹ค. • ์ธ๊ณผ์ถ”๋ก ์€ Counterfactual ์ด๋ผ ๋ถ€๋ฅด๋Š” "๋งŒ์•ฝ์—" ๋ผ๋Š” ์งˆ๋ฌธ์— ๋‹ตํ•  ๊ฒƒ์„ ์š”๊ตฌํ•œ๋‹ค. • ๋จธ์‹ ๋Ÿฌ๋‹์€ ์ƒ๊ด€๊ด€๊ณ„ ์œ ํ˜• ์˜ˆ์ธก์— ์˜์กดํ•˜์—ฌ ์ธ๊ณผ์ถ”๋ก ์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์—†๋‹ค. ์ƒ๊ด€๊ด€๊ณ„์™€ ์ธ๊ณผ๊ด€๊ณ„๋Š” ๋‹ค๋ฅด๋‹ค. โ‘ก Notation โ—ฏ ์˜ˆ์ œ • ํ•™์ƒ๋“ค์—๊ฒŒ ํƒœ๋ธ”๋ฆฟ์„ ์ œ๊ณตํ–ˆ์„ ๋•Œ ์„ฑ๊ณผ์— ๋ฏธ์น˜๋Š” ์ธ๊ณผํšจ๊ณผ ๋ฐํ˜€๋‚ด๊ธฐ โ—ฏ Ti • unit i ์— ๋Œ€ํ•œ Tre.. 2023. 6. 20.
728x90