๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐ŸฅŽ Casual inference

์ธ๊ณผ์ถ”๋ก ์˜ ๋ฐ์ดํ„ฐ ๊ณผํ•™ - ์ธ๊ณผ์ถ”๋ก ๊ณผ ์˜ˆ์ธก ๋ฐฉ๋ฒ•๋ก ์˜ ์ฐจ์ด

by isdawell 2023. 4. 20.
728x90

 

์ฐธ๊ณ ์˜์ƒ : Bootcamp 1-1. ์ธ๊ณผ์ถ”๋ก ๊ณผ ์˜ˆ์ธก ๋ฐฉ๋ฒ•๋ก ์˜ ์ฐจ์ด 

 

 

 

1. ๋ฐ์ดํ„ฐ ๊ณผํ•™ : ์ธ๊ณผ์ถ”๋ก  ๋ฐฉ๋ฒ•๋ก  (ex. ๊ณ„๋Ÿ‰๊ฒฝ์ œํ•™) + ์˜ˆ์ธก ๋ฐฉ๋ฒ•๋ก  (ex.๋จธ์‹ ๋Ÿฌ๋‹) 


 

 

 

 

 

 

2. ์˜ํ™” "๋จธ๋‹ˆ๋ณผ" 


• ์•ผ๊ตฌ ์ฝ”์น˜๋“ค์€ ์„ ์ˆ˜๋“ค์ด ๋” ์ข‹์€ ์„ฑ๊ณผ๋ฅผ ๋‚ผ ์ˆ˜ ์žˆ๋Š” ์š”์ธ๋“ค (causes) ์„ ์ฐพ๊ณ , ๋ฐ์ดํ„ฐ์‚ฌ์ด์–ธํ‹ฐ์ŠคํŠธ๋“ค์€ ๊ตฌ์ฒด์ ์ธ ์„ ์ˆ˜์— ๋Œ€ํ•œ ์š”์ธ๋“ค์— ์ƒ๊ด€์—†์ด ์Šน๋ฆฌํ•  ํ™•๋ฅ ์„ ๋†’์ด๋Š” ๊ฒƒ์„ ๋” ์ค‘์š”ํ•˜๊ฒŒ ์—ฌ๊ธด๋‹ค. 

• Prediction ๊ณผ causual inference ๋Š” ๋‹ค๋ฅด๋‹ค. 

 

 

 

 

 

3. ๋ฐ์ดํ„ฐ๊ณผํ•™/๋ถ„์„์˜ ํ”„๋ ˆ์ž„์›Œํฌ 


 

•  Causual inference ๊ฐ€ ํ•„์š”ํ•œ ๊ฒฝ์šฐ

โ†ช Input-Oriented approach โ‡จ ex. ์ฝ”๋กœ๋‚˜ 19 ๋ฐฑ์‹ ์„ ๋งž์•„์•ผ ๋˜๋Š”์ง€, ๋งˆ์ผ€ํŒ… ํ”„๋กœ๋ชจ์…˜์„ ์ง„ํ–‰ํ•ด์•ผ ํ•˜๋Š”์ง€, ์ •์ฑ…์„ ๋„์ž…ํ•ด์•ผ ํ•˜๋Š”์ง€ ๋ง์•„์•ผ ํ•˜๋Š”์ง€ 

 

•  Prediction ์ด ํ•„์š”ํ•œ ๊ฒฝ์šฐ

โ†ช Output-Oriented approach โ‡จ target ์— ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด output ์„ ์–ป๋Š” ๊ฒƒ์ด ๋ชฉ์ ์ธ ๊ฒฝ์šฐ. ์˜ˆ๋ฅผ๋“ค์–ด ์ฝ”๋กœ๋‚˜ 19์˜ ๊ฐ์—ผ ์ถ”์„ธ ์˜ˆ์ธก, ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์˜ˆ์ธก์˜ ์‚ฌ๋ก€๊ฐ€ ์žˆ๋‹ค. ์ตœ์ ์˜ best output ์„ ์–ป๋Š” ๊ฒƒ์ด ๋ชฉ์  

 

•  ๊ทธ๋Ÿฌ๋‚˜ input ๊ณผ output oriented ๊ฐ€ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ ์ด๋ฃจ์–ด์ง€๋Š” ๊ฒฝ์šฐ๋„ ๋ถ„๋ช… ์žˆ๋‹ค. ๊ฐ€๋ น ์ธ๊ณผ์ถ”๋ก ์„ ํ†ตํ•ด ์–ป๊ฒŒ๋œ ์›์ธ๋ณ€์ˆ˜๋ฅผ prediction ์— ํ™œ์šฉํ•˜์—ฌ output ์„ ์•ˆ์ •์ ์œผ๋กœ ์˜ˆ์ธกํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค. 

 

 

 

 

•  Example : ์•ˆ์ „์ ๊ฒ€๊ณผ ๋„์‹œ์•ˆ์ „ 

โ†ช Input : safety inspection : ์•ˆ์ „์ ๊ฒ€์„ ์‹œํ–‰ํ•ด์•ผ ํ• ์ง€ ๋ง์•„์•ผ ํ• ์ง€ ๊ฒฐ์ • : ๊ฑด๋ฌผ, ์‹๋‹น์˜ ์•ˆ์ „์˜ ์œ„ํ˜‘์ด ๋˜๋Š” ์›์ธ์„ ์ฐพ๊ธฐ 

โ†ช Output : Urban safety : ๋„์‹œ ์•ˆ์ „์„ ๊ทน๋Œ€ํ™” ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉ์ ์ด๋ผ๋ฉด urban safety ๋ฅผ ๊ทน๋Œ€ํ™” ํ•  ์ˆ˜ ์žˆ๋Š” ์š”์ธ๋“ค์„ ์ฐพ์•„ ์•ˆ์ „์ ๊ฒ€์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋‹ค. FastFood ์Œ์‹์ ์˜ ์œ ๋ฌด์— ๋”ฐ๋ผ ์•ˆ์ „์ •๋„๋ฅผ ์˜ˆ์ธกํ•ด๋ณด๋Š” task ๋ฅผ ์ˆ˜ํ–‰ํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค. 

 

 

 

•  Example : ์†Œ์…œ๋„คํŠธ์›Œํฌ์™€ ์ธํ”Œ๋ฃจ์–ธ์„œ ๋งˆ์ผ€ํŒ… 

โ†ช  ์ธ๊ณผ์ถ”๋ก  : ์ธํ”Œ๋ฃจ์–ธ์„œ ๋งˆ์ผ€ํŒ…์˜ ํšจ๊ณผ๋ฅผ ์ธก์ •ํ•˜๋Š” ๊ฒƒ, ์ธํ”Œ๋ฃจ์–ธ์„œ์˜ ํ™๋ณด์™€ ํŒ”๋กœ์›Œ๋“ค์˜ ๊ตฌ๋งค๊ฒฐ์ • ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ํ•ด์„ (์ธํ”Œ๋ฃจ์–ธ์„œ๋“ค์˜ ์˜ํ–ฅ์ด ์ฃผ๋ณ€ ํŒ”๋กœ์›Œ๋“ค๊นŒ์ง€์˜ ์ธ๊ณผ์ ์ธ ํšจ๊ณผ๊ฐ€ ์žˆ๋Š”์ง€) 

โ†ช  Prediction : ์†Œ์…œ๋„คํŠธ์›Œํฌ์—์„œ ๋งžํŒ”๋กœ์šฐ ๊ด€๊ณ„๋ฅผ ํ†ตํ•ด ์–ด๋–ค ์ •์น˜์  ์„ฑํ–ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”์ง€ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ, ์ด๋Š” ์ธ๊ณผ๊ด€๊ณ„๊ฐ€ ์„ฑ๋ฆฝํ•  ํ•„์š”๋Š” ์—†์Œ. ์ƒํ™ฉ์— ๋”ฐ๋ผ ์ƒ๊ด€๊ด€๊ณ„๋งŒ ์‚ฌ์šฉํ•ด๋„ ์ถฉ๋ถ„ํ•œ ๊ฒฝ์šฐ๊ฐ€ ์žˆ์Œ 

 

 

 

•  ์ธ๊ณผ์ถ”๋ก ์˜ ์ฃผ๋œ ๋ชฉ์ ์€ input ์„ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•œ intervention ์„ ๊ตฌํ•˜๊ธฐ ์œ„ํ•จ์ด๋‹ค. 

 

 

 

 

4. AI/ML without causal models rely on correlation 


 

•  ๋Œ€๋ถ€๋ถ„์˜ ML/AI ๋ฐฉ๋ฒ•๋ก ๋“ค์€ ์ƒ๊ด€๊ด€๊ณ„์— ๊ธฐ๋ฐ˜ํ•ด์„œ ๋ฐ์ดํ„ฐ ํŒจํ„ด์„ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์— ์ง‘์ค‘๋˜์–ด ์žˆ๊ณ , ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ์ถ”๋ก ํ•˜๋Š” ๋ฐ์—๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜, ๋จธ์‹ ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•œ ๋‹ค์–‘ํ•œ ์ธ๊ณผ์ถ”๋ก  ๋ชจ๋ธ์ด ์—ฐ๊ตฌ๋˜๊ณ  ์žˆ๋‹ค. 

 

 

 

•  ์ธ๊ณผ์ถ”๋ก  ๊ด€์ ์—์„ , ๋น…๋ฐ์ดํ„ฐ๋งŒ์œผ๋กœ๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•ด ํ•„์š”ํ•œ ๊ฒƒ์€, ๊ทผ๋ณธ์ ์œผ๋กœ ์ธ๊ณผ์  ๊ด€๊ณ„์— ๋Œ€ํ•œ ๊นŠ์€ ์ดํ•ด๋‹ค. 

 

 

 

 

728x90

๋Œ“๊ธ€