๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1๏ธโƒฃ AI•DS/๐Ÿ“’ Deep learning

[๋”ฅ๋Ÿฌ๋‹ ํŒŒ์ดํ† ์น˜ ๊ต๊ณผ์„œ] 1์žฅ ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๋”ฅ๋Ÿฌ๋‹

by isdawell 2022. 9. 22.
728x90

 

โœ…  ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๋”ฅ๋Ÿฌ๋‹  

 

 

 

1๏ธโƒฃ  ์ธ๊ณต์ง€๋Šฅ, ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๋”ฅ๋Ÿฌ๋‹ 


 

โ—‡ ์ธ๊ณต์ง€๋Šฅ : '์ธ๊ฐ„์˜ ์ง€๋Šฅ์„ ๋ชจ๋ฐฉ' ํ•˜์—ฌ ์‚ฌ๋žŒ์ด ํ•˜๋Š” ์ผ์„ ๊ธฐ๊ณ„๊ฐ€ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ธฐ์ˆ   

 

โ—‡ ์ธ๊ณต์ง€๋Šฅ > ๋จธ์‹ ๋Ÿฌ๋‹ > ๋”ฅ๋Ÿฌ๋‹ 

 

โˆ˜  ๋จธ์‹ ๋Ÿฌ๋‹ : ์ธ๊ณต์‹ ๊ฒฝ๋ง, ์„œํฌํŠธ ๋ฒกํ„ฐ ๋จธ์‹ , ๊ฒฐ์ • ํŠธ๋ฆฌ โˆ™โˆ™โˆ™

โˆ˜  ๋”ฅ๋Ÿฌ๋‹ : CNN, RNN, RBM โˆ™โˆ™โˆ™

 

โœ” https://koreapy.tistory.com/1223 : RBM ์„ค๋ช… ์ฐธ๊ณ  

 

 

โ—‡ ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๋”ฅ๋Ÿฌ๋‹์˜ ์ฐจ์ด 

 

โˆ˜  ๋จธ์‹ ๋Ÿฌ๋‹ : Input > ํŠน์„ฑ ์ถ”์ถœ (์ธ๊ฐ„์ด ์ฒ˜๋ฆฌ) > ๋ถ„๋ฅ˜ (์ปดํ“จํ„ฐ๊ฐ€ ์ฒ˜๋ฆฌ) > output 

โˆ˜  ๋”ฅ๋Ÿฌ๋‹ : Input > ํŠน์„ฑ ์ถ”์ถœ + ๋ถ„๋ฅ˜  (์ปดํ“จํ„ฐ๊ฐ€ ์ฒ˜๋ฆฌ) > output 

โˆ˜  ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ํŠน์ง•์„ ์Šค์Šค๋กœ ์ฒ˜๋ฆฌํ•˜๋Š”์ง€์˜ ์—ฌ๋ถ€์— ๋”ฐ๋ผ ๋”ฅ๋Ÿฌ๋‹๊ณผ ๋จธ์‹ ๋Ÿฌ๋‹์ด ๊ตฌ๋ถ„๋œ๋‹ค. 

 

 

โœ” feature extraction ํŠน์„ฑ ์ถ”์ถœ : ์‚ฌ๋žŒ์ด ์ธ์ง€ํ•˜๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ปดํ“จํ„ฐ๊ฐ€ ์ธ์ง€ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์ž‘์—…์œผ๋กœ, ๋ฐ์ดํ„ฐ ๋ณ„๋กœ ์–ด๋–ค ํŠน์ง•์ด ์žˆ๋Š”์ง€ ์ฐพ์•„๋‚ด๊ณ  ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์ž‘์—… 

 

 

 

 

 

 

 

2๏ธโƒฃ  ๋จธ์‹ ๋Ÿฌ๋‹์ด๋ž€ 


 

์ง€์‹์ด๋‚˜ ํŒจํ„ด์„ ์ฐพ์•„ ํ•™์Šตํ•˜๊ณ  ์˜ˆ์ธก์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ

์ปดํ“จํ„ฐ๊ฐ€ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜๊ณผ ๊ธฐ์ˆ ์„ ๊ฐœ๋ฐœํ•˜๋Š” ๋ถ„์•ผ 

 

 

 

โ—‡ ๋จธ์‹ ๋Ÿฌ๋‹ ํ•™์Šต ๊ณผ์ • 

 

โˆ˜  ํฌ๊ฒŒ ํ•™์Šต ๋‹จ๊ณ„ Training ์™€ ์˜ˆ์ธก ๋‹จ๊ณ„ prediction ์œผ๋กœ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ๋‹ค. 

โˆ˜  ๊ตฌ์„ฑ ์š”์†Œ๋Š” ๋ฐ์ดํ„ฐ์™€ ๋ชจ๋ธ 

 

  • ๋ฐ์ดํ„ฐ : ํŽธํ–ฅ๋˜์ง€ ์•Š์€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”, ์ˆ˜์ง‘ ํ›„ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ์šฉ๋„๋ฅผ ๋ถ„๋ฆฌํ•˜์—ฌ ์‚ฌ์šฉํ•œ๋‹ค. 
  • ๋ชจ๋ธ : '๊ฐ€์„ค' ์ด๋ผ๊ณ  ํ•œ๋‹ค. "์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ํŒจํ„ด์€ A ์™€ ๊ฐ™๋‹ค" ๋ผ๋Š” ๊ฐ€์ •์„ '๋ชจ๋ธ' ์ด๋ผ๊ณ  ํ•œ๋‹ค. 

 

โœ” ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ์…‹  (๋ชจ๋ธ ์„ฑ๋Šฅ ํ‰๊ฐ€) ์ด ํ•„์š”ํ•œ ์ด์œ  

 

โˆ˜ ์ฐธ๊ณ ๋กœ ํ•™์Šต์— ์‚ฌ์šฉ๋˜๋Š” ๋ฐ์ดํ„ฐ์…‹์˜ ์–‘์ด ๋งŽ์œผ๋ฉด ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์€ ์ข‹์ง€ ์•Š๋‹ค. 

โˆ˜ First. ๋”ฅ๋Ÿฌ๋‹์˜ ๋ชฉ์ ์€ ์ƒˆ๋กญ๊ฒŒ ์ˆ˜์ง‘๋  ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ •ํ™•ํ•œ ์˜ˆ์ธก์„ ํ•˜๋Š” ๊ฒƒ์ด๋ฏ€๋กœ, ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ๋กœ ๊ฐ€๋Š ํ•ด๋ณผ ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์  

โˆ˜ Second. ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š”๋ฐ ๋„์›€์„ ์ค€๋‹ค. ๊ฒ€์ฆ ๋ฐ์ดํ„ฐ์—์„œ ์ •ํ™•๋„๊ฐ€ ๋‚ฎ์œผ๋ฉด ๊ณผ์ ํ•ฉ์ด ์ผ์–ด๋‚ฌ์„ ๊ฐ€๋Šฅ์„ฑ์„ ๊ณ ๋ คํ•ด ์ •๊ทœํ™”๋ฅผ ํ•˜๊ฑฐ๋‚˜ ์—ํฌํฌ๋ฅผ ์ค„์ด๋Š” ๋ฐฉ์‹์œผ๋กœ ๊ณผ์ ํ•ฉ์„ ๋ฏธ๋ฆฌ ๋ง‰์„ ์ˆ˜ ์žˆ๋‹ค. 

 

 

 

โ—‡ ๋จธ์‹ ๋Ÿฌ๋‹ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ 

 

โˆ˜  ์ง€๋„ํ•™์Šต, ๋น„์ง€๋„ํ•™์Šต, ๊ฐ•ํ™”ํ•™์Šต 

โˆ˜  ์ง€๋„ํ•™์Šต : ์ •๋‹ต์ด ์ฃผ์–ด์ง€๋Š” ํ•™์Šต ๋ฐฉ๋ฒ• 

โˆ˜  ๋น„์ง€๋„ํ•™์Šต : ์œ ์‚ฌ๋„ ๊ธฐ๋ฐ˜ (๋ฐ์ดํ„ฐ ๊ฐ„ ๊ฑฐ๋ฆฌ ์ธก์ •) ์œผ๋กœ ํŠน์ง•์ด ์œ ์‚ฌํ•œ ๋ฐ์ดํ„ฐ๋ผ๋ฆฌ ๋ฌถ์–ด์„œ ๋ถ„๋ฅ˜ 

โˆ˜  ๊ฐ•ํ™”ํ•™์Šต : ํ–‰๋™์— ๋Œ€ํ•œ ๋ณด์ƒ์„ ๋ฐ›์œผ๋ฉฐ ํ•™์Šต์„ ์ง„ํ–‰ 

 

 

 

 

 

3๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹์ด๋ž€ 


 

โ—‡ ๋”ฅ๋Ÿฌ๋‹์ด๋ž€ 

 

โˆ˜  ์ธ๊ฐ„์˜ ๋‡Œ๋ฅผ ๊ธฐ์ดˆ๋กœ ์„ค๊ณ„

โˆ˜  ์ˆ˜๋งŽ์€ ๋‰ด๋Ÿฐ์„ ๋ณ‘๋ ฌ์—ฐ์‚ฐ ํ•˜์—ฌ ์ปดํ“จํ„ฐ๊ฐ€ ์ˆ˜ํ–‰ํ•˜์ง€ ๋ชปํ–ˆ๋˜ ์Œ์„ฑ, ์˜์ƒ ์ธ์‹ ๋“ฑ ์ฒ˜๋ฆฌ๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค. 

โˆ˜  ๋ฐ์ดํ„ฐ ์ค€๋น„ → ๋ชจ๋ธ ์ •์˜ → ๋ชจ๋ธ ์ปดํŒŒ์ผ (์˜ตํ‹ฐ๋งˆ์ด์ € ์„ ํƒ, ์†์‹คํ•จ์ˆ˜ ์„ ํƒ) → ๋ชจ๋ธ ํ›ˆ๋ จ → ๋ชจ๋ธ ์˜ˆ์ธก 

โˆ˜  ๋ชจ๋ธ ์ •์˜ ๋‹จ๊ณ„์—์„œ ์‹ ๊ฒฝ๋ง์„ ์ƒ์„ฑํ•˜๋Š”๋ฐ, ์ด๋•Œ ์€๋‹‰์ธต์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋งŽ์„์ˆ˜๋ก ์„ฑ๋Šฅ์€ ์ข‹์•„์ง€๋‚˜ ๊ณผ์ ํ•ฉ์ด ๋ฐœ์ƒํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์‹ ๊ฒฝ๋ง์„ ์ œ๋Œ€๋กœ ํ˜•์„ฑํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๋‹ค. 

โˆ˜  ๋ชจ๋ธ ์ปดํŒŒ์ผ ๋‹จ๊ณ„์—์„œ ํ™œ์„ฑํ™” ํ•จ์ˆ˜, ์†์‹คํ•จ์ˆ˜, ์˜ตํ‹ฐ๋งˆ์ด์ €๋ฅผ ์„ ํƒํ•œ๋‹ค. ๋ฐ์ดํ„ฐ ํ˜•ํƒœ์— ๋”ฐ๋ผ ๋‹ค์–‘ํ•œ ์˜ต์…˜์ด ์กด์žฌํ•œ๋‹ค. 

โˆ˜  ๋ชจ๋ธ ํ›ˆ๋ จ ๋‹จ๊ณ„์—์„œ๋Š” ํ•œ๋ฒˆ์— ์ฒ˜๋ฆฌํ•  ๋ฐ์ดํ„ฐ ์–‘์„ ์ง€์ •ํ•œ๋‹ค. ์ฆ‰, ์ผ์ •ํ•œ ๋ฌถ์Œ์œผ๋กœ ๋‚˜๋ˆ„์–ด ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฐ์น˜์™€ ํ›ˆ๋ จ์˜ ํšŸ์ˆ˜์ธ ์—ํฌํฌ ์„ ํƒ์ด ์ค‘์š”ํ•˜๋‹ค. ํ›ˆ๋ จ ๊ณผ์ •์—์„œ ์„ฑ๋Šฅ์„ ์‚ดํŽด๋ณด๋ฉฐ ํŒŒ๋ผ๋ฏธํ„ฐ์™€ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ์— ๋Œ€ํ•œ ์ตœ์  ๊ฐ’์„ ์ฐพ์•„์•ผ ํ•œ๋‹ค. 

โˆ˜  ๋”ฅ๋Ÿฌ๋‹ ํ•ต์‹ฌ ๊ตฌ์†ก์š”์†Œ๋Š” ์‹ ๊ฒฝ๋ง๊ณผ ์—ญ์ „ํŒŒ 

 

 

โœ” ๋ฐฐ์น˜ : 1000๊ฐœ์˜ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ๋ฐฐ์น˜ ํฌ๊ธฐ๊ฐ€ 20์ด๋ฉด, ์ƒ˜ํ”Œ ๋‹จ์œ„ 20๊ฐœ์ผ ๋•Œ๋งˆ๋‹ค ๋ชจ๋ธ ๊ฐ€์ค‘์น˜๋ฅผ ํ•œ ๋ฒˆ์”ฉ ์—…๋ฐ์ดํŠธ ํ•œ๋‹ค๋Š” ์˜๋ฏธ 

 

โœ” ์„ฑ๋Šฅ์ด ์ข‹๋‹ค๋Š” ๊ฒƒ : ์˜ˆ์ธก์„ ์ž˜ํ•œ๋‹ค (์ •ํ™•๋„๊ฐ€ ๋†’๋‹ค), ํ›ˆ๋ จ ์†๋„๊ฐ€ ๋น ๋ฅด๋‹ค 

 

 

 

 

โ—‡ ๋”ฅ๋Ÿฌ๋‹ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜ 

 

 

โˆ˜  ์ง€๋„ํ•™์Šต 

 

  • ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง CNN : ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜, ์ด๋ฏธ์ง€ ์ธ์‹, ์ด๋ฏธ์ง€ ๋ถ„ํ•  
  • ์ˆœํ™˜ ์‹ ๊ฒฝ๋ง RNN : ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ (ex. LSTM) 

 

 

โˆ˜  ๋น„์ง€๋„ํ•™์Šต

 

  • ์›Œ๋“œ ์ž„๋ฒ ๋”ฉ : ๋‹จ์–ด๋ฅผ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๊ธฐ๋ฒ•. Word2Vec, GloVe
  • ๊ตฐ์ง‘ : ๋จธ์‹ ๋Ÿฌ๋‹์˜ ๊ตฐ์ง‘ํ™”์™€ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์ฃผ๋กœ ๋งŽ์Œ. GMM, SOM
  • ์ฐจ์›์ถ•์†Œ : AutoEncoder, PCA 

 

โˆ˜  ์ „์ดํ•™์Šต 

 

  • ์‚ฌ์ „์— ํ•™์Šต์ด ์™„๋ฃŒ๋œ pre trained model ์„ ๊ฐ€์ง€๊ณ  ์›ํ•˜๋Š” ํ•™์Šต์— ๋ฏธ์„ธ์กฐ์ • (fine tuning) ๊ธฐ๋ฒ•์„ ์ด์šฉํ•ด ํ•™์Šต์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•
  • ์‚ฌ์ „์— ํ•™์Šต์ด ์™„๋ฃŒ๋œ ๋ชจ๋ธ์ด ํ•„์š”ํ•˜๋‹ค. ์‚ฌ์ „ํ•™์Šต๋ชจ๋ธ์€ ํ’€๊ณ ์ž ํ•˜๋Š” ๋ฌธ์ œ์™€ ๋น„์Šทํ•˜๋ฉด์„œ ๋งŽ์€ ๋ฐ์ดํ„ฐ๋กœ ์ด๋ฏธ ํ•™์Šต์ด ๋˜์–ด์žˆ๋Š” ๋ชจ๋ธ์ด๋‹ค. VGG, Inception, MobileNet ๊ฐ™์€ ์‚ฌ์ „ํ•™์Šต ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋ฉด ํšจ์œจ์ ์ธ ํ•™์Šต์ด ๊ฐ€๋Šฅํ•˜๋‹ค. 
  • BERT, MobileNetV2

 

 

 

 

 

 

728x90

๋Œ“๊ธ€