728x90
๐ ํต์ฌ
- Task : Transformer, Self - Attention
โ Self Attention
๐น Seq2Seq learning
- NMT, QA, Summarization
- ๊ฐ๋ณ ๊ธธ์ด์ data ๋ฅผ ๊ณ ์ ํฌ๊ธฐ์ vector ๋๋ matrix ๋ก ํํํ๋ ๊ณผ์ ์ด ํ์์
๐น ๊ธฐ์กด RNN ๊ณ์ด ๋ชจ๋ธ์ ํ๊ณ์
- RNN ๊ณ์ด์ ๋ชจ๋ธ์ ๋ณ๋ ฌํ๊ฐ ๋ถ๊ฐ๋ฅ
- long-term dependency ๋ฅผ ์ ๋ฐ์ํ์ง ๋ชปํจ : LSTM, GRU ๋ ์ ๋ ฅ ์ํ์ค๊ฐ ๊ต์ฅํ ๊ธด ๊ฒฝ์ฐ์ ์ด๋ฅผ ์ ๋ฐ์ํ์ง ๋ชปํจ
๐น CNN ๋ชจ๋ธ์ ํ๊ณ์
- CNN ์ ๋ณ๋ ฌ ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํ์ง๋ง long-term dependency ๋ฅผ ์ํด ๋ค์์ ๋ ์ด์ด๊ฐ ํ์ํ๋ค
๐น Self attention
- ๋ณ๋ ฌํ๊ฐ ๊ฐ๋ฅํ๊ณ ๊ฐ ํ ํฐ์ด ์ต๋จ๊ฑฐ๋ฆฌ๋ก ์ฐ๊ฒฐ๋๊ธฐ ๋๋ฌธ์ long-term dependency ๋ฌธ์ ํด๊ฒฐ๋ ๊ฐ๋ฅํ๋ค.
- LSTM, RNN ๊ฐ์ด learning mechanism ์ผ๋ก ๋ค์ํ ๋ชจ๋ธ์ ํ์ฉ๋ ์ ์๋ค.
- ๋ชจ๋ธ์ ์ฐจ์์ด ์ ๋ ฅ ์ํ์ค ๊ธธ์ด๋ณด๋ค ํฐ ๊ฒฝ์ฐ๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ ์ผ๋ฐ์ ์ผ๋ก self-attention ์ ์ฐ์ฐ๋์ด ๊ฐ์ฅ ์๋ค
โญ Self attention ์ ๊ฐ ํ ํฐ์ sequence ๋ด ๋ชจ๋ ํ ํฐ๊ณผ์ ์ฐ๊ด์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ์ฌํํ ํ๋ ๊ณผ์ ์ผ๋ก ํด์ํ ์ ์๋ค.
๐น Self attention Process
โ Input ์ linear transformation ํ์ฌ query, key, value ์์ฑ
โก Query ์ key pair ์ dot product ๊ณ์ฐ
โข Scaling ์ ์ฉ : sclaed dot product attention
- attention score ๋ค์ ๋ณด๋ค ๋ค์ํ ๋ฒกํฐ์ ๋ถ์ฐ์ํค๋ ํจ๊ณผ
- ์ค์ผ์ผ๋ง์ ํ์ง ์์ผ๋ฉด score ๋ค์ ๋ถ์ฐ์ด ์ปค์ ธ์ gradient ์ ํ๊ฐ ์ ์์ด๋ฃจ์ด์ง ์ ์๋ค. gradient ์ ํ ๊ฐ ์ ์ด๋ฃจ์ด์ ธ ๋ค์ํ ๋ฒกํฐ๋ค์ ์ ๋ณด๋ค์ ์ ์ํฉํ ์ ์๋๋ก ํด์ผ ํ๋ค.
โฃ Softmax function ์ ์ฉ
โค Softmax output ์ weight ๋ก value vector ๋ค์ weighted sum ์ ์ฐ์ถ
๐น Self Head Attention
- ํ ๋ฌธ์ฅ ๋ด์๋ ๋ค์ํ ์ ๋ณด๊ฐ ์กด์ฌํ๋ฉฐ ํ ๋ฒ์ attention ์ผ๋ก ๋ชจ๋ ์ ๋ณด๋ฅผ ์ ์ ํ ๋ฐ์ํ๊ธฐ ์ด๋ ต๊ธฐ ๋๋ฌธ์, ๋ค์ํ attention weight ๋ฅผ ํตํด ๊ฐ์ ์ป๋๋ค.
- ์๋ก ๋ค๋ฅธ scaled dot product attention ์ ใ ๋ฌ๋ฒ ์ ์ฉํ์ฌ concat ํ๋ค.
โ Transformer
๐น ๊ตฌ์กฐ
- Encoder self attention : Encoder input ์ learned representation ์ฐ์ถ
- Decoder self attention : Decoder input ์ learned representation ์ฐ์ถ
- Encoder - Decoder attention : Encoder output ๊ณผ decoder input ์ ์ฐ๊ด์ฑ์ ๋ฐ์ํ representation ์ ์ฐ์ถ
๐น Image Transformer
๐น Music Transformer
728x90
'1๏ธโฃ AIโขDS > ๐ NLP' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[cs224n] Future NLP (2021 version) (0) | 2022.07.18 |
---|---|
[cs224n] 18๊ฐ ๋ด์ฉ์ ๋ฆฌ (0) | 2022.07.18 |
[cs224n] 15๊ฐ ๋ด์ฉ์ ๋ฆฌ (0) | 2022.07.04 |
[cs224n] 13๊ฐ ๋ด์ฉ์ ๋ฆฌ (0) | 2022.07.04 |
NER ์ค์ต (0) | 2022.06.02 |
๋๊ธ