1๏ธโฃ AI•DS/๐ Model4 HMM ๊ธฐ๋ณธ ์ฝ๋/์์ฉ์ฌ๋ก ์ ๋ฆฌ โ ๊ฐ๋ ๋ณด์ถฉ โฏ Markov chain • HMM ์ ๋ง๋ฅด์ฝํ ์ฒด์ธ์ ํ์ฅํ ๋ชจ๋ธ์ด๋ค. • ๋ง๋ฅด์ฝํ ์ฐ์๋ ๋ง๋ฅด์ฝํ ์ฑ์ง์ ๊ฐ์ง ์ด์ฐํ๋ฅ ๊ณผ์ (discrete-time stochastic process) ์ ์๋ฏธํ๋ค. ์๊ฐ์ ๋ฐ๋ฅธ ์์คํ ์ํ์ ๋ณํ๋ฅผ ํ๋๋ด๋ฉฐ ์ด๋ฅผ ์ ์ด Transition ์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค. • ๋ง๋ฅด์ฝํ ์ฑ์ง : ๋ฏธ๋์ ์ํ๋ ์ค์ง ํ์ฌ์ ์ํ ํน์ ๋ ์ด์ ์ ์ผ์ ๊ธฐ๊ฐ์๋ง ์ํฅ์ ๋ฐ๋๋ค. ๋ฏธ๋์ ์ด๋ค ์ํ๋ฅผ ์์ธกํ๊ธฐ ์ํด ๊ณผ๊ฑฐ์ ๊ธด ์ด๋ ฅ์ ํ์๋ก ํ์ง ์๋ ์ฑ์ง์ ์๋ฏธํ๋ค. ์ฆ, ๊ณผ๊ฑฐ์ ํ์ฌ ์ํ๊ฐ ์ฃผ์ด์ก์ ๋์ ๋ฏธ๋ ์ํ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ถํฌ๋ ๊ณผ๊ฑฐ ์ํ์๋ ๋ ๋ฆฝ์ ์ผ๋ก ํ์ฌ ์ํ์ ์ํด์๋ง ๊ฒฐ์ ๋๋ค. • ์ด์ฐํ๋ฅ ๊ณผ์ : ์๊ฐ์ด ์ฐ์์ ์ผ๋ก ๋ณํ์ง ์๊ณ , ์ด์ฐ์ ์ผ๋ก ๋ณํ๋ฉฐ (ํ์ฌ ์ํ์์ ๊ทธ๋ฅ.. 2024. 1. 5. HMM ๊ธฐ์ด ๊ฐ๋ ์ ๋ฆฌ - โก Decoding, Learning โป ์ฐธ๊ณ ๋งํฌ โ HMM - Part2 (Decoding) โฏ Decoding Problem → HMM ์ ํต์ฌ โข Decoding ๋ฌธ์ ์ ์ • Problem : HMM(λ*) ๊ณผ O ๊ฐ ์ฃผ์ด์ก์ ๋, ์ต์ ์ S ๋ฅผ ์ฐพ๋ ๊ฒ (๊ฐ์ฅ ๊ทธ๋ด์ธํ ์๋์ํ์ ์ํ์ค ๊ฒฐ์ ) • Solution : Viterbi algorithm • ex. ์ ๋ฐ์ฌ๊ฐ ์ค๋ ์ฐ์ฑ , ๋ด์ผ ์ฐ์ฑ , ๋ชจ๋ ์ฐ๊ตฌ, ๊ธํผ ์ผํํ๋ค๋ฉด, ๊ฐ ๋ ๋ค ๋ ์จ๋ ? โข Viterbi algorithm • vt(i) : t ๋ฒ์งธ ์์ ์ i ์๋์ํ์ ํ๋ฅ [t=1 ์์์ ๊ณ์ฐ] • v1(1) = (S1์ด t=1์์ ๋ฐ์ํ ํ๋ฅ ) • (S1 ์๋์ํ์์ ์ฐ์ฑ ์ด ๊ด์ฐฐ๋ ํ๋ฅ ) = π1•b1(์ฐ์ฑ ) • v1(2) = (S2๊ฐ t=1์์ ๋ฐ์ํ ํ๋ฅ ) • (S2 .. 2024. 1. 4. HMM ๊ธฐ์ด ๊ฐ๋ ์ ๋ฆฌ - โ ๊ฐ๋ , Evaluation โป ์ฐธ๊ณ ๋งํฌ โ HMM - Part1 (๊ฐ๋ ) โฏ ์์ฐจ ๋ฐ์ดํฐ • ์๊ฐ์ ๋ฐ๋ผ ์ป์ด์ง๋ ๋ฐ์ดํฐ • ์๊ฐ์ฑ ํน์ฑ์ด ์์ • ์์ โช ํ๋์ ์ ํ์ด ์์ฑํ์ด ๋ ๋๊น์ง๋ 10๊ฐ์ ๊ณต์ ์ ๊ฑฐ์น๊ณ , ๊ฐ ๊ณต์ ๋ณ๋ก ์ฌ๋ฌ ์ค๋น ์ข ๋ฅ๋ฅผ ๊ฐ์ง๊ณ ์์ โช ๊ณต์ ์ ๊ฑฐ์น๋ ๊ฒ์ ์๊ฐ์ ํ๋ฆ์ผ๋ก ๋ณผ ์ ์์ • ์์ฐจ ๋ฐ์ดํฐ ์ธ์ ์์ โฏ Hidden Markove Model (HMM) • ์์ฐจ ๋ฐ์ดํฐ๋ฅผ ํ๋ฅ ์ (Stochasic) ์ผ๋ก ๋ชจ๋ธ๋ง ํ๋ ์์ฑ ๋ชจ๋ธ (Generative model) โฏ Markove Model ์ด๋ • state ๋ก ์ด๋ฃจ์ด์ง sequence ๋ฅผ ์ํ ์ ์ด ํ๋ฅ ํ๋ ฌ๋ก ํํํ๋ ๊ฒ • ์ํ ์ ์ด ํ๋ฅ ํ๋ ฌ : ์ํ๊ฐ ๋ณํํ๋ ๊ฒ์ ํ๋ฅ ๋ก ํํ โช ์ํ ์ ์ด ํ๋ฅ ์ sum ์ผ๋ก ๋๋ ์ฃผ๊ธฐ โช ex. ๋น์์.. 2024. 1. 3. Tabnet 0๏ธโฃ Tabnet Tree ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๋ณ์ ์ ํ ํน์ง์ ๋คํธ์ํฌ ๊ตฌ์กฐ์ ๋ฐ์ํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ 1๏ธโฃ ๋ฐฐ๊ฒฝ โ ๊ธฐ์กด ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ด๋ฏธ์ง, ์์ฑ, ์ธ์ด์ ๊ฐ์ ๋น์ ํ ๋ฐ์ดํฐ์๋ง ์ ์ฉ๋์์ โ ์ ํ ๋ฐ์ดํฐ Tabular Data ๋ ์ต๊ทผ๊น์ง๋ kaggle ๊ฐ์ ์ฌ๋ฌ ๋ํ์์ XGBoost, LightGBM, CatBoost์๊ฐ์ Tree๊ธฐ๋ฐ์ ์์๋ธ ๋ชจ๋ธ์ ์ฃผ๋ก ์ฌ์ฉํ์ ๐ ๋ฅ๋ฌ๋์ ์ ์ง์ ํ์ต ํน์ฑ + ์ฌ์ ํ์ต ๊ฐ๋ฅ์ฑ์ ์๋ก์ด ๋ถ์ ๊ธฐํ๋ฅผ ๋์ถ ๐ ํธ๋ฆฌ๊ธฐ๋ฐ ๋ชจ๋ธ + ์ ๊ฒฝ๋ง ๋ชจ๋ธ ๊ตฌ์กฐ ์ ์ฅ์ ์ ๋ชจ๋ ๊ฐ๋ Tabnet ์ ์ ์ ๐ feature selection & engineering + ๋ชจ๋ธ ํด์๋ ฅ์ ๊ฐ์ถ ์ ๊ฒฝ๋ง ๋ชจ๋ธ 2๏ธโฃ Tabnet ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ๐ง ์์๋ธ ๋ชจ๋ธ์ด ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ณด๋ค ์ฐ์ํ ์ด์ (1) .. 2022. 3. 31. ์ด์ 1 ๋ค์ 728x90