๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

2๏ธโƒฃ Study/๐Ÿ“‘ ๋…ผ๋ฌธ์ฝ๊ธฐ7

[Causal Forest] ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ์ธ๊ณผ ํฌ๋ ˆ์ŠคํŠธ ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•œ ์ฒ˜์น˜ํšจ๊ณผ ๊ฒ€์ฆ: ๊ต๋‚ด ๋™์•„๋ฆฌํ™œ๋™ ์ฐธ์—ฌ๊ฐ€ ํ˜‘์—…๋Šฅ๋ ฅ์— ๋ฏธ์น˜๋Š” ํšจ๊ณผ๋ฅผ ์ค‘์‹ฌ์œผ๋กœ โ— [Research Topic] โ— โˆ˜ Causal Forest ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•ด ์ฒ˜์น˜ํšจ๊ณผ๋ฅผ ๊ฒ€์ฆ โˆ˜ ๊ต๋‚ด ๋™์•„๋ฆฌ ํ™œ๋™ ์ฐธ์—ฌ๊ฐ€ ํ˜‘์—… ๋Šฅ๋ ฅ์— ๋ฏธ์น˜๋Š” ํšจ๊ณผ ๋ถ„์„ : ๋™์•„๋ฆฌ ํ™œ๋™์ด ํ˜‘์—…๋Šฅ๋ ฅ์— ๋ฏธ์น˜๋Š” ํ‰๊ท  ์ฒ˜์น˜ํšจ๊ณผ (ATE) ๋ฅผ ์ถ”์ •ํ•จ๊ณผ ๋™์‹œ์— ์„ฑ๋ณ„, ๋˜๋ž˜๊ด€๊ณ„, ๊ต์‚ฌ๊ด€๊ณ„์— ๋”ฐ๋ผ ๋™์•„๋ฆฌํ™œ๋™์˜ ํšจ๊ณผ๊ฐ€ ๋‹ค๋ฅด๊ฒŒ ๋‚˜ํƒ€๋‚˜๋Š”์ง€ (Heterogeneous treatment effects) ๋„ ํƒ์ƒ‰ โ— [Introduction] โ— โ‘ด ๊ธฐ์กด ์—ฐ๊ตฌ ๋ฐฉ์‹ โˆ˜ ์ฒ˜์น˜๋“ค์— ๋Œ€ํ•œ ํšจ๊ณผ๋ฅผ Randomized experiments ํ˜น์€ Observational data ๋ฅผ ์ด์šฉํ•ด ๊ฒ€์ฆํ•˜๋ ค๋Š” ๋…ธ๋ ฅ์ด ์ด๋ฃจ์–ด์ง€๊ณ  ์žˆ๋‹ค. Randomized experiments ๋Š” ์—ฐ๊ตฌ์ž๊ฐ€ ์ฒ˜์น˜ ํ• ๋‹น์„ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ฐธ์—ฌ์ž์— ์˜ํ•œ Selection bias ๊ฐ€ ๋ฐœ์ƒํ•˜.. 2024. 1. 23.
[DiD, Matching] Popularity or Proximity ๐Ÿ‘€ Keyword โ—ฏ Quasi-experimental research design • DiD • DDD • Probit model • Hazard model โ—ฏ Matching • CEM : ๋‹จ์ˆœํ•˜๊ฒŒ ํ†ต์ œ๋ณ€์ˆ˜๋“ค์ด ๋น„์Šทํ•œ ๊ด€์ธก์น˜๋ผ๋ฆฌ ๋งค์นญํ•˜๋Š” ๋ฐฉ๋ฒ• • PSM : ํ†ต์ œ ๋ณ€์ˆ˜๊ฐ€ ์ฃผ์–ด์ง„ ์ƒํƒœ์—์„œ Treatment ๋ฅผ ๋ฐ›์„ ํ™•๋ฅ  (Propensity score) ์ด ๋น„์Šทํ•œ ๊ด€์ธก์น˜๋ผ๋ฆฌ ๋งค์นญ • EDM : ์œ ํด๋ฆฌ๋””์•ˆ ๊ฑฐ๋ฆฌ๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋งค์นญ ๐Ÿ‘€ ๋ฐ์ดํ„ฐ ํ•ด์„์„ ์œ„ํ•œ ๋„๋ฉ”์ธ ์ง€์‹ โ—ฏ The hype machine • Largest MP3 blog aggregator ๋กœ ๋ธ”๋กœ๊ทธ์— ํฌ์ŠคํŒ… ๋œ ์Œ์•…/ํŠธ๋ž™ ๋ฆฌ์ŠคํŠธ๋“ค์„ ์ˆ˜์ง‘ํ•˜์—ฌ ๊ด€๋ จ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ์œ ์ €๋“ค์€ ์Œ์•…์„ ์ŠคํŠธ๋ฆฌ๋ฐ ํ•  ์ˆ˜ ์ž‡์œผ๋ฉฐ, ์Œ์•… ๋‹ค์šด๋กœ๋“œ๋Š” ๋ถˆ๊ฐ€๋Šฅํ•˜๋‹ค. • ์—ฐ๊ตฌ๋ฅผ ์ง„.. 2023. 7. 2.
Graph Clustering with Graph Neural Networks (2020) ๋…ผ๋ฌธ 1๏ธโƒฃ Abstract โ‘  ๋ฌธ์ œ์  ์ œ์‹œ • graph clustering ์—์„œ "๋น„์ง€๋„ํ•™์Šต" ์— ๊ด€ํ•œ ๋ฐœ์ „์ด ๋”๋””๊ฒŒ ์ด๋ฃจ์–ด์ง€๊ณ  ์žˆ๋‹ค. • graph clustering ๊ธฐ๋ฒ•์ด ๋‚ฎ์€ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค. โ‘ก ํ•ด๊ฒฐ ๋ฐฉ์•ˆ • DMoN : Deep Modularity Networks : ๋น„์ง€๋„ ํ’€๋ง ํ•™์Šต ๋ฐฉ๋ฒ• โ–ธ graph pooling : https://greeksharifa.github.io/machine_learning/2021/09/09/GraphPooling/ Python, Machine & Deep Learning Python, Machine Learning & Deep Learning greeksharifa.github.io โ†ช ๋…ธ๋“œ ์ž„๋ฒ ๋”ฉ๋“ค๋กœ๋ถ€ํ„ฐ ๊ทธ๋ž˜ํ”„ ์ž„๋ฒ ๋”ฉ์„ ์–ป๋Š” ๊ณผ์ •์„ ์˜๋ฏธํ•œ๋‹ค. ๊ฐ„๋‹จํ•˜๊ฒŒ ๋ง.. 2022. 12. 23.
DeepWalk ๐Ÿ‘€ Summary โœ” Node Embedding : ์ž„๋ฒ ๋”ฉํ•œ ๋ฒกํ„ฐ๋ฅผ ํ†ตํ•ด ๋จธ์‹ ๋Ÿฌ๋‹ ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Œ • DeepWalk : Uniform distribution ์„ ์‚ฌ์šฉํ•ด ๋žœ๋ค์›Œํฌ • Node2vec : DFS, BFS ํƒ์ƒ‰์ฒ˜๋Ÿผ ํšจ์œจ์ ์œผ๋กœ ์ž„๋ฒ ๋”ฉํ•˜๊ธฐ ์œ„ํ•ด p, q ํ™•๋ฅ ์„ ๋„์ž… โœ” NLP ์™€ RandomWalk • ๋žœ๋ค์›Œํฌ๋ฅผ ํ†ตํ•ด ์ผ๋ จ์˜ ๋…ธ๋“œ sequence ๋ฅผ ๋งŒ๋“œ๋Š”๋ฐ, ์ด๋Š” ์ผ๋ จ์˜ ๋‹จ์–ด๋“ค์ด ๋‚˜์—ด๋œ ๋ฌธ์žฅ์„ ์ƒ์„ฑํ•˜๋Š” ์›๋ฆฌ์™€ ๋น„์Šทํ•จ • ๋‹ค์Œ ๋‹จ์–ด๊ฐ€ ๋“ฑ์žฅํ•  ๊ฐ€๋Šฅ๋„๋ฅผ ์ถ”์ •ํ•˜๋Š” language modeling ์€ ์ผ๋ จ์˜ ๋…ธ๋“œ ์ˆœ์„œ๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ ๋‹ค์Œ ๋…ธ๋“œ๊ฐ€ ๋“ฑ์žฅํ•  ํ™•๋ฅ ์„ ๊ณ„์‚ฐํ•˜๋Š” random walk ์™€ ๋น„์Šทํ•˜๋‹ค. • DeepWalk Algorithm • ํ•„๊ธฐ์ž๋ฃŒ 2022. 11. 3.
์•ฑ ๋ฆฌ๋ทฐ ๋ถ„์„์— ๊ด€ํ•œ ๋…ผ๋ฌธ ์ •๋ฆฌ โ‘ข ๐Ÿ‘€ ๋…ผ๋ฌธ ์ฝ๊ธฐ๋ฅผ ํ†ตํ•ด ํ•ด๊ฒฐํ•˜๊ณ  ์‹ถ์€ ๋ถ€๋ถ„ 1. ํ‘œ๋ณธ์ด ์ž‘์€ ๋ฐ์ดํ„ฐ์—๋„ ํ† ํ”ฝ๋ชจ๋ธ๋ง๊ณผ ๊ฐ์„ฑ๋ถ„์„์„ ์ ์šฉํ•ด๋„ ๊ดœ์ฐฎ์„๊นŒ 2. ์–ดํ”Œ ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋Š” ์–ด๋– ํ•œ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•˜์—ฌ ์–ด๋– ํ•œ ์ธ์‚ฌ์ดํŠธ๋ฅผ ์–ป์–ด๋‚ผ๊นŒ 3. ์•ฑ์Šคํ† ์–ด ๋ฆฌ๋ทฐ + ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ๋ฆฌ๋ทฐ ๋ถ„์„ ๋กœ์ง ์„ค๊ณ„ํ•˜๊ธฐ 1๏ธโƒฃ ๋ชจ๋ฐ”์ผ ์•ฑ ์„œ๋น„์Šค ์—…๋ฐ์ดํŠธ๊ฐ€ ์‚ฌ์šฉ์ž ๋งŒ์กฑ๋„ ๋ฐ ์œ ์ง€์œจ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ (2021) โœจ ์—ฐ๊ตฌ ๋ชฉ์  โ—พ ๊ณ ๊ฐ ๋งŒ์กฑ๋„ ํ–ฅ์ƒ๊ณผ ์œ ์ €์ดํƒˆ ๋ฐฉ์ง€๋ฅผ ์œ„ํ•œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ฐœ์„  ๋ฐฉํ–ฅ ์ œ์‹œ โœจ ํ•ต์‹ฌ ์ •๋ฆฌ โ—พ ๋ชจ๋ฐ”์ผ ์•ฑ ๋ฆฌ๋ทฐ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ + ํ…์ŠคํŠธ ๋งˆ์ด๋‹ ๊ธฐ๋ฒ• → ์ด์šฉ์ž ๋งŒ์กฑ๋„์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ํ•ต์‹ฌ ํ‚ค์›Œ๋“œ ๋„์ถœ โ—พ ์—…๋ฐ์ดํŠธ ๊ธฐ๊ฐ„ ๋ณ„ ์œ ์ € ์ˆ˜ ๋ถ„์„์„ ํ†ตํ•ด ์—…๋ฐ์ดํŠธ๊ฐ€ ์œ ์ € ์ดํƒˆ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ ๋ถ„์„ โ‘  ์„œ๋ก  โœ” ์—ฐ๊ตฌ์˜ ํ•„์š”์„ฑ : ์˜จ๋ผ์ธ ๋ฆฌ๋ทฐ์˜ ๋Œ€๋ถ€๋ถ„์€ ์ œํ’ˆ ๋ฐ ์„œ๋น„์Šค.. 2022. 6. 16.
์•ฑ ๋ฆฌ๋ทฐ ๋ถ„์„์— ๊ด€ํ•œ ๋…ผ๋ฌธ ์ •๋ฆฌ โ‘ก ๐Ÿ‘€ ๋…ผ๋ฌธ ์ฝ๊ธฐ๋ฅผ ํ†ตํ•ด ํ•ด๊ฒฐํ•˜๊ณ  ์‹ถ์€ ๋ถ€๋ถ„ 1. ํ‘œ๋ณธ์ด ์ž‘์€ ๋ฐ์ดํ„ฐ์—๋„ ํ† ํ”ฝ๋ชจ๋ธ๋ง๊ณผ ๊ฐ์„ฑ๋ถ„์„์„ ์ ์šฉํ•ด๋„ ๊ดœ์ฐฎ์„๊นŒ 2. ์–ดํ”Œ ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋Š” ์–ด๋– ํ•œ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•˜์—ฌ ์–ด๋– ํ•œ ์ธ์‚ฌ์ดํŠธ๋ฅผ ์–ป์–ด๋‚ผ๊นŒ 3. ์•ฑ์Šคํ† ์–ด ๋ฆฌ๋ทฐ + ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ๋ฆฌ๋ทฐ ๋ถ„์„ ๋กœ์ง ์„ค๊ณ„ํ•˜๊ธฐ 1๏ธโƒฃ ์ง€์—ญํ™”ํ ์•ฑ ์‚ฌ์šฉ์ž ๋ฆฌ๋ทฐ ๋ถ„์„์„ ํ†ตํ•œ ๋งˆ์ผ€ํŒ… ์ „๋žต ์ˆ˜๋ฆฝ - '๋™๋ฐฑ์ „'๊ณผ '์ธ์ฒœ e์Œ'์„ ์ค‘์‹ฌ์œผ๋กœ (2020.11) โœจ ์—ฐ๊ตฌ ๋ชฉ์  โ—พ ์ง€์—ญํ™”ํ ์•ฑ ์‚ฌ์šฉ์ž ๋ฆฌ๋ทฐ๋ฅผ ๋ถ„์„ํ•˜์—ฌ ์ง€์—ญํ™”ํ ์‚ฌ์šฉ์ž์˜ ๊ธ์ •/๋ถ€์ • ์š”์ธ์„ ํŒŒ์•…ํ•˜๊ณ  ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋งˆ์ผ€ํŒ… ์ „๋žต์„ ์ˆ˜๋ฆฝํ•œ๋‹ค. ์ง€์—ญํ™”ํ ๋‹ด๋‹น ๊ณต๋ฌด์›๋“ค๊ณผ ๋งˆ์ผ€ํ„ฐ๋“ค์—๊ฒŒ ์ง€์—ญํ™”ํ์— ๋Œ€ํ•œ ์œ ์˜๋ฏธํ•œ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ด ์ค„ ์ˆ˜ ์žˆ๋‹ค. โœจ ํ•ต์‹ฌ ์ •๋ฆฌ โ—พ ์•ฑ ์‚ฌ์šฉ์ž ๋ฆฌ๋ทฐ๋ฅผ '๋ณ„์ '์„ ๊ธฐ์ค€์œผ๋กœ ๊ธ์ •๊ณผ ๋ถ€์ •์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ณ  ๊ฐ๊ฐ ์›Œ๋“œํด๋ผ์šฐ๋“œ.. 2022. 6. 15.
์•ฑ ๋ฆฌ๋ทฐ ๋ถ„์„์— ๊ด€ํ•œ ๋…ผ๋ฌธ ์ •๋ฆฌ โ‘  ๐Ÿ‘€ ๋…ผ๋ฌธ ์ฝ๊ธฐ๋ฅผ ํ†ตํ•ด ํ•ด๊ฒฐํ•˜๊ณ  ์‹ถ์€ ๋ถ€๋ถ„ 1. ํ‘œ๋ณธ์ด ์ž‘์€ ๋ฐ์ดํ„ฐ์—๋„ ํ† ํ”ฝ๋ชจ๋ธ๋ง๊ณผ ๊ฐ์„ฑ๋ถ„์„์„ ์ ์šฉํ•ด๋„ ๊ดœ์ฐฎ์„๊นŒ 2. ์–ดํ”Œ ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋Š” ์–ด๋– ํ•œ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ ์ ‘๊ทผํ•˜์—ฌ ์–ด๋– ํ•œ ์ธ์‚ฌ์ดํŠธ๋ฅผ ์–ป์–ด๋‚ผ๊นŒ 3. ์•ฑ์Šคํ† ์–ด ๋ฆฌ๋ทฐ + ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ๋ฆฌ๋ทฐ ๋ถ„์„ ๋กœ์ง ์„ค๊ณ„ํ•˜๊ธฐ 1๏ธโƒฃ ํ…์ŠคํŠธ ๋งˆ์ด๋‹์„ ์ด์šฉํ•œ ๋ถ€๋™์‚ฐ ์„œ๋น„์Šค ์•ฑ ๋ฆฌ๋ทฐ ๋ถ„์„ (2021.12) โœจ ์—ฐ๊ตฌ ๋ชฉ์  โ—พ ์—ฌ๋Ÿฌ ๋ถ€๋™์‚ฐ ์„œ๋น„์Šค ์•ฑ์— ๋Œ€ํ•œ ์‹ค์ œ ์ด์šฉ์ž ๋ฆฌ๋ทฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ด์šฉ์ž๋“ค์ด ๋งŒ์กฑํ•˜๋Š” ์š”์ธ๋“ค์„ ์ฐพ๊ณ , ์„œ๋น„์Šค๋ณ„๋กœ ์–ด๋–ค ์š”์ธ๋“ค์— ๊ฐ•์  ๋ฐ ์•ฝ์ ์ด ์žˆ๋Š”์ง€ ํŒŒ์•…ํ•œ๋‹ค. โ—พ ์—ฌ๋Ÿฌ ๋ถ€๋™์‚ฐ ์•ฑ (์ง๋ฐฉ, ๋‹ค๋ฐฉ, ๋„ค์ด๋ฒ„ ๋“ฑ) ์ด ์ œ๊ณตํ•˜๋Š” ์„œ๋น„์Šค ํ˜„ํ™ฉ๊ณผ ์‹ค์ œ ์ด์šฉ์ž๋“ค์˜ ๋งŒ์กฑ๋„๋ฅผ ๋ถ„์„ํ•ด ์•ฑ ๊ฐœ์„ ์ ์„ ์ œ๊ณตํ•˜๋Š” ๊ฒƒ์„ ๋ชฉ์ ์œผ๋กœ ํ•œ๋‹ค. โœจ ํ•ต์‹ฌ ์ •๋ฆฌ โ‘  ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ํ…์ŠคํŠธ ์ „์ฒ˜๋ฆฌ .. 2022. 6. 7.
728x90