본문 바로가기

2️⃣ Study58

[개념] Part ① : 데이터 분석 기초 - ⑶ Basic of Python 보호되어 있는 글 입니다. 2023. 7. 15.
[개념] Part ① : 데이터 분석 기초 - ⑵ Basic of data analytics 보호되어 있는 글 입니다. 2023. 7. 15.
[개념] Part ① : 데이터 분석 기초 - ⑴ 현업에서 데이터분석 보호되어 있는 글 입니다. 2023. 7. 14.
[DiD, Matching] Popularity or Proximity 👀 Keyword ◯ Quasi-experimental research design • DiD • DDD • Probit model • Hazard model ◯ Matching • CEM : 단순하게 통제변수들이 비슷한 관측치끼리 매칭하는 방법 • PSM : 통제 변수가 주어진 상태에서 Treatment 를 받을 확률 (Propensity score) 이 비슷한 관측치끼리 매칭 • EDM : 유클리디안 거리를 기준으로 매칭 👀 데이터 해석을 위한 도메인 지식 ◯ The hype machine • Largest MP3 blog aggregator 로 블로그에 포스팅 된 음악/트랙 리스트들을 수집하여 관련 정보를 제공한다. 유저들은 음악을 스트리밍 할 수 잇으며, 음악 다운로드는 불가능하다. • 연구를 진.. 2023. 7. 2.
[GA4] 패스트캠퍼스 GA4 파헤치기 교육 후기 👀 본 글은 이화여자대학교 2022 겨울방학 취업 MASTER 과정 "구글 애널리틱스 이해와 기본활용" 교육 후기에 대한 내용을 담고 있습니다. 1️⃣ 신청계기 2021 겨울방학 취업 과정에서 GA 입문 교육을 통해 처음 Google Analytics 라는 툴을 알게되었고, 당시에 배웠던 UA 버전에서 최근 새롭게 GA4 버전이 등장하면서, 올해 7월부터는 완전히 GA4 기능만 남게 된다고 하여 해당 교육을 신청하게 되었다. 구글 애널리틱스는 데이터 분석가 포지션에서 Tableau, SQL 과 동시에, 많이 요구하는 스킬이라 향후 데이터 관련 업무를 수행할 때 굳이 꼭 데이터 분석 포지션이 아니더라도 다른 팀과 협업이나 소통할 때 도움이 많이 될 것 같아 신청한 부분도 크다. 커머스, 미디어 등등 웹/앱.. 2023. 1. 20.
Graph Clustering with Graph Neural Networks (2020) 논문 1️⃣ Abstract ① 문제점 제시 • graph clustering 에서 "비지도학습" 에 관한 발전이 더디게 이루어지고 있다. • graph clustering 기법이 낮은 성능을 보인다. ② 해결 방안 • DMoN : Deep Modularity Networks : 비지도 풀링 학습 방법 ▸ graph pooling : https://greeksharifa.github.io/machine_learning/2021/09/09/GraphPooling/ Python, Machine & Deep Learning Python, Machine Learning & Deep Learning greeksharifa.github.io ↪ 노드 임베딩들로부터 그래프 임베딩을 얻는 과정을 의미한다. 간단하게 말.. 2022. 12. 23.
DeepWalk 👀 Summary ✔ Node Embedding : 임베딩한 벡터를 통해 머신러닝 과제를 수행할 수 있음 • DeepWalk : Uniform distribution 을 사용해 랜덤워크 • Node2vec : DFS, BFS 탐색처럼 효율적으로 임베딩하기 위해 p, q 확률을 도입 ✔ NLP 와 RandomWalk • 랜덤워크를 통해 일련의 노드 sequence 를 만드는데, 이는 일련의 단어들이 나열된 문장을 생성하는 원리와 비슷함 • 다음 단어가 등장할 가능도를 추정하는 language modeling 은 일련의 노드 순서가 주어졌을 때 다음 노드가 등장할 확률을 계산하는 random walk 와 비슷하다. • DeepWalk Algorithm • 필기자료 2022. 11. 3.
[자료구조] DFS/BFS 1️⃣ 자료구조 기초 🐾 탐색 Search | 많은 양의 데이터 중 원하는 데이터를 찾는 과정 | 그래프, 트리 등의 자료구조 안에서 탐색을 하는 문제를 주로 다룬다. | 대표적인 탐색 알고리즘 : DFS, BFS | 탐색 알고리즘 원리를 이해하기 위해 스택, 큐, 재귀함수에 대한 이해가 필요하다. 🐾 자료구조 Data Structure | 데이터를 표현하고 관리하고 처리하기 위한 구조를 의미한다. | 스택과 큐는 자료구조의 기초 개념으로 다음의 두 함수와 두가지 고려 사항으로 구성된다. • 삽입 Push : 데이터를 삽입한다. • 삭제 Pop : 데이터를 삭제한다. • 오버플로 : 자료구조가 수용할 수 있는 데이터의 크기를 초과한 상태에서 삽입 연산을 수용할 때 발생 • 언더플로 : 자료구조에 데이터가.. 2022. 9. 2.
[자료구조] 구현 🚩 구현 | 머리속에 있는 알고리즘을 정확하고 빠르게 프로그램으로 작성하기 | 풀이를 떠올리는 것은 쉽지만 소스코드로 옮기기 어려운 문제 🐾 완전 탐색 | 모든 경우의 수를 주저 없이 다 계산하는 해결 방법 🐾 시뮬레이션 | 문제에서 제시한 알고리즘을 한 단계씩 차례대로 직접 수행해야 하는 문제 유형 🐾 구현시 고려해야 할 메모리 제약 사항 | 변수 유형 • 파이썬에서 실수형 변수는 유효 숫자에 따라 연산 결과가 원하는 값이 나올 수 있지 않다는 점을 기억하자 | 리스트 크기 - 메모리 제한 • 일반적인 코딩테스트 수준에서는 메모리 사용량 제한보다 더 적은 크기의 메모리를 사용해야 한다는 점만 기억하도록 하자 1️⃣ 실전 유형 문제 : 상하좌우 | 일련의 명령에 따라 개체를 차례대로 이동 시킴 → 시뮬레.. 2022. 9. 2.
[자료구조] 그리디 🚩 그리디 | 현재 상황에서 가장 좋아보이는 것만을 선택하는 알고리즘 | 현재 선택이 나중에 미칠 영향에 대해서는 고려하지 않는 알고리즘 🐾 그리디 알고리즘 문제는 주로 정렬 알고리즘과 짝을 이루어 출제된다. 🐾 기초 파이썬 연산자 기억하기 / : 나누기 % : 나머지 // : 몫 ** : 거듭제곱 | 그리디 알고리즘이 모든 알고리즘 문제에 적용 가능한 것은 아니다. 그리디 알고리즘은 '최적의 해' 를 찾을 수 없을 가능성이 높지만, 탐욕적으로 문제에 접근했을 때 정확한 답을 찾을 수 있다는 보장이 있다면 매우 효과적이고 직관적으로 적용할 수 있는 방법이다. | 그리디 알고리즘 문제에서는 문제 풀이를 위한 최소한의 아이디어를 생각하고, 그의 정당성을 검토해야 답을 도출할 수 있다. 1️⃣ 실전 유형 문제.. 2022. 9. 2.
728x90