2️⃣ Study48 [자료구조] 이진탐색 1️⃣ 순차탐색 • 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법 • 보통 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용된다. • 자주 사용되는 탐색 알고리즘으로, 리스트에 특정 값의 원소가 있는지 체크할 때에도 순차 탐색으로 원소를 확인하고, 리스트 자료형에서 특정한 값을 가지는 원소 개수를 세는 count 메서드를 이용할 때도 내부에서는 순차 탐색이 수행된다. • 가장 앞에있는 원소부터 차례로 확인해야 하기 때문에 시간 복잡도는 O(N) 이다. def sequential_search (n, target, array) : for i in range(n) : # 현재 원소가 찾고자 하는 원소와 동일한 경우 if array[i] == target : .. 2024. 4. 4. [자료구조] 정렬 1. 정렬 라이브러리로 풀 수 있는 문제 : 단순히 정렬 기법을 알고있는지 물어보는 문제 2. 정렬 알고리즘의 원리에 대해서 물어보는 문제 : 선택 정렬, 삽입 정렬, 퀵 정렬 등의 원리를 알고 있어야 함 3. 더 빠른 정렬이 필요한 문제 : 계수 정렬 등 다른 알고리즘을 이용하거나 구조적인 개선을 거쳐야 풀 수 있는 문제 1️⃣ 정렬 • 데이터를 특정한 기준에 따라서 순서대로 나열하는 것 • 데이터를 정렬하면 이진탐색이 가능해진다. • 선택정렬, 삽입 정렬, 퀵정렬, 계수정렬 • 알고리즘 효율성과 관련되어 있음 ※ 책에서는 모두 오름차순 정렬을 기준으로 설명한다. 내림차순은 오름차순 결과에서 인덱스 Reverse 해서 출력하면 된다. 2️⃣ 선택정렬 • 원시적인 방법으로 매번 가장 작은 것을 선택하는 .. 2024. 2. 25. [Causal Forest] 머신러닝 기반의 인과 포레스트 기법을 활용한 처치효과 검증: 교내 동아리활동 참여가 협업능력에 미치는 효과를 중심으로 ● [Research Topic] ● ∘ Causal Forest 기법을 활용해 처치효과를 검증 ∘ 교내 동아리 활동 참여가 협업 능력에 미치는 효과 분석 : 동아리 활동이 협업능력에 미치는 평균 처치효과 (ATE) 를 추정함과 동시에 성별, 또래관계, 교사관계에 따라 동아리활동의 효과가 다르게 나타나는지 (Heterogeneous treatment effects) 도 탐색 ● [Introduction] ● ⑴ 기존 연구 방식 ∘ 처치들에 대한 효과를 Randomized experiments 혹은 Observational data 를 이용해 검증하려는 노력이 이루어지고 있다. Randomized experiments 는 연구자가 처치 할당을 하기 때문에 참여자에 의한 Selection bias 가 발생하.. 2024. 1. 23. [DiD, Matching] Popularity or Proximity 👀 Keyword ◯ Quasi-experimental research design • DiD • DDD • Probit model • Hazard model ◯ Matching • CEM : 단순하게 통제변수들이 비슷한 관측치끼리 매칭하는 방법 • PSM : 통제 변수가 주어진 상태에서 Treatment 를 받을 확률 (Propensity score) 이 비슷한 관측치끼리 매칭 • EDM : 유클리디안 거리를 기준으로 매칭 👀 데이터 해석을 위한 도메인 지식 ◯ The hype machine • Largest MP3 blog aggregator 로 블로그에 포스팅 된 음악/트랙 리스트들을 수집하여 관련 정보를 제공한다. 유저들은 음악을 스트리밍 할 수 잇으며, 음악 다운로드는 불가능하다. • 연구를 진.. 2023. 7. 2. [GA4] 패스트캠퍼스 GA4 파헤치기 교육 후기 👀 본 글은 이화여자대학교 2022 겨울방학 취업 MASTER 과정 "구글 애널리틱스 이해와 기본활용" 교육 후기에 대한 내용을 담고 있습니다. 1️⃣ 신청계기 2021 겨울방학 취업 과정에서 GA 입문 교육을 통해 처음 Google Analytics 라는 툴을 알게되었고, 당시에 배웠던 UA 버전에서 최근 새롭게 GA4 버전이 등장하면서, 올해 7월부터는 완전히 GA4 기능만 남게 된다고 하여 해당 교육을 신청하게 되었다. 구글 애널리틱스는 데이터 분석가 포지션에서 Tableau, SQL 과 동시에, 많이 요구하는 스킬이라 향후 데이터 관련 업무를 수행할 때 굳이 꼭 데이터 분석 포지션이 아니더라도 다른 팀과 협업이나 소통할 때 도움이 많이 될 것 같아 신청한 부분도 크다. 커머스, 미디어 등등 웹/앱.. 2023. 1. 20. Graph Clustering with Graph Neural Networks (2020) 논문 1️⃣ Abstract ① 문제점 제시 • graph clustering 에서 "비지도학습" 에 관한 발전이 더디게 이루어지고 있다. • graph clustering 기법이 낮은 성능을 보인다. ② 해결 방안 • DMoN : Deep Modularity Networks : 비지도 풀링 학습 방법 ▸ graph pooling : https://greeksharifa.github.io/machine_learning/2021/09/09/GraphPooling/ Python, Machine & Deep Learning Python, Machine Learning & Deep Learning greeksharifa.github.io ↪ 노드 임베딩들로부터 그래프 임베딩을 얻는 과정을 의미한다. 간단하게 말.. 2022. 12. 23. DeepWalk 👀 Summary ✔ Node Embedding : 임베딩한 벡터를 통해 머신러닝 과제를 수행할 수 있음 • DeepWalk : Uniform distribution 을 사용해 랜덤워크 • Node2vec : DFS, BFS 탐색처럼 효율적으로 임베딩하기 위해 p, q 확률을 도입 ✔ NLP 와 RandomWalk • 랜덤워크를 통해 일련의 노드 sequence 를 만드는데, 이는 일련의 단어들이 나열된 문장을 생성하는 원리와 비슷함 • 다음 단어가 등장할 가능도를 추정하는 language modeling 은 일련의 노드 순서가 주어졌을 때 다음 노드가 등장할 확률을 계산하는 random walk 와 비슷하다. • DeepWalk Algorithm • 필기자료 2022. 11. 3. [자료구조] DFS/BFS 1️⃣ 자료구조 기초 🐾 탐색 Search | 많은 양의 데이터 중 원하는 데이터를 찾는 과정 | 그래프, 트리 등의 자료구조 안에서 탐색을 하는 문제를 주로 다룬다. | 대표적인 탐색 알고리즘 : DFS, BFS | 탐색 알고리즘 원리를 이해하기 위해 스택, 큐, 재귀함수에 대한 이해가 필요하다. 🐾 자료구조 Data Structure | 데이터를 표현하고 관리하고 처리하기 위한 구조를 의미한다. | 스택과 큐는 자료구조의 기초 개념으로 다음의 두 함수와 두가지 고려 사항으로 구성된다. • 삽입 Push : 데이터를 삽입한다. • 삭제 Pop : 데이터를 삭제한다. • 오버플로 : 자료구조가 수용할 수 있는 데이터의 크기를 초과한 상태에서 삽입 연산을 수용할 때 발생 • 언더플로 : 자료구조에 데이터가.. 2022. 9. 2. [자료구조] 구현 🚩 구현 | 머리속에 있는 알고리즘을 정확하고 빠르게 프로그램으로 작성하기 | 풀이를 떠올리는 것은 쉽지만 소스코드로 옮기기 어려운 문제 🐾 완전 탐색 | 모든 경우의 수를 주저 없이 다 계산하는 해결 방법 🐾 시뮬레이션 | 문제에서 제시한 알고리즘을 한 단계씩 차례대로 직접 수행해야 하는 문제 유형 🐾 구현시 고려해야 할 메모리 제약 사항 | 변수 유형 • 파이썬에서 실수형 변수는 유효 숫자에 따라 연산 결과가 원하는 값이 나올 수 있지 않다는 점을 기억하자 | 리스트 크기 - 메모리 제한 • 일반적인 코딩테스트 수준에서는 메모리 사용량 제한보다 더 적은 크기의 메모리를 사용해야 한다는 점만 기억하도록 하자 1️⃣ 실전 유형 문제 : 상하좌우 | 일련의 명령에 따라 개체를 차례대로 이동 시킴 → 시뮬레.. 2022. 9. 2. [자료구조] 그리디 🚩 그리디 | 현재 상황에서 가장 좋아보이는 것만을 선택하는 알고리즘 | 현재 선택이 나중에 미칠 영향에 대해서는 고려하지 않는 알고리즘 🐾 그리디 알고리즘 문제는 주로 정렬 알고리즘과 짝을 이루어 출제된다. 🐾 기초 파이썬 연산자 기억하기 / : 나누기 % : 나머지 // : 몫 ** : 거듭제곱 | 그리디 알고리즘이 모든 알고리즘 문제에 적용 가능한 것은 아니다. 그리디 알고리즘은 '최적의 해' 를 찾을 수 없을 가능성이 높지만, 탐욕적으로 문제에 접근했을 때 정확한 답을 찾을 수 있다는 보장이 있다면 매우 효과적이고 직관적으로 적용할 수 있는 방법이다. | 그리디 알고리즘 문제에서는 문제 풀이를 위한 최소한의 아이디어를 생각하고, 그의 정당성을 검토해야 답을 도출할 수 있다. 1️⃣ 실전 유형 문제.. 2022. 9. 2. 이전 1 2 3 4 5 다음 728x90