2️⃣ Study for work20 분산 시스템 - 데이터 마트, 데이터 웨어하우스 ① Hadoop, NoSQL ▶ 하둡 : 다수의 컴퓨터에서 대량의 데이터를 처리하기 위한 시스템 (분산 처리 소프트웨어 프레임워크) º 웹서버에서 생성된 데이터 → RDB, NoSQL, 텍스트 데이터 → Hadoop (대규모 데이터 처리) º 하둡과 데이터베이스 ▶ NoSQL : 전통적인 RDB의 제약을 제거하는 것을 목표로 한 데이터베이스 º 키 밸류 스토어(다수의 키와 값을 관련지어 저장), 도규멘트 스토어(JSON과 같은 복잡한 데이터 구조를 저장), 와이드 칼럼 스토어(여러 키를 사용해 높은 확장성을 제공) 등 다양한 종류가 있다. ② 데이터웨어하우스 ▶ DW : 데이터를 통합, 분석 및 보고하기 위해 설계된 대규모 저장소 (대량의 데이터 분석 최적화) º 전통적인.. 2025. 3. 17. [실습36] HR데이터 분석 - Class Imbalance, ANOVA, Chi-squared 보호되어 있는 글 입니다. 2024. 12. 3. [실습16] 센서 데이터 활용 가전제품 사용자 패턴 군집화 - Clustering, 가전데이터, Joyplot, Scaler 보호되어 있는 글 입니다. 2024. 12. 1. [개념] Part ② : 유형별 알고리즘 - ⑹ Anomaly Detection 보호되어 있는 글 입니다. 2024. 11. 29. 정량적스킬 - 01. BA 업무, 이중차분법 보호되어 있는 글 입니다. 2024. 11. 28. [MLOps] ch2. MLflow를 활용한 MLOps 보호되어 있는 글 입니다. 2024. 11. 28. [실습14] 반도체 웨이퍼 칩 변환분석 - 공정 데이터, SHAP 보호되어 있는 글 입니다. 2024. 11. 28. [MLOps] ch1. 머신러닝 상품화를 위한 기술 보호되어 있는 글 입니다. 2024. 11. 27. SQL - ch02. 테이블 생성과 조회 (DDL) 보호되어 있는 글 입니다. 2024. 9. 13. SQL - ch01. SQL 기초 보호되어 있는 글 입니다. 2024. 7. 2. 이전 1 2 다음 728x90