728x90
https://colab.research.google.com/drive/1VPv0lBGZVXZnU2-eUxS2nu08Tto_vind?usp=sharing
필사 노트 링크
🟨 도메인
: 음악 , 엔터테인먼트
🟨 데이터셋
: Spotify dataset 으로 특정 노래에 대한 음악적 특성들이 feature 로 존재한다. 여기서 우리는 회귀분석을 통해 song_popularity , 즉 노래의 인기도를 예측한다.
: 노래 샘플을 분해하여 여러 parameter 들을 기록하였다.
: 크고 복잡한 데이터이고 피처별로 다중 공선성이 강한 경우가 존재한다.
🟨 캐글 노트북 키워드
1. df copy
2. 변수 선택 : sklearn.feature selection method
3. 다중 공선성 multicollinearity
- 해결방법 : VIF, RFE , PCA
4. Regression models
- MLR, Ridge, Lasso, Elastic-Net, Polynomial
- 결과 해석 : R-sqaured, P > |t|, Durbin-Watson 등
- Polynomial regression 은 과적합이 발생
5. model evaluation : R2, RMSE
728x90
'2️⃣ Study > ▢ 필사 | 프로젝트' 카테고리의 다른 글
[kaggle] 2021년 여름방학 필사 스터디 파일 (0) | 2022.04.06 |
---|---|
[kaggle] 필사정리 Note_5 (0) | 2022.04.02 |
[kaggle] 필사 정리 Note_4 (0) | 2022.03.11 |
[kaggle] 필사정리 Note_3 (0) | 2022.03.11 |
[kaggle] 필사정리 Note_2 (0) | 2022.02.18 |
댓글