본문 바로가기
2️⃣ Study/▢ 필사 | 프로젝트

[kaggle] 필사정리 Note 1

by isdawell 2022. 2. 14.
728x90

https://colab.research.google.com/drive/1VPv0lBGZVXZnU2-eUxS2nu08Tto_vind?usp=sharing  

필사 노트 링크 

 

[kaggle/ML] Song Popularity Predict .ipynb

Colaboratory notebook

colab.research.google.com

 

🟨 도메인

 

: 음악 , 엔터테인먼트 

 

🟨 데이터셋 

 

: Spotify dataset 으로 특정 노래에 대한 음악적 특성들이 feature 로 존재한다. 여기서 우리는 회귀분석을 통해 song_popularity , 즉 노래의 인기도를 예측한다. 

: 노래 샘플을 분해하여 여러 parameter 들을 기록하였다.

: 크고 복잡한 데이터이고 피처별로 다중 공선성이 강한 경우가 존재한다.  

 

 

 

🟨 캐글 노트북 키워드 

 

 1. df copy 

 

 2. 변수 선택 : sklearn.feature selection method 

 

 3. 다중 공선성 multicollinearity 

   - 해결방법 :  VIF, RFE , PCA

 

 4. Regression models 

   - MLR, Ridge, Lasso, Elastic-Net, Polynomial 

   - 결과 해석 : R-sqaured, P > |t|, Durbin-Watson 등 

   - Polynomial regression 은 과적합이 발생 

 

 5. model evaluation : R2, RMSE

 

 

 

  

728x90

댓글