본문 바로가기
2️⃣ Study/▢ 필사 | 프로젝트

[kaggle] 필사정리 Note_2

by isdawell 2022. 2. 18.
728x90

필사 노트 링크 : https://colab.research.google.com/drive/11ToiXDGfh66-ES60OP3EXgJC4WsiFMBJ?usp=sharing 

 

[kaggle] Netflix Visualizations, recommendation, EDA.ipynb

Colaboratory notebook

colab.research.google.com

 

🟨 도메인

: OTT (넷플릭스) - Contents / Entertainment 

 

🟨 데이터셋 및 분석에 사용된 칼럼 

1. Netflix_titles.csv

  - title, director, Cast, Country, Date_added(넷플릭스에 추가된 날짜), release_year, Rating(시청등급), Duration(러닝타임 혹은 시즌수), listed_in(장르), Description(줄거리) 

2. IMDb ratings.csv

 - title, release year, Genre 

3. IMDb movies.csv

  - weighted_average_vote(평점) 

4. books.csv

  - original_title (책 제목) 

 

🟨 캐글 노트북 키워드 

  • 다양한 dataset merge 를 통해 Insight 도출 
    • 특히 도서 원작을 기반으로 한 작품 비율 파악하는 부분이 인상깊었음 
  1. 변수 별 다양한 시각화 방식 : 특히 plotly 를 활용한 부분
    • TV show 콘텐츠와 영화 콘텐츠를 비교분석
    • TV show 의 특징 분석
    • 영화 작품의 특징 분석
    • Sunburst, treemap 등 처음 접하는 plotly 함수를 알게 됨 
  2. 콘텐츠 기반 필터링 방식의 추천 시스템 구현
    • TF-IDF, Countervectorizer : 텍스트 벡터화 방식
    • Cosine similarity : 행렬 유사도 계산 -- 추천 시스템 

 

 

728x90

댓글