728x90
필사 노트 링크 : https://colab.research.google.com/drive/11ToiXDGfh66-ES60OP3EXgJC4WsiFMBJ?usp=sharing
🟨 도메인
: OTT (넷플릭스) - Contents / Entertainment
🟨 데이터셋 및 분석에 사용된 칼럼
1. Netflix_titles.csv
- title, director, Cast, Country, Date_added(넷플릭스에 추가된 날짜), release_year, Rating(시청등급), Duration(러닝타임 혹은 시즌수), listed_in(장르), Description(줄거리)
2. IMDb ratings.csv
- title, release year, Genre
3. IMDb movies.csv
- weighted_average_vote(평점)
4. books.csv
- original_title (책 제목)
🟨 캐글 노트북 키워드
- 다양한 dataset merge 를 통해 Insight 도출
- 특히 도서 원작을 기반으로 한 작품 비율 파악하는 부분이 인상깊었음
- 변수 별 다양한 시각화 방식 : 특히 plotly 를 활용한 부분
- TV show 콘텐츠와 영화 콘텐츠를 비교분석
- TV show 의 특징 분석
- 영화 작품의 특징 분석
- Sunburst, treemap 등 처음 접하는 plotly 함수를 알게 됨
- 콘텐츠 기반 필터링 방식의 추천 시스템 구현
- TF-IDF, Countervectorizer : 텍스트 벡터화 방식
- Cosine similarity : 행렬 유사도 계산 -- 추천 시스템
728x90
'2️⃣ Study > ▢ 필사 | 프로젝트' 카테고리의 다른 글
[kaggle] 2021년 여름방학 필사 스터디 파일 (0) | 2022.04.06 |
---|---|
[kaggle] 필사정리 Note_5 (0) | 2022.04.02 |
[kaggle] 필사 정리 Note_4 (0) | 2022.03.11 |
[kaggle] 필사정리 Note_3 (0) | 2022.03.11 |
[kaggle] 필사정리 Note 1 (0) | 2022.02.14 |
댓글