본문 바로가기
3️⃣ Study at Univ/○ 논문읽기

앱 리뷰 분석에 관한 논문 정리 ③

by isdawell 2022. 6. 16.
728x90

👀 논문 읽기를 통해 해결하고 싶은 부분 

 

1. 표본이 작은 데이터에도 토픽모델링과 감성분석을 적용해도 괜찮을까

2. 어플 리뷰 텍스트 데이터는 어떠한 방법론으로 접근하여 어떠한 인사이트를 얻어낼까 

3. 앱스토어 리뷰 + 구글 플레이 스토어 리뷰 분석 로직 설계하기 

 

 


 

 

 

1️⃣  모바일 앱 서비스 업데이트가 사용자 만족도 및 유지율에 미치는 영향 (2021)


✨ 연구 목적 

 

◾ 고객 만족도 향상과 유저이탈 방지를 위한 애플리케이션 개선 방향 제시 

 

 

✨ 핵심 정리 

 

◾ 모바일 앱 리뷰 데이터 수집 + 텍스트 마이닝 기법 → 이용자 만족도에 영향을 주는 핵심 키워드 도출 

◾ 업데이트 기간 별 유저 수 분석을 통해 업데이트가 유저 이탈에 미치는 영향 분석 

 

 

 

①  서론 

 

✔ 연구의 필요성 : 온라인 리뷰의 대부분은 제품 및 서비스에 대한 리뷰 분석이 주를 이루고 있으며 앱 소프트웨어 자체에 대한 업그레이드로 인해 발생한는 불만과 만족에 대한 시기적 평가 변화에 대한 연구는 미미하다. 

 

✔ 연구 개요 : 국내 클라우드 서비스인 네이버 MyBox 앱을 선정하여 유저 유지율을 높일 수 있는 모바일 업데이트 방향을 제안한다. 주요 업데이트 내용을 분류하고 각 업데이트 시기에 발생한 리뷰 내용을 분석하여 업데이트가 모바일 앱 사용자들에게 미치는 영향을 밝힌다. 

 

 

②  연구방법 

 

✔ 데이터 수집 : 구글 플레이스토어 클라우드 애플리케이션 1위인 네이버 MyBox 사용자 리뷰 데이터

 

✔ 데이터 분석 : 앱 업데이트 기간에 따라 분석하여 서비스 만족에 영향을 미치는 주요 요인을 워드클라우드와 토픽모델링 및 감성분석으로 도출하고 서비스 개선이 필요한 요소를 확인

 

 

③ 연구결과 

 

출처 : 논문 이미지 

 

✔ 부정 리뷰 데이터의 업데이트 기간 별 부정 키워드 빈도분석 : 업데이트 기간 별 분석 결과, 사진/파일/업데이트 관련 부정 키워드가 높은 것을 확인 

 

✔ 부정 키워드 빈도 변화율/변화 추이 분석 : 업데이트 초기 부정 리뷰 건수가 많이 발생하고 시간에 따라 부정 리뷰 건수가 감소

 

 

④ 연구의의

 

리뷰 분석을 통해 향상된 기능을 포함하고 사용자 요구를 빠르게 충족시켜 유저 이탈 방지와 앱 유저 유지율을 높일 수 있다. 

 

 

 

 

 

 

2️⃣ 토픽 모델링을 활용한 모바일 증강현실 앱 사용자 리뷰 분석 (2019)


✨ 연구 목적 

 

◾ 게임, 뷰티, 교육 분야별 모바일 증강현실 앱 리뷰 데이터를 긍정/부정으로 나누어 분석하여 사용자 만족/불만족 요소 도출 

 

 

✨ 핵심 정리 

 

◾ 게임/뷰티/교육 분야 모바일 증강현실 앱 리뷰를 토픽 모델링 기법을 활용해 분석을 시도하여 긍정/부정으로 나누어 만족/불만족 요인을 알아본다. 

 

 

 

①  서론 

 

✔ 연구의 필요성 : 모바일 증강현실 앱의 어떠한 요소들이 사용자에게 만족/불만족 요소를 주는지에 대한 연구는 거의 없는 편이므로 뷰티, 게임, 교육 분야별로 어떤 요소가 사용자에게 만족감을 주는지에 대한 연구가 필요

 

 

② 선행 연구/이론배경

 

✔  모바일 증강현실 앱 연구 동향 

 

✔  사용자 리뷰 분석과 토픽 모델링 기법 

 

  • 모바일 앱 사용자 리뷰에는 앱 기능의 불만사항, 새로운 기능에 대한 요청 등 중요 정보가 포함되어 있다. 
  • 평점이나 리뷰 데이터가 풍부하므로 설문이나 실험보다 표본을 모집하기 쉽다는 이점이 있고, 사용자 리뷰의 양이 증가할수록 지식 이질성이 높아져 더 많은 요구 사항을 수용할 수 있다. 
  • 이러한 장점을 지닌 온라인 리뷰 분석을 위해 다수의 연구들이 토픽 모델링 기법을 활용하고 있다. 
  • 토픽모델링 : 통계적 추론을 이용한 방법으로 문장 속에 숨겨진 주제를 찾기 위해 고안된 방법. LDA 알고리즘을 많이 사용한다. LDA 알고리즘은 문서에서 추출된 단어를 통해 숨겨진 단어들을 추론해 주제를 발견한다. 
  • 실험데이터 속 단어의 출현 비율에 따라 토픽이 정해진다. 

 

 

③ 연구방법 

 

출처 : 논문 이미지

 

 

✔ 데이터 수집 : 구글플레이 앱 다운로드 순위 상위 5위 + 리뷰 300건 이상 기준을 충족하는 증강현실 앱 리뷰 텍스트 데이터 

 

✔ 긍/부정 기준 : 1~2점은 부정, 3~5점은 긍정으로 리뷰 데이터를 나누어 분석 

 

출처 : 논문 표

 

 

✔ 텍스트 전처리

 

  • 띄어쓰기와 맞춤법 오류가 많은 특성을 지닌 리뷰 문장 → 자동/수동 띄어쓰기를 병행 처리하여 형태소 분석 , 문맥에 맞지 않은 명사들은 전체적으로 표준화 작업 수행 
  • 2자 이상의 명사 추출 → 빈도분석 
  • 출현 수가 높은 키워드 대상으로 사용자 사전에 추가
  • 새로운 신조어 및 증강현실 앱 특성 단어 (움짤기능, 덴더링 방식 등) 사용자 사전에 추가 

 

✔ 텍스트 분석 : 띄어쓰기와 맞춤법 오류가 많은 특성을 지닌 리뷰 문장 → 자동/수동 띄어쓰기를 병행 처리하여 형태소 분석 , 문맥에 맞지 않은 명사들은 전체적으로 표준화 작업 수행 

 

 

✔ 토픽 모델링 

 

  • LDA 알고리즘 이용 
  • 파이썬 자연어 처리 패키지 konlpy , 토픽모델링 LDA 적용을 위한 패키지 gensim, doc2bow 로 텍스트 벡터화 
  • 생성된 LDA 토픽 모델의 키워드를 확인하여 필터링 되지 않은 불용어들과 다수의 토픽에 중복으로 출현하는 키워드를 불용어 사전에 추가하여 필터링하고 어휘 사전을 재구축 
  • 키워드에 대해 분야별 전체 문서에서 키워드가 차지하는 비중을 비율로 나타내 토픽의 주제와 연관성이 높은 단어를 선정하여, 높은 값의 키워드를 바탕으로 토픽의 주제를 정의 

 

출처 : 논문 표

 

✔ 토픽 모델링 시각화 

 

: LDAvis 라이브러리 를 사용하여 토픽의 크기에 따라 전체 문서에서 토픽의 비중을 확인할 수 있고 토픽의 위치에 따라 도출된 토픽들의 독립성 여부를 확인할 수 있다. 토픽들 간의 거리는 의미상 유사정도의 거리이다.  

 

출처 : 논문 그림

 

 

 

④ 연구의의

 

✔ 마케팅 전략 + 장기적인 콘텐츠 개발 전략에 활용 : 긍정 평가에서 제시된 키워드를 기준으로 관련 전략을 수립 

 

✔ 모바일 증강 현실 앱 기능 보완: 부정 평가에서 제시된 키워드를 기준으로 관련 전략을 수립 

 

 

 

 

 

 

728x90

댓글