극한직업, 네이버 평점과 140자평의 분위기(R 웹크롤링 텍스트 분석)

2019. 2. 7. 21:56etc/영상읽기

요즘 핫한 영화 〈극한직업〉, 여러 루트를 통해서 '정말 웃기다'는 평을 많이 접했다. 유튜브에서 어떤 영화 소개 동영상을 볼 수도 있었다. 기사도 나왔고, 거기에 댓글도 상찬 일색은 아니더라도 다수는 '재밌다'는 평이었다.



오늘 극장에서 해당 영화를 보면서, 아니 그렇게 웃기지는 않았는데...라고 고개를 갸웃뚱거리게 되었다.


그러나 여전히 네이버 평점은 얼마나 아름다운가!



그렇다면 평점을 주고 적게 되는 140자 평의 분위기는?


현재(1월 31일 11시경) 확인한 걸로는 다음과 같이 나온다.



가장 첫머리에 '개봉일' 평이 담겨있다. 이건 뭐 평가가 원싸이드하다. 기본 값이 '호감도 순'으로 되어 있기 때문에 첫 화면에서 이런 결과를 보게 된다.


140자평을 모두 모아서 '낱말 구름'을 만들어 보면 어떤 결과가 나올까?



통계처리 프로그래밍 언어 R을 이용해서 해당 텍스트를 수집해서 'wordcloud'를 만들어 보면 다음과 같은 결과가 나온다.

(필터링 조건: 빈도수 100회 이상, '영화', '관람객' 단어 배제, 2음절 이상)



대체적으로 긍정적 느낌의 낱말이 많이 눈에 띈다. 간혹 '억지', '유치' 등의 표현이 보인다. 일부는 나처럼 '음, 별론데'하고 본 사람들이 있긴 하지만 더 많은 다수가 이 영화를 재밌게 보고 있다. 이런 '낱말 구름' wordcloud 만들기가 하나마나한 것 같기는 하지만 평점으로는 잘 보이지 않는 '반대 의견'도 잘 볼 수 있는 것 같다.