네이버 데이터랩
텍스트로 되어있는 데이터를 다루는 여러 가지 방법이 있습니다. 하지만 네이버 데이터랩이라고 하는 데를 한 번 방문해보셨나요? 네이버 데이터랩은 네이버가 검색 엔진을 제공하는 기관입니다. 키워드를 통계를 내서 정보를 제공해주는 사이트입니다.
그러면 키워드를 가지고서 분석을 하면 뭐가 나올 수 있을까요? 기본적으로는 실시간 검색어가 나올 수 있습니다. 현재 지금 사람들이 무엇에 관심을 갖고 있는가, 어떤 검색어가 뜨고 있는가, 이런 것들도 알 수 있습니다. 이제 시간대별로 누적해서 보면 어떤 주제가, 어떤 키워드가 언제 관심이 있었는지 볼 수 있습니다.
활용법
여러분들이 알다시피 컴퓨터에서 뭔가 일을 하면 여러분이 어떤 위치, 어느 지점에서 컴퓨터를 사용하고 있는지가 대략 수집이 됩니다. 그러면 우리나라에서는 뭐가 관심이 있는지 알 수 있습니다. 또 다른 나라에서는 뭐가 관심 있는지 알 수 있습니다. 따라서 지역별로도 검색 키워드를 가지고 작업을 할 수 있습니다.
그래서 사이트에 들어가면 이런 화면이 나옵니다. 현재 실시간 검색어들이 나옵니다. 그 다음에 관심이 있는 검색어를 한 번 넣어보겠습니다. 내가 분석해보고 싶은 기간도 넣고, 여러 가지 대상도 골라봅니다. 몇 가지 옵션을 넣은 다음에 확인해봅니다. 그 결과, 시간대별로 어떤 검색어가 어떤 양상을 보이는지 알 수 있습니다.
분석법
지금 검색해 본 것은 가을이라는 단어하고 또 단풍을 가지고 했습니다. 이 두 가지 단어를 가지고 사람들이 검색한 빈도를 나타냈습니다. 가을이라는 단어가 미리 빈도수가 오릅니다. 그 다음 단풍은 늦게 지면서 단풍에 대한 관심이 생겨난 것을 확인할 수 있습니다. 그리고 관심도를 통해 실제 단풍이 본격적으로 드는 시기라는 것을 알 수 있습니다. 지방마다 단풍이 드는 시기가 다르므로, 단풍이 먼저 든 쪽에서 빈도수가 더 높게 올라갔을 것입니다.
추천
사람들의 어떤 생각의 흐름, 관심의 흐름들을 분석해볼 수 있습니다. 그런 부분들을 활용하면 좋을 것입니다. 지역별로도 분석이 가능합니다. 또 특별히 카드 사용을 어디에서 어떤 음식점에서 이용했는 지 분석이 가능합니다. 다양한 데이터들을 활용해 분석하는 능력을 길러봅시다.
'SW > R' 카테고리의 다른 글
R : 데이터 프레임(data frame) 개념 및 예제 (0) | 2019.02.03 |
---|---|
R : 매트릭스(matrix) 개념 및 예제 (0) | 2019.02.02 |
R : 워드클라우드-wordcloud ( 개념 및 예제 ) (0) | 2019.02.01 |
R : help 기능 개념 및 사용법 (0) | 2019.01.30 |
R : 벡터 연산, 함수, 논리값 개념 및 예제 (0) | 2019.01.30 |