SW/R

R : 버블차트-bubble chart (개념 및 예제)

얇은생각 2019. 2. 23. 12:30
반응형

버블 차트(bubble chart)

예전부터 저의 포스팅을 보신 분이라면 산점도를 이해하고 계실 것입니다. 산점도는 두 가지의 변수간의 상관 관계를 나타냅니다. 버블 차트는 산점도의 한 종류입니다. 제3의 변수를 크기에 따라 버블로 표현하는 차트입니다. 아래 그림은 버블 차트의 한 종류입니다. 느낌이 오시나요?


버블차트1


버블차트를 이용하시려면 패키지를 설치하셔야 합니다. 패키지 명은 MASS입니다. 관련 패키지를 설치해주세요. 만약 패키지 설치하는 방법을 모르시는 분은 제가 이전에 포스팅한 패키지 설치 방법을 참조하시면 됩니다.


이번에 실습에 사용할 데이터셋은 UScrime입니다. 딱봐도 미국 범죄와 관련된 내용이겠죠? 인구수, 실업률, 범죄율 등의 데이터가 저장되어 있습니다.



실습 예제

 

library(MASS)
head(UScrime)
# M So Ed Po1 Po2 LF M.F Pop NW U1 U2 GDP Ineq Prob Time y
# 1 151 1 91 58 56 510 950 33 301 108 41 394 261 0.084602 26.2011 791
# 2 143 0 113 103 95 583 1012 13 102 96 36 557 194 0.029599 25.2999 1635
# 3 142 1 89 45 44 533 969 18 219 94 33 318 250 0.083401 24.3006 578
# 4 136 0 121 149 141 577 994 157 80 102 39 673 167 0.015801 29.9012 1969
# 5 141 0 121 109 101 591 985 18 30 91 20 578 174 0.041399 21.2998 1234
# 6 121 0 110 118 115 547 964 25 44 84 29 689 126 0.034201 20.9995 682
radius <- sqrt(UScrime$Pop) # 원을 나타낼 반지름 값 (값이 커서 제곱근으로 줄임)
symbols(UScrime$U2, UScrime$y, # x와 y의 좌표 위치
circles=radius, # 각각 써클의 반지름값
inches=0.4, # 각각 써클의 크기 조절값
fg="white", # 각각 써클의 테두리 색
bg="lightgray", # 각각 써클의 바탕색
lwd=1.5, # 각각 써클의 테두리선 두께
xlab="unemployment 35-39 males", # x 축 제목 설정
ylab="crime rate", # y 축 제목 설정
main="UScrime Data") # 제목 설정
text(UScrime$U2, UScrime$y, # 문자로 출력할 x,y 위치
1:nrow(UScrime), # 문자로 출력할 값
cex=0.8, # 글자 크기
col="brown") # 글자 색


버블차트2


위 예제와 출력된 차트를 확인해주세요. 한 줄 한 줄 해석해보시면 어렵지 않게 버블차트를 표현할 수 있습니다. 관련된 질문은 언제든지 환영입니다. 

반응형