본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

지도 시각화6

정규 교원 1인당 학생수 - 지도에 표시하는 거품 차트(Bubble Chart) in R 지도상에 표현되는 거품 차트(bubble chart) 데이터를 분석하는 분석가나 분석가가 되기를 원하는 사람들에게 필독서인 ‘팩트풀니스’(한스 로슬링, 김영사, 2019)에서는 데이터를 분석하는데 가장 유용하게 사용하는 시각화로 거품형 차트를 제시하고 있다. 거품형 차트는 X, Y축에 매핑되는 데카르트 좌표계에 원의 크기로 데이터의 크기를 표현하는 차트로 최소 3개의 변수를 표현할 수 있는 방법이다. 이에 원의 색을 추가하면 4개의 변수를 하나의 시각화에 표현한다는 점에서 매우 활용성이 높은 시각화 방법이다. 사실 이 거품 차트는 산점도와 종이 한 장 차이라고 볼 수 있다. 산점도를 ggplot2 패키지로 만드려면 geom_point() 하나의 레이어로 간단히 만들 수 있는데 X, Y 매핑에 size를 .. 2022. 7. 29.
전국 사설 학원수 범주형 단계 구분도 in R - 연속형 변수를 범주형 변수로 변환 범주형 단계 구분도(Choropleth map) 전국 사설 학원 수 단계 구분도 그리기 in R에서 그린 전국 사설학원수에 대한 단계 구분도는 단계를 구분하는 색이 연속형 변수로 색조의 변화와 변수가 매핑되어 있다. 하지만 그 지도에서도 보이듯이 서울, 경기 지역의 학원수가 타 시도에 비해 매우 크기 때문에 그 변화가 잘 눈에 띄지지 않는다. 따라서 이런 경우에는 연속형 변수를 범주형으로 바꾸어서 그 변수들의 단계가 명확히 보이도록 그리는게 좋을 것이다. 그렇다면 먼저 연속형 변수인 사설학원수를 범주형으로 바꾸어야 한다. 연속형 변수를 범주형 변수로 바꾸는 방법에는 여러가지가 있지만 여기서는 cut(), discretize(), cut_*(), frq()를 사용하는 네 가지 방법을 사용하겠다. cut().. 2022. 7. 16.
전국 사설 학원 수 단계 구분도 그리기 in R 단계 구분도(Choropleth map) 앞서 그려본 지도는 결국 R에서 분석한 데이터를 지도위에 표기하기 위해 그리는 것이다. 그렇다면 지도 위에 데이터를 표현하는 방법은 무엇인가? 지도위에 데이터를 표현하는 방법중에 먼저 단계 구분도(choropleth map)을 그리는 방법을 알아본다. 단계 구분도는 주로 색을 사용하여 지도의 지역별 차이를 표현하는 방법이다. 지역을 표현하는 경계선의 내부를 표현하고자 하는 데이터의 크기에 따라 색의 단계 차이를 사용하여 표현하는 방법이다. 여기서는 우리나라의 17개 시도의 2021년 사설 학원수를 단계 구분도를 사용하여 표현해 보겠다. 데이터 import 우리나라의 17개 시도 지도를 그리기 위해서는 Shape 데이터와 geojson 데이터를 사용한 지도의 시각화.. 2022. 7. 11.
지도에 지역 이름 넣기 in R 사용데이터 : https://2stndard.tistory.com/107 sf을 사용한 지도 꾸미기 지역이 포함된 데이터를 지도 위에 표현하는 것은 데이터 시각화에서 매우 중요한 시각화중에 하나이다. 하지만 데이터를 표현하는데 몇가지 제약사항이 있어 그 사용에 부담이 있는 것이 사실이다. 그 중에 하나가 지도의 위치에 해당하는 지역을 사용자가 인식하게 만드는 것이다. 우리나라는 17개의 시도로 구분되어 있는데 지도상의 위치를 보면 대략 해당 지역이 어딘지 대부분 알 수 있을 것이다. 하지만 260여개의 시군구 단위로 표현할 떄는 그 위치에 따른 지역을 즉각 알기가 어렵다. 그래서 지도위에 해당 지역 이름을 표시하면 좋겠지만 이를 어떻게 해야할지가 언듯 떠오르는가? 이를 쉽게 표기하는 방법에 대해 알아본다.. 2022. 7. 8.