본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

cut_number()2

전국 사설 학원수 범주형 단계 구분도 in R - 연속형 변수를 범주형 변수로 변환 범주형 단계 구분도(Choropleth map) 전국 사설 학원 수 단계 구분도 그리기 in R에서 그린 전국 사설학원수에 대한 단계 구분도는 단계를 구분하는 색이 연속형 변수로 색조의 변화와 변수가 매핑되어 있다. 하지만 그 지도에서도 보이듯이 서울, 경기 지역의 학원수가 타 시도에 비해 매우 크기 때문에 그 변화가 잘 눈에 띄지지 않는다. 따라서 이런 경우에는 연속형 변수를 범주형으로 바꾸어서 그 변수들의 단계가 명확히 보이도록 그리는게 좋을 것이다. 그렇다면 먼저 연속형 변수인 사설학원수를 범주형으로 바꾸어야 한다. 연속형 변수를 범주형 변수로 바꾸는 방법에는 여러가지가 있지만 여기서는 cut(), discretize(), cut_*(), frq()를 사용하는 네 가지 방법을 사용하겠다. cut().. 2022. 7. 16.
데이터 개수 세기(도수분포)와 구간 나누기 데이터 개수(빈도) 세기 R에서 많이 사용하는 tidy한 데이터는 데이터의 특성을 열로 지정하고 관측 데이터는 행으로 저장하는 데이터를 말한다.(https://2stndard.tistory.com/16 참조) 따라서 조건에 적합한 행을 필터링하고 행의 갯수를 세면 조건에 맞는 관측치의 수를 알아낼 수 있다. 조건에 적합한 열을 필터링한 후 결과를 알아내기 위해서는 행의 수를 세야한다. 이 포스트에서는 행의 수를 세어 빈도를 산출하는 방법을 알아 본다. 본 포스트에서 사용하는 샘플 데이터는 교육통계 서비스 홈페이지(https://kess.kedi.re.kr)에서 제공하는 고등교육기관 시도별 기관 신입생 충원률 데이터을 사용하였다. 이 데이터를 로딩하는 코드는 다음과 같다. library(readxl) li.. 2021. 7. 1.