본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

geom_histogram()2

geom_histogram의 bins와 binwidth geom_histogram()의 bins와 binwidth geom_histogram 은 도수 분포표를 그리는 기하 요소 함수이다. 도수 분포는 초등학교때 배우는 가장 기본적인 막대 그래프로 각각의 변수 변량에 따른 데이터의 개수를 표현하는 시각화 방법이다. 변수 변량에 따른 데이터의 개수를 표현하기 때문에 X축 데이터만 설정하면 데이터를 자동적으로 데이터를 분석하여 X축에 매핑된 변수의 변량별로 데이터 개수를 산출하고 이 개수를 시각화 한다. 도수 분포표에 사용하는 방법은 막대 그래프이다. 하지만 막대로 표현된 도수 분포표는 막대 그래프에 속하는 종류 중 하나이지만 그 성질은 막대 그래프와는 다소 차이가 있다. geom_histogram() 은 연속된 수치값을 X축에 매핑한다. 하지만 내부적으로 적절한.. 2022. 4. 21.
대학 입학생별 학과수 - ggplot2로 그리는 histogram in R histogram으로 데이터 설명하기 데이터의 도수분포를 시각화할 때 많이 사용되는 시각화가 histogram을 사용하는 것이다. histogram은 변수의 변화에 따라 데이터의 사례수가 몇 개인지를 표현하는데 사용된다. 유사한 방법으로 확률 분포를 표현할 수도 있고 최대값을 1로 두고 상대적 비율을 표현하는 방식으로도 사용이 가능하다. 그런데 사용하다보면 histogram을 설명하기가 어려운 경우가 있을 것이다. 이 경우가 어떤 경우인지 알아보고 이 경우 어떻게 해결할 지에 대해 살펴보자. Data Import 이번 포스트에서는 한국교육개발원 교육통계서비스 홈페이지에서 제공하는 대학의 전체 학과 데이터 셋학교/학과별 데이터셋 - 대학 - 학과별(상반기) - 2021을 활용하겠다. library(read.. 2021. 12. 2.