본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

ggplot244

ggplot2의 기하요소 - geom_point() 사용데이터 : https://2stndard.tistory.com/161 이변수(Two Variable) 데이터 시각화 앞서 언급한 바와 같이 ggplot 객체는 보통 X, Y 두 개의 축으로 표현되는 2차원 시각화를 기본으로 한다. 따라서 ggplot 객체는 X축과 Y축에 매핑되는 변수 두 개를 가 필요하다. 변수 두 개를 사용한 데이터 시각화도 일변수 데이터 시각화와 마찬가지로 시각화해야할 데이터가 연속형 수치 데이터인지 이산형 데이터인지에 따라 사용하는 기하 요소의 종류가 달라진다. 2개의 연속형 수치 데이터 X축과 Y축에 매핑되어 시각화해야 하는 두 개의 변수가 모두 연속형 수치 변수인 경우에는 X축과 Y축에 따라 데이터를 좌표계 상에 표현하는 시각화가 일반적이다. 보통 데이터의 분포를 확인해야 .. 2023. 2. 26.
ggplot2의 기하요소 - geom_bar() 사용데이터 : https://2stndard.tistory.com/161 기하 요소 일변수(One Variable) 데이터 시각화 이산형(Discrete) 데이터 : geom_bar() 앞에서 설명한 geom_histogram(), geom_freqpoly(), geom_density()는 연속된 수치형 데이터에 대한 일변량 시각화 기하 요소 함수이다. 그렇다면 팩터와 같이 구분되고 분리되는 일변량 이산형 데이터의 시각화는 어떻게 하는가? 이산형 일변량 데이터를 위한 기하 요소 함수는 geom_bar()가 유일하다. 사실 geom_bar()는 뒤에서 설명될 geom_col()과 거의 유사한 결과를 내는 막대 그래프 시각화이다. 다만 geom_bar() 는 연속형 일변량 데이터 시각화에 사용되기 때문에 하.. 2023. 2. 25.
ggplot2의 기하요소 - geom_density() 사용데이터 : https://2stndard.tistory.com/161 기하 요소 일변수(One Variable) 데이터 시각화 연속형 수치 데이터 geom_density() geom_density()도 연속형 일변수 수치 데이터를 표현하는데 사용되는 기하 요소 함수이다. 일변수 수치 데이터의 분포를 확률분포함수로 계산하여 표현한다. 따라서 X값에 따라 계산된 연속 확률 분포값은 확률이기 때문에 1보다 작은 값들이고, 이 값들이 연결되어 표현된다. geom_density()는 연속 확률 분포를 산출하고 시각화한다. 따라서 앞선 두 함수와는 달리 통계 요소의 기본값이 ’density’로 설정된다. geom_density(mapping = NULL, data = NULL, stat = "density", .. 2023. 2. 23.
ggplot2의 기하요소 - geom_freeploy() 사용데이터 : https://2stndard.tistory.com/161 기하 요소 일변수(One Variable) 데이터 시각화 연속형 수치 데이터 geom_freqpoly() geom_freqpoly() 는 geom_histogram()과 유사하게 연속형 일변수 수치 데이터의 빈도를 표현하는데 사용되는 기하 요소 함수이다. geom_histogram()은 관측치의 빈도를 막대로 시각화하지만 geom_freqpoly()는 데이터 값들을 연결한 다각형을 사용하여 데이터를 표현한다. geom_freqpoly()도 geom_histogram()과 같이 binning을 기본적으로 사용하기 때문에 통계 요소 ’bin’이 기본적으로 적용된다. 만약 다각형을 조금 부드럽게(smoothing) 하려면 통계 요소를 ’.. 2023. 2. 18.