본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

ggplot244

그래프에 수직선(geom_vline), 수평선(geom_hline), 대각선(geom_abline) 그리기 in R 사용데이터 : https://2stndard.tistory.com/68 geom_vline(), geom_hline() geom_vline()과 geom_hline()은 수직선과 수평선으로 표현되는 레이어를 생성한다. geom_segment()과 유사하지만 xintercept나 yintercept의 하나의 매개변수만으로 수직선, 수평선을 생성할 수 있는 특징이 있으며, 주로 기준선을 설정할 때 사용한다. geom_vline()과 geom_hline()에서 사용하는 미적 요소는 x, y, xend, yend, alpha, color, group, fill, linetype, size 등 이다. geom_vline(mapping = NULL, data = NULL, …, xintercept, na.rm = .. 2022. 6. 14.
박스 플롯(Boxplot)에 평균값 표현하기 in R 사용데이터 : https://2stndard.tistory.com/68 박스 플롯의 평균값 표현 박스플롯을 사용하다 보면 중간값을 평균값으로 오해하는 경우가 많다. 사실 우리는 중간값보다는 평균값에 더 익숙하다. 그렇기 때문에 박스플롯에 평균값을 표기하는 경우가 매우 흔히 발생한다. 박스 플롯에 평균을 표기하기 위해서는 기하 함수인 geom_*()에 통계 매개변수인 ‘stat’ 매개변수를 사용하는 방법과 통계 요소 함수인 stat_*()을 사용하는 방법 두 가지가 있다. 기하 요소 함수에 통계 매개변수 사용 ggplot2에서 제공하는 기하 요소 함수는 ’geom’으로 시작하는 함수로 데이터를 그리는 기하학적 표현 방법을 설정하는 함수를 말한다. 이 기하 요소 함수에는 어러 개의 매개변수가 사용되지만 많이.. 2022. 6. 12.
밀도 분포 플롯(geom_density) in R 사용데이터 : https://2stndard.tistory.com/68 밀도 분포 플롯 밀도 분포 플롯는 히스토그램의 또 다른 표현 방법이다. 히스토그램은 막대로 도수분포가 표현되기 때문에 다소 딱딱한 감이 있지만 밀도 분포 플롯은 전체 분포가 곡선으로 표현되어 히스토그램보다 부드럽게 표현된다는 장점이 있다. 또 도수분포에 대한 사례수를 직접적으로 사용하는 것이 아니고 확률 밀도 함수에 따른 확률값을 사용하기 때문에 0부터 1사이의 값으로 표현된다는 것이 히스토그램과의 차이다. ggplot2에서는 밀도 분포 그래프를 그리기 위해 geom_density()를 제공한다. geom_density()은 연속형 일변수 수치 데이터를 표현하는데 사용되는 기하 요소 함수이다. 일변수 수치 데이터의 분포를 확률분포함수.. 2022. 6. 12.
박스 플롯(Boxplot) in R 사용데이터 : https://2stndard.tistory.com/68 geom_boxplot() 박스 플롯은 데이터의 전반적 분포를 살펴볼 수 있는 매우 좋은 시각화 방법이다. 앞서 설명한 산점도는 X, Y축 모두 연속형 수치 데이터를 사용하지만 박스 플롯은 이산형 데이터로 분류되는 데이터의 전반적 분포를 시각화할 수 있다는 점에서 활용도가 크고 산점도(Scatter Plot)에서는 표현할 수 없었던 중간값, IQR 범위, 이상치 등의 추가적인 정보를 같이 볼 수 있다는 장점이 있다. R에서 박스 플롯 레이어를 생성하기 위해서는 geom_boxplot()을 사용한다. 박스 플롯으로 표현되는 상자의 중심은 중앙값이다. 중앙값은 가로선으로 표현되며 그 주위를 상자가 둘러싸고 있다. 상자의 상단과 하단은 관.. 2022. 6. 11.