사용데이터 : https://2stndard.tistory.com/161
기하 요소
일변수(One Variable) 데이터 시각화
이산형(Discrete) 데이터 : geom_bar()
앞에서 설명한 geom_histogram()
,
geom_freqpoly()
, geom_density()
는 연속된
수치형 데이터에 대한 일변량 시각화 기하 요소 함수이다. 그렇다면 팩터와
같이 구분되고 분리되는 일변량 이산형 데이터의 시각화는 어떻게 하는가?
이산형 일변량 데이터를 위한 기하 요소 함수는 geom_bar()
가
유일하다. 사실 geom_bar()
는 뒤에서 설명될
geom_col()
과 거의 유사한 결과를 내는 막대 그래프
시각화이다. 다만 geom_bar()
는 연속형 일변량 데이터
시각화에 사용되기 때문에 하나의 데이터만 제공되면 설정된 통계 요소를
사용하여 나머지 하나의 데이터를 산출하고 시각화한다.
geom_bar()
의 기본 통계 요소인 count
를 사용하면
geom_histogram()
과 유사하게 나타나지만 X축으로 매핑되는
데이터가 이산형 데이터라면 geom_histogram()
과는 달라지고,
X축에 매핑되는 데이터가 꼭 수치 데이터가 아닌 팩터나 문자열도
가능하다.
geom_bar(mapping = NULL, data = NULL, stat = "count", position = "stack", ..., width = NULL, na.rm = FALSE, orientation = NA, show.legend = NA, inherit.aes = TRUE)
- mapping : aes()를 사용하여 매핑할 미적 요소, 생략되면 ggplot()에 정의된 미적매핑 사용
- data : 시각화를 위해 사용될 데이터, 생략되면 ggplot()에 정의된 데이터 사용
- stat : 시각화에 적용될 통계요소, 기본값은 'count'
- position : 시각화에 적용될 위치요소, 기본값은 'stack'
- ... : 미적 요소의 설정
- width : 막대의 너비 설정
- na.rm : NA 값을 생략할 것인지를 설정하는 논리값
- orientation : 레이어의 원점 설정
- show.legend : 범례를 사용할 것인지를 설정하는 논리값
- inherit.aes : ggplot()에서 설정한 매핑값을 상속받을지 결정하는 논리값
geom_bar()
에서 사용이 가능한 미적 요소는 x, alpha,
color, fill, linetype, size, weight이다.
## df_취업통계를 ggplot 객체로 생성하고 p_bar에 저장
p_bar <- df_취업통계 |>
ggplot()
X축에 이산형 변수를 매핑한 geom_bar는 다음과 같다.
## p_bar 객체에 x축을 대계열로 매핑한 geom_bar 레이어 생성
p_bar +
geom_bar(aes(x = 대계열))
미적 요소가 설정된 geom_bar는 다음과 같다.
## p_bar 객체에 x축을 대계열로 매핑하고 미적 요소를 설정한 geom_bar 레이어 생성
p_bar +
geom_bar(aes(x = 대계열), color = 'blue', fill = 'skyblue', linetype = 2, size = 1, alpha = 0.5)
'ggplot2 > ggplot2의 기초' 카테고리의 다른 글
ggplot2의 기하요소 - geom_point() (0) | 2023.02.26 |
---|---|
ggplot2의 기하요소 - geom_density() (0) | 2023.02.23 |
ggplot2의 기하요소 - geom_freeploy() (0) | 2023.02.18 |
ggplot2의 기하요소 - geom_histogram() (0) | 2023.02.17 |
ggplot2의 미적요소 - label & group (0) | 2023.02.15 |
댓글