본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬
ggplot2/ggplot2의 기초

ggplot2의 기하요소 - geom_bar()

by 아참형인간 2023. 2. 25.
geom_bar.knit

사용데이터 : https://2stndard.tistory.com/161

기하 요소

일변수(One Variable) 데이터 시각화

이산형(Discrete) 데이터 : geom_bar()

앞에서 설명한 geom_histogram(), geom_freqpoly(), geom_density()는 연속된 수치형 데이터에 대한 일변량 시각화 기하 요소 함수이다. 그렇다면 팩터와 같이 구분되고 분리되는 일변량 이산형 데이터의 시각화는 어떻게 하는가? 이산형 일변량 데이터를 위한 기하 요소 함수는 geom_bar()가 유일하다. 사실 geom_bar()는 뒤에서 설명될 geom_col()과 거의 유사한 결과를 내는 막대 그래프 시각화이다. 다만 geom_bar() 는 연속형 일변량 데이터 시각화에 사용되기 때문에 하나의 데이터만 제공되면 설정된 통계 요소를 사용하여 나머지 하나의 데이터를 산출하고 시각화한다. geom_bar()의 기본 통계 요소인 count를 사용하면 geom_histogram() 과 유사하게 나타나지만 X축으로 매핑되는 데이터가 이산형 데이터라면 geom_histogram()과는 달라지고, X축에 매핑되는 데이터가 꼭 수치 데이터가 아닌 팩터나 문자열도 가능하다.

geom_bar(mapping = NULL, data = NULL, stat = "count", position = "stack", ..., width = NULL, na.rm = FALSE, orientation = NA, show.legend = NA, inherit.aes = TRUE)
- mapping : aes()를 사용하여 매핑할 미적 요소, 생략되면 ggplot()에 정의된 미적매핑 사용
- data : 시각화를 위해 사용될 데이터, 생략되면 ggplot()에 정의된 데이터 사용
- stat : 시각화에 적용될 통계요소, 기본값은 'count'
- position : 시각화에 적용될 위치요소, 기본값은 'stack'
- ... : 미적 요소의 설정
- width : 막대의 너비 설정
- na.rm : NA 값을 생략할 것인지를 설정하는 논리값
- orientation : 레이어의 원점 설정
- show.legend : 범례를 사용할 것인지를 설정하는 논리값
- inherit.aes : ggplot()에서 설정한 매핑값을 상속받을지 결정하는 논리값

geom_bar() 에서 사용이 가능한 미적 요소는 x, alpha, color, fill, linetype, size, weight이다.

##  df_취업통계를 ggplot 객체로 생성하고 p_bar에 저장
p_bar <- df_취업통계 |>
  ggplot()

X축에 이산형 변수를 매핑한 geom_bar는 다음과 같다.

## p_bar 객체에 x축을 대계열로 매핑한 geom_bar 레이어 생성 
p_bar +
  geom_bar(aes(x = 대계열))

미적 요소가 설정된 geom_bar는 다음과 같다.

## p_bar 객체에 x축을 대계열로 매핑하고 미적 요소를 설정한 geom_bar 레이어 생성
p_bar +
  geom_bar(aes(x = 대계열), color = 'blue', fill = 'skyblue', linetype = 2, size = 1, alpha = 0.5)

댓글