본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬
ggplot2/ggplot2의 기초

ggplot2의 기하요소 - geom_density()

by 아참형인간 2023. 2. 23.
geom_density.knit

사용데이터 : https://2stndard.tistory.com/161

기하 요소

일변수(One Variable) 데이터 시각화

연속형 수치 데이터

geom_density()

geom_density()도 연속형 일변수 수치 데이터를 표현하는데 사용되는 기하 요소 함수이다. 일변수 수치 데이터의 분포를 확률분포함수로 계산하여 표현한다. 따라서 X값에 따라 계산된 연속 확률 분포값은 확률이기 때문에 1보다 작은 값들이고, 이 값들이 연결되어 표현된다. geom_density()는 연속 확률 분포를 산출하고 시각화한다. 따라서 앞선 두 함수와는 달리 통계 요소의 기본값이 ’density’로 설정된다.

geom_density(mapping = NULL, data = NULL, stat = "density", position = "identity", ..., na.rm = FALSE, orientation = NA, show.legend = NA, inherit.aes = TRUE, outline.type = "upper")
- mapping : aes()를 사용하여 매핑할 미적 요소, 생략되면 ggplot()에 정의된 미적매핑 사용
- data : 시각화를 위해 사용될 데이터, 생략되면 ggplot()에 정의된 데이터 사용
- stat : 시각화에 적용될 통계요소, 기본값은 'density'
- position : 시각화에 적용될 위치요소, 기본값은 'identity'
- ... : 미적 요소의 설정
- na.rm : NA 값을 생략할 것인지를 설정하는 논리값
- orientation : 레이어의 원점 설정
- show.legend : 범례를 사용할 것인지를 설정하는 논리값
- inherit.aes : ggplot()에서 설정한 매핑값을 상속받을지 결정하는 논리값
- outline.type: 영역을 표시하는 경우 영역 경계 값의 선 타입

geom_density() 에서 사용할 수 있는 미적 요소는 위치(x, y), alpha, color, fill, linetype, size 등이다.

##  df_취업통계를 ggplot 객체로 생성하고 p_density에 저장
p_density <- df_취업통계 |>
  ggplot()

기본 geom_density를 그리는 코드는 다음과 같다.

## p_density객체에 x축을 '취업률_계'열로 매핑한 geom_density 레이어를 생성
p_density + 
  geom_density(aes(x = 취업률_계))

미적 요소가 설정된 geom_density를 그리는 코드는 다음과 같다.

## p_density객체에 x축을 '취업률_계'열로 매핑, 미적 요소 설정한 geom_density 레이어를 생성
p_density + 
  geom_density(aes(x = 취업률_계), color = 'blue', fill = 'skyblue', linetype = 2, size = 1, alpha = 0.5)

댓글