사용데이터 : https://2stndard.tistory.com/161
label
label
은 텍스트로 표현되는 기하 요소를 말한다. 데이터의
위치에 대한 수치값을 표현한다거나 데이터의 분류에 대한 문자를 표현할 때
사용되는 미적 요소이다. label
은 주로 텍스트에 관련된 기하
요소인 geom_text()
나 geom_label()
에서 주로
사용된다.
## df_입학자의 지역이 '전체'인 데이터를 시각화하는데
df_입학자 |> filter(지역 == '전체') |>
ggplot(aes(x = 연도, y = 전문대학)) +
## 라벨을 '전문대학'으로 설정
geom_text(label = '전문대학')
## df_입학자의 지역이 '전체'인 데이터를 시각화하는데
df_입학자 |> filter(지역 == '전체') |>
ggplot(aes(x = 연도, y = 전문대학)) +
## 라벨을 '전문대학'열에 매핑
geom_text(aes(label = 전문대학))
group
기하 요소는 개별(individual) 기하 요소와 집합(collective) 기하 요소로
구분될 수 있다. 개별 기하 요소는 하나의 변수 열을 하나의 기하 요소로
매핑해서 표현한다. 따라서 매핑되는 변수 열은 실 데이터 열로 매핑하는
것이 일반적이다. 하지만 집합 기하 요소는 데이터를 구분하는 여러개의
변량을 가지는 열을 통해 색이나 크기로 구분되는 하나의 기하 요소로
표현한다.1 따라서 데이터를 구분하는 열은 데이터가
표현되는 열이 아닌 팩터나 데이터를 구분할 수 있는 구분자로 표현되는 열을
선택하는 것이 일반적이다. 집합 기하 요소는 통계적인 요약이 필요한 박스
플롯이나 한번에 여러개의 변량이 표현되야하는 도형(polygon), 선, 세그먼트
등에서 주로 사용된다. 이를 표현하기 위해 사용되는 미적 요소가
group
이다. 설명한대로 group
은 직접적으로
표현되는 미적 요소는 아니지만 미적 요소가 적용되는 구분을 매핑하기 위해
사용되는 미적 요소이다.
아래의 코드를 살펴보자.
## df_입학자_long 중 학교종류 별로 입학생을 선 그래프로 시각화하는데 정상적이지 않음
df_입학자_long |> filter(지역 == '전체') |>
ggplot(aes(x = 연도, y = 입학생수)) +
geom_line(aes(color = 학교종류))
위의 코드에서는 group
을 지정하지 않고
color
만 학교종류 열에 매핑하였다. 하지만 선으로 표현될
미적 요소는 학교종류별로 그룹화되어야 정상적으로 표현된다. 단지
color
만의 매핑으로는 정상적으로 표현되지 않는다. 따라서
geom_line()
으로 여러개의 선이 표현되는 선 그래프를
표현하기 해서는 반드시 group
으로 그룹화되는 열을 지정해야
정상적으로 표현된다.
## df_입학자_long에서
df_입학자_long |> filter(지역 == '전체') |>
## x축에 연도, y축에 입학생수를 매핑한 ggplot 객체 생성
ggplot(aes(x = 연도, y = 입학생수)) +
## color와 group을 학교종류로 매핑한 geom_line 레이어 생성
geom_line(aes(color = 학교종류, group = 학교종류))
그렇다면 단 하나의 선만이 있는 선 그래프는 어떻게 될까? 단 하나의
선이기 때문에 group
이 필요없을까? 답은 그렇지 않다. 다만
단 하나의 선이 있는 경우에는 group = 1
로 단일 그룹으로
매핑하여 사용한다.
## df_입학자_long 중 지역이 전체, 학교종류가 전문대학이 데이터를 필터링
df_입학자_long |> filter(지역 == '전체', 학교종류 == '전문대학') |>
ggplot(aes(x = 연도, y = 입학생수)) +
## group을 단일 그룹으로 매핑한 geom_line 레이어 생성
geom_line(aes(group = 1))
Hadley Wickham, ggplot2:Elegant Graphics for Data Analysis 2nd edition, P 46, Springer, 2016.↩︎
'ggplot2 > ggplot2의 기초' 카테고리의 다른 글
ggplot2의 기하요소 - geom_freeploy() (0) | 2023.02.18 |
---|---|
ggplot2의 기하요소 - geom_histogram() (0) | 2023.02.17 |
ggplot2의 미적요소 - size & shape (0) | 2023.02.12 |
ggplot2의 미적요소 - linetype (0) | 2023.02.12 |
ggplot2의 미적요소 - 위치(x, y, xend, yend)와 색상 (0) | 2023.02.10 |
댓글