본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

분류 전체보기178

14.7. 적절한 색상 사용 적절한 색상 사용 색상을 적절히 사용하면 차트의 특정 부분에 청중의 주의를 끌 수 있다. 밝은 색상이나 타 색상과의 대비가 큰 색상은 청중의 시선을 빠르게 집중시킬 수 있어 시각화가 전달하고자 하는 메시지에 효과적으로 사용된다. 하지만 무지개 색상과 같이 과도하게 많은 색상의 팔레트를 사용하는 것은 피해야 할 것이다. 각각의 색상으로 보면 화려하고 예뻐 보일지 모르지만 시각화의 목적을 전달하는데 효과적인지를 먼저 고려해야 한다. 데이터 시각화를 위한 패키지나 툴에서는 색상의 사용을 위해 각각의 패키지에서 팔레트를 제공한다. R과 python에서는 Brewer 팔레트를 많이 사용하는데, 지도 제작자인 Cindy Brewer가 개발한 팔레트로, 표현하고자 하는 데이터의 목적에 따라 다음과 같이 세 가지로 구.. 2023. 6. 27.
ggplot2의 기하요소 - geom_point() 사용데이터 : https://2stndard.tistory.com/161 이변수(Two Variable) 데이터 시각화 앞서 언급한 바와 같이 ggplot 객체는 보통 X, Y 두 개의 축으로 표현되는 2차원 시각화를 기본으로 한다. 따라서 ggplot 객체는 X축과 Y축에 매핑되는 변수 두 개를 가 필요하다. 변수 두 개를 사용한 데이터 시각화도 일변수 데이터 시각화와 마찬가지로 시각화해야할 데이터가 연속형 수치 데이터인지 이산형 데이터인지에 따라 사용하는 기하 요소의 종류가 달라진다. 2개의 연속형 수치 데이터 X축과 Y축에 매핑되어 시각화해야 하는 두 개의 변수가 모두 연속형 수치 변수인 경우에는 X축과 Y축에 따라 데이터를 좌표계 상에 표현하는 시각화가 일반적이다. 보통 데이터의 분포를 확인해야 .. 2023. 2. 26.
ggplot2의 기하요소 - geom_bar() 사용데이터 : https://2stndard.tistory.com/161 기하 요소 일변수(One Variable) 데이터 시각화 이산형(Discrete) 데이터 : geom_bar() 앞에서 설명한 geom_histogram(), geom_freqpoly(), geom_density()는 연속된 수치형 데이터에 대한 일변량 시각화 기하 요소 함수이다. 그렇다면 팩터와 같이 구분되고 분리되는 일변량 이산형 데이터의 시각화는 어떻게 하는가? 이산형 일변량 데이터를 위한 기하 요소 함수는 geom_bar()가 유일하다. 사실 geom_bar()는 뒤에서 설명될 geom_col()과 거의 유사한 결과를 내는 막대 그래프 시각화이다. 다만 geom_bar() 는 연속형 일변량 데이터 시각화에 사용되기 때문에 하.. 2023. 2. 25.
ggplot2의 기하요소 - geom_density() 사용데이터 : https://2stndard.tistory.com/161 기하 요소 일변수(One Variable) 데이터 시각화 연속형 수치 데이터 geom_density() geom_density()도 연속형 일변수 수치 데이터를 표현하는데 사용되는 기하 요소 함수이다. 일변수 수치 데이터의 분포를 확률분포함수로 계산하여 표현한다. 따라서 X값에 따라 계산된 연속 확률 분포값은 확률이기 때문에 1보다 작은 값들이고, 이 값들이 연결되어 표현된다. geom_density()는 연속 확률 분포를 산출하고 시각화한다. 따라서 앞선 두 함수와는 달리 통계 요소의 기본값이 ’density’로 설정된다. geom_density(mapping = NULL, data = NULL, stat = "density", .. 2023. 2. 23.