본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

실전에서 바로 쓰는 시계열 데이터 처리와 분석 in R20

ggplot2로 다변량 선플롯 그리기 in R — R을 이용하여 플롯(그래프)를 그릴때 가장 마음대로 나오지 않는 플롯이 선 플롯이다. 보통 선 플롯은 일변량으로 그리는 경우보다는 다변량으로 그리는 경우가 많기 때문에 한 플롯내에서 여러 변량을 어떻게 다루는가가 매우 중요하다. 이 포스트에서는 ggplot2 패키지를 사용하여 다변량 선 플롯을 만드는 두가지 방법에 대해 살펴보고자 한다. ggplot2 패키지를 사용하여 다변량 선 플롯을 그리는 방법은 긴(long) 형태의 데이터프레임을 사용하는 방법과 geom_line()을 여러번 사용하여 그리는 두가지 방법이 있다. 먼저 실습에 사용할 데이터를 로딩하겠다. students.all % select(-지역규모) students$연도 % select(c('연도', '유치원',.. 2021. 6. 20.
구조적 베이지안 시계열 방법 구조적 베이지안 시계열 방법(Bayesian Structural Time Series)1 우리는 빅데이터, AI, 머신러닝을 사용하여 모델링을 하고 미래 예측값을 만들어 내는 과정은 대규모의 데이터를 활용해 다양한 알고리즘을 통한 관계를 도출하는 일련의 과정을 생각한다. 하지만 양이 작은 데이터를 활용하여 데이터를 분석하여 예측하는 것은 아직까지 크게 활성화되지 못한 분야임에 틀림 없다. 이 중 가장 대표적인 분야가 시계열 데이터 분석 분야일 것이다. 그렇지만 시계열 데이터 분석은 난이도가 높다고 알려진 까닭에 많이 활용되지는 못하지만 비지니스 상에서의 시계열 데이터의 폭넓은 활용은 이들 분석에 대한 필요성을 더욱 높이고 있다. 그동안 빈도주의 접근법을 사용하는 ARIMA등과 같은 모델이 시계열 모델링에.. 2021. 6. 14.
이중 Y축 그리기 in R ggplot에서는 특별한 설정을 하지 않아도 자동적으로 X축과 Y축의 눈금과 범위를 자동적으로 설정해준다. 하지만 다음 플롯과 같이 다변량(Multi-variated) 플롯을 그릴때 맞닥치는 가장 흔한 문제는 한쪽 값이 너무 크거나 작으면 플롯이 효과적이지 않다는 것이다. 예제를 실행하기 위서는 먼저 샘플 데이터를 로딩해야 한다. 이 예제에서는 우리나라 전체 월별 전체 취업자수와 교육분야 취업자수를 사용할 것이다. 데이터 원본은 공지사항을 참조하면 다운로드 받을 수 있고 다음의 코드를 실행함으로서 데이터를 업로드 시킬 수 있다. employees 2021. 6. 8.
시계열 데이터 분석 예제 파일 시계열 데이터 분석 예제 파일 2021. 3. 28.