본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

tsibble3

시계열 데이터의 결측치(Missing value) 처리 in R - part 4 이번 포스트에서는 tsibble 클래스의 결측치 처리 방법 중 특별한 방법을 살펴보도록 하겠다. tsibble : 그룹화된 결측치 처리 앞선 tsibble의 결측치 처리 포스트(https://2stndard.tistory.com/130)에서 fill_gaps()의 결과를 보면 특정 값으로 결측치를 대체하거나 함수의 결과값으로 결측치를 처리할 수 있다. 그런데 이 방법은 전체 결측치에 대해 처리되기 때문에 특정값을 설정하면 처음부터 끝까지 결측치를 동일한 값으로 처리하고 함수의 경우도 전체 데이터 대상의 함수 적용 결과값을 사용하기 때문에 전체적으로 같은 값이 결측치에 반영된다. 앞 포스트의 그래프를 보면 median() 함수가 적용되는 구간이 전체 데이터를 대상으로 하기 때문에 전체 데이터에 대한 중간값.. 2022. 9. 11.
시계열 데이터의 결측치(Missing value) 처리 in R - part 3 이번 포스트에서는 시계열 데이터의 결측치 처리 방법 중 tsibble 클래스에 따라 살펴보도록 하겠다. tsibble tsibble 클래스는 tidyverse 생태계에서 사용되는 대표적인 데이터 클래스인 tibble 클래스를 시계열 데이터에 맞게 확장한 데이터 클래스이다. 이 tsibble 클래스의 시계열 데이터는 tsibble 패키지에서 제공하는 함수를 사용하여 결측치를 처리할 수 있다. if (!require(tsibble)) { install.packages('tsibble') library(tsibble) } 데이터 Import 사용하는 데이터는 Part 1에서 사용한 ‘tsAirgap’ 데이터를 tsibble 클래스 변환하여 사용하도록 하겠다. 다만 앞선 ts, xts, zoo와는.. 2022. 9. 11.
일별(일간) 데이터를 주별(주간) 데이터로 만들기 in R 사용데이터 : https://2stndard.tistory.com/68 lubridate와 tsibble를 사용하는 기간별 합계값 구하기 - 주별 데이터 이전 포스트에서는 lubridate와 zoo를 사용하여 일간 데이터를 월간 데이터로 변환하는 방법을 알아보았다. 앞서도 언급했지만 우리가 사용하는 데이터는 주로 숫자나 문자로 이루어져 있고 대량의 데이터가 저장되어 있는 DB나 다른 데이터 소스에서 데이터를 추출할 때는 csv 파일이나 엑셀 파일 등으로 추출하고 R에서 불러들이는 것이 일반적인데 이 경우 흔히 날짜 데이터를 문자열 형태로 불러 읽어들이는 경우도 많다. 앞선 포스트에서와 같이 월별 데이터로 변환할 때는 문자열 형태로 설정된 날짜 데이터도 이 문자열을 잘 다루면 연별, 월별로 그룹화하여 변환.. 2022. 6. 18.