본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

실전에서 바로 쓰는 시계열 데이터 처리와 분석 in R20

시계열 변화점 탐지 변화점(change point) 시계열 데이터는 시간에 따른 데이터 변화량을 기록하는 데이터로 다른 데이터와는 조금 다른 몇가지 특징을 가진다. 이 특징은 계절성, 자기상관성 등이 있지만 또 하나의 특징으로 말할 수 있는 것이 특정 시기에 발생한 외부적 요인에 따른 데이터의 급격한 변화 요인이다. 필자가 생각하는 변화점의 예로 가장 적절한 것은 미국의 9.11테러로 인한 증시에 변화량이라고 생각한다. https://en.wikipedia.org/wiki/Economic_effects_of_the_September_11_attacks 2001년 9월 11일 발생한 테러로 인해 뉴욕 증시 뿐만아니라 한국 증시도 패닉상태였다. 하루에 종합주가지수는 12%떨어졌는데 당시 개별 주식의 하한가가 -15%인 것을 감.. 2021. 7. 17.
[교보문고]실전에서 바로 쓰는 시계열 데이터 처리와 분석 https://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791191600155 시계열 데이터 처리와 분석 in R - 교보문고 교육, 고용, 코로나 데이터를 활용한 시계열 프로젝트 | 20년 경력의 교육통계 전문가가 실생활 예제로 꼼꼼하게 안내하는 시계열 데이터 입문서! 복잡한 수학 공식 없이 코드 위주의 설명과 실 www.kyobobook.co.kr 2021. 7. 13.
[JPUB]시계열 데이터, 여러분은 얼마나 알고 있나요? https://jpub.tistory.com/1173?category=203154 시계열 데이터, 여러분은 얼마나 알고 있나요? 2019년 12월 이후로 전 세계가 COVID-19로 힘들어하고 지쳐가면서 우리는 매일 확진자 수가 얼마일지를 궁금해하지만, 갑자기 늘거나 줄지 않는 한 그냥 숫자로만 넘기고, 그 추세 또는 추이에 대해 jpub.tistory.com 2021. 7. 13.
ggplot2의 Y축 자르기 ggbreak 다변량을 표현하는 플롯을 그릴때 간혹 변량의 값 범위의 차이가 너무 커서 플롯이 효율적으로 그려지지 않는 경우가 있다. 단적인 예로 전체 취업자수와 교육서비스업 취업자를 하나의 플롯으로 표현하는 경우가 이에 해당하는데 이를 해결하기 위해 앞선 포스트에서는 이중축을 사용해 해결하였지만 세개 이상의 다변량을 표현할 때는 이중축으로는 해결이 어렵다. 이런 경우 간혹 축의 일부를 잘라서 표현하는 경우가 있다. 축의 일부 값을 잘라서 데이터가 표현되지 않는 부분을 최소화함으로써 플롯의 공간을 최대한 활용하는 방법이다. 이렇게 축을 잘라서 사용하는 플롯을 어떻게 만들것인가? 이에 대한 해답으로 ggbreak패키지를 소개한다. ggbreak 패키지는 축의 일부를 잘라서 플롯의 빈공간을 최소화함으로써 플.. 2021. 6. 26.