분류 전체보기178 plotly란? plotly란? plotly는 오픈 소스인 JavaScript로 구현된 plotly.js를 기반으로 R에서 생성한 데이터 시각화 객체를 Javascript로 생성해주는 패키지이다1. plotly는 JavaScript로 구현되기 때문에 plotly 객체는 결국 HTML 코드로 구현되고 이 코드는 웹브라우저 상에서 작동함으로써 사용자의 반응에 따른 데이터의 표현이 가능하다. plotly를 통해 생성된 데이터 시각화의 HTML은 R에서 JavaScript를 사용할 수 있게하는 htmlwidgets 프레임워크에서 동작하기 할 수 있어 HTML자체로 사용할 수도 있고 R Markdown이나 Shiny App, R-Studio, Jupiter Notebook 등에서 자유롭게 사용이 가능하다. R의 plotly패키지.. 2022. 4. 16. 동적 인터랙티브 시각화 패키지 R을 다루는 많은 교육코스나 서적에서 데이터의 시각화는 대부분 R base에서 제공하는 함수를 사용하거나 ggplot2 패키지를 사용하는 방법을 위주로 설명한다. 이 두가지 방법은 데이터 시각화 결과가 우수한 편이기 때문에 많이 사용되고 있지만 정적(Static) 시각화이다. 정적 시각화는 최근 인포그래픽(Infographic)이라고 불리며 일반적으로 문서나 인쇄물에 많이 사용되고 웹에 게시되는 이미지로 사용된다. 그렇기 때문에 대부분 png, jpg, pdf 등의 벡터 혹은 픽셀 이미지 파일로 제공된다. 정적 데이터 시각화는 데이터 분석가의 의도에 맞춰 작성되기 때문에 데이터 분석가의 분석에 의존적일 수 밖에 없으며 독자의 의도에 따른 해석은 매우 제한될 수 밖에 없다. 이러한 제한점을 극복하기 위해 .. 2022. 4. 16. R의 Plotly 사용법을 시작합니다 R에서 가장 많이 사용되는 시각화 패키지는 단연코 ggplot2입니다. ggplot2는 시각화 패키지로써 매우 큰 장점이 있지만 사용자 반응형 시각화가 되지 않는다는 치명적 약점이 있습니다. 사용자가 특정 데이터가 어떤 데이터인지를 알아보기 위해서는 다시 코딩해서 해당 데이터를 찾아야한다는 것이지요. 사실 이 점은 데이터 분석이 완료되어 시각화 방법과 데이터가 확정된 후라면 큰 의미가 없을 수 있지만 탐색적 데이터 분석 단계에서는 치명적 약점임에 틀림없습니다. 그래서 데이터 대시보드를 설계할 때 사용자가 직접 데이터의 확인이 가능하고 줌인, 줌아웃이 자유자재로 가능한 동적 인터랙티브 데이터 시각화 방법을 많이 사용합니다. R에서, 그리고 Python에서 동적 인터랙티브 시각화에 가장 많이 사용되는 패키지.. 2022. 4. 16. apply, lapply, sapply, tapply in R apply 함수의 이해 앞선 포스트에서는 R에서 대규모 데이터에 대한 처리 과정에서 벡터 연산과 루프 연산간의 속도 차이를 살펴보았다. 사실 앞선 포스트에서 비교했던 세가지 방법(함수 자체의 벡터 연산을 통한 대규모 데이터 처리, for 루프에서 함수 호출을 사용한 대규모 데이터 처리, apply()를 사용한 대규모 데이터 처리)들에서 사실 첫번째 방법의 속도가 우수하게 나올수 밖에 없었던 하나의 이유는 함수 호출에 대한 오버헤드가 없었다는 점이다. 루프를 사용하는 방법이나 apply()를 사용하는 방법은 데이터를 계산할 때마다 함수를 호출해야하기 때문에 이에 대한 속도의 문제가 발생할 수 밖에 없다. 그렇기 때문에 함수 자체에서 벡터 연산을 지원하도록 설계하는 것이 R에서의 대규모 데이터 처리에 핵심일.. 2022. 3. 12. 이전 1 ··· 28 29 30 31 32 33 34 ··· 45 다음