본문 바로가기
  • plotly로 바로쓰는 동적시각화 in R & 파이썬

SmartEDA2

대학 중도탈락(중퇴)자 분석 - part 1 대학의 중도탈락생 분석 최근 한 국회의원이 서울대학교의 중도탈락생을 분석하여 자료를 발표한 후“의대 갈래” 서울대 자퇴 지난해 330명 ‘최다’..10명 중 7명이 이공계 이에 관련한 다양한 기사단독 - 서울대 자퇴 330명은 어디로 갔을까가 나왔다. 국회의원이 발표한 데이터와 각종 기사에서 분석한 기사들을 데이터를 중심으로 다시 체크해보도록 한다. 데이터 출처 관련한 기사의 출발이 된 국회의원이 분석한 자료는 서울대에서 제출받은 자료라고 기사에 나와있다. 이 후 한 사설기관(하늘교육 종로학원)에서 분석한 기사는 대학알리미에서 데이터를 추출해서 사용했다. 따라서 이 포스트에서도 대학알리미에서 다운로드 받은 데이터를 사용하였다. 위에서 보는 ’중도탈락 학생현황’의 학과별 자료를 중계열 단위로 총 34개 파.. 2022. 9. 27.
탐색적 데이터 분석(Exploratory Data Analysis)의 자동화 패키지 in R - Part 1 : SmartEDA 자동 탐색적 데이터 분석 데이터 분석을 하기 위해서 가장 먼저 해야하는 작업은 분석에 필요한 적절한 데이터를 찾고 얻어내는 것일 것이다. 자신이 분석하기 원하는 데이터를 찾았다면 먼저 데이터를 R로 불러들여야 한다. 이 작업이 끝나면 이제 본격적으로 데이터 분석을 시작해야 한다. 그렇다면 이제 무슨 작업을 해야하는 것일까? 우선은 자신이 불러들인 데이터가 어떻게 생겼고 어떤 특성을 지녔는지 전반적으로 확인해야 할 것이다. 이 작업을 탐색적 데이터 분석( Exploratory Data Analysis : EDA)이라고 한다. 대부분의 R 관련 입문 도서들에서는 탐색적 데이터 분석을 위해 head()와 tail()로 개략적인 데이터를 확인하고 str()과 glimpse()를 사용하여 데이터프레임의 전반적인 .. 2022. 9. 14.