-
-
plotly로 바로쓰는 동적시각화 in R & 파이썬
-
AI 시대에도 xAPI는 여전히 유효한가?
인공지능(AI)은 학습 방식을 빠르게 변화시키고 있습니다. 그렇다면 학습 경험을 추적하는 표준인 xAPI에는 어떤 의미가 있을까요?xAPI는 이제 더 이상 필요 없는 기술이 될까요?이 글에서는 AI 시대에 xAPI가 지닌 놀라운 잠재력을 살펴봅니다. 또한 xAPI와 AI가 서로를 대체하는 관계가 아니라, 함께 작동하여 더욱 개인화되고 강력한 학습 경험을 만들어낼 수 있는 방법을 소개합니다.xAPI 다시 살펴보기온라인 강의부터 실제 현장에서의 경험까지, 학습 과정에서 일어나는 모든 활동을 기록해 주는 도구가 있다고 상상해 보세요.이것이 바로 xAPI가 제공하는 핵심 가치입니다.xAPI는 여러분의 학습 여정을 기록하는 디지털 학습 이력장과 같고, 마치 뇌를 위한 피트니스 트래커와도 같습니다.전통적인 교실에서..
2026.06.30
-
Spark 클러스트를 대체하는 DuckDB: 비용 70%를 절감하다
https://product.kyobobook.co.kr/detail/S000220221456 LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr Apache Spark를 AWS EMR에서 운영하던 환경을 DuckDB를 실행하는 단일 EC2 인스턴스로 전환하면서, 연간 36,000달러 이상의 클라우드 비용을 절감했고 ETL 파이프라인의 실행 속도는 11배 빨라졌습니다.예산을 조금씩 갉아먹던 기존 환경우리 데이터 팀은 S..
2026.06.28
-
DuckDB vs PostgreSQL: 아무도 예상하지 못했던 분석 혁명
https://product.kyobobook.co.kr/detail/S000220221456 LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.krPostgreSQL과 경쟁하기 위해 만들어진 데이터베이스는 아니었지만, 이제는 데이터 팀들이 분석 방식을 처음부터 다시 생각하게 만들고 있습니다. 실제 엔지니어링 관점의 트레이드오프를 통해 DuckDB와 PostgreSQL을 비교합니다. 분석 워크로드가 왜 DuckDB로 이동하..
2026.06.27
-
2026년 모든 데이터 엔지니어가 반드시 알아야 할 12가지 데이터 아키텍처 패턴
레이크하우스(Lakehouse)와 메달리온(Medallion) 아키텍처부터 데이터 메시(Data Mesh)와 이벤트 기반(Event-Driven) 시스템까지, 현대 데이터 플랫폼을 뒷받침하는 핵심 아키텍처를 이해해 봅시다. 대부분의 엔지니어는 도구를 두고 논쟁합니다.Snowflake와 Databricks 중 무엇을 선택할지, Kafka와 Kinesis 중 어느 것이 나은지, Airflow와 Dagster 중 어떤 것이 더 적합한지를 이야기합니다.하지만 운영 환경의 데이터 플랫폼을 결정짓는 것은 도구가 아니라 아키텍처입니다.메달리온(Medallion), 레이크하우스(Lakehouse), 람다(Lambda), 카파(Kappa), 데이터 메시(Data Mesh), 데이터 볼트(Data Vault).플랫폼이 확..
2026.06.27
-
DuckDB : 왜 모든 데이터 엔지니어가 갑자기 DuckDB를 이야기하는가?
https://product.kyobobook.co.kr/detail/S000220221456 LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr 지난 몇 년간 데이터베이스 분야에서 가장 흥미로운 이야기는 더 큰 클러스터에 관한 것이 아닙니다. 분석을 다시 로컬 환경으로 되돌리는 것에 관한 이야기입니다. DuckDB는 빠르게 데이터 엔지니어들이 가장 선호하는 도구 중 하나로 자리 잡고 있습니다. 로컬 우선(Local-F..
2026.06.25
-
Pandas, Polars, DuckDB로 테스트 데이터 생성하기
https://product.kyobobook.co.kr/detail/S000220221456 LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr 데이터베이스용 테스트 데이터를 생성하는 것은 실제 운영 데이터를 사용하기 전에 애플리케이션이 현실적인 규모와 다양한 형태의 데이터에서 어떻게 동작하는지 검증하고자 할 때 유용합니다.안타깝게도 많은 기업들이 애플리케이션 성능 테스트를 위해 운영 데이터를 사용합니다. 이는 특히..
2026.06.22
-
DuckDB: 2026년 데이터 분석가를 위한 가장 과소 평가된 도구
Spark도, 클러스터도, IT 부서도 없이 멀티 기가바이트 파일 때문에 컴퓨터가 멈추는 일을 막는 방법 https://product.kyobobook.co.kr/detail/S000220221456 LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr 아마 겪어봤을 상황이런 상황을 떠올려 보세요. 며칠 안에 처리해야 할 export 파일을 전달받았습니다. 4.2GB CSV 파일이고, 수백만 행의 고객 거래 데이터입니다...
2026.06.21
-
상관관계에서 인과관계로
패턴을 찾는 것이 왜 일이 일어나는 이유를 이해하는 것과 같지 않은가 패턴을 찾는 것이 왜 일이 일어나는 이유를 이해하는 것과 같지 않은가 현대 데이터 과학은 전례 없는 규모로 패턴을 찾아낼 수 있습니다. 모델은 유지 할인(retention discount)을 받은 고객이 구독을 유지할 가능성이 더 높다는 사실을 발견할 수 있습니다. 대시보드는 특정 사업 부문이 다른 부문보다 더 좋은 성과를 내고 있음을 보여줄 수 있습니다. 머신러닝 시스템은 특정 검색어가 공식 보건 통계에서 독감 유행을 보고하기 전에 먼저 증가한다는 사실을 식별할 수 있습니다.하지만 패턴을 찾는 데는 한계가 있습니다. 패턴은 왜 어떤 일이 일어나는지를 자동으로 알려주지 않으며, 우리가 무엇인가를 바꾸려고 할 때 어떤 결과가 발생할지도..
2026.06.20
-
DuckDB + Python: SQL로 CSV 파일 다루기 part 1
https://product.kyobobook.co.kr/detail/S000220221456 LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr 대용량 CSV나 Parquet 파일을 다룰 때는 보통 모든 데이터를 Pandas로 불러온 뒤 컴퓨터가 버텨주기를 기대합니다.하지만 데이터를 데이터베이스로 가져오지 않고도 파일에 직접 SQL 쿼리를 실행할 수 있다면 어떨까요? 바로 DuckDB가 이를 가능하게 합니다.이 튜토..
2026.06.20
-
DuckDB + Python Part 2: SQL로 Parquet 파일과 다수의 CSV 파일 다루기
https://product.kyobobook.co.kr/detail/S000220221456 LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr 앞선 "DuckDB + Python: SQL로 CSV 파일 조회하기"라는 글에서 DuckDB를 사용해 데이터를 데이터베이스에 적재하지 않고도 CSV 파일을 직접 SQL로 조회하는 방법을 살펴보았습니다. 아직 Part 1을 읽지 못했다면 먼저 확인해 보시기 바랍니다.이번 Par..
2026.06.20
-
SQL Window Function에서 ROWS와 RANGE
ROWS와 RANGE의 가장 큰 차이점은 SQL 윈도우 함수에서 ROWS는 데이터셋 내 행의 물리적인 위치를 기준으로 처리하는 반면, RANGE는 ORDER BY 컬럼의 값을 기준으로 논리적으로 처리한다는 점입니다. 이러한 동작 방식의 차이는 정렬 컬럼에 중복 값(동점)이 존재할 때 매우 분명하게 나타납니다. ROWS: 행을 순서대로 하나씩 평가합니다. 인접한 행들이 동일한 값을 가지고 있는지는 전혀 고려하지 않습니다.RANGE: 동일한 값을 가진 행들을 하나의 논리적 블록으로 평가합니다. 여러 행이 동일한 정렬 값을 가지고 있다면, RANGE는 이들을 같은 계산 프레임에 동시에 포함시킵니다.입력 테이블/*ROWS와 RANGE 두 가지 프레임 방식을 사용하여누적 합계(running total)를 계산해 ..
2026.06.19
-
시계열의 테이블화: ML 기반 예측의 기초
대부분의 머신러닝 튜토리얼은 시계열을 그저 또 하나의 데이터셋으로 취급합니다.하지만 이러한 가정은 눈에 띄지 않게 모델의 성능을 망가뜨릴 수 있습니다. 여기서는 단 하나의 특성(feature)도 생성하기 전에 모든 시계열 프로젝트에서 반드시 수행해야 하는 근본적인 변환을 살펴보겠습니다. 핵심 문제시계열 데이터셋을 열어보면 일반적으로 다음과 같은 형태를 보게 됩니다.date sales2023-01-01 1422023-01-02 1572023-01-03 1332023-01-04 189...이것은 순차적인 구조(sequence structure)입니다. 하지만 XGBoost, LightGBM, 선형 회귀(Linear Regression)와 같은 머신러닝 모델은 독립적인 관..
2026.06.18
-
24~25 EPL 팀 중 홈에서 강한 팀
보다 상세한 내용은 EPL과 유튜브로 배우는 DuckDB 에 수록되어 있습니다. LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr 2024/25 EPL의 팀 중 전체 경기 평균 골 수보다 홈에서 더 많은 골을 넣은 경기가 가장 많은 팀은 맨체스터 시티(Manchester City)로 13경기의 홈경기에서 평균 골 수보다 더 많은 골을 넣었습니다. 애스턴 빌라(Aston Villa), 아스널(Arsenal), 사우샘프턴..
2026.06.17
-
리버풀과 토트넘의 포지션별 공격 결과
보다 상세한 내용은 EPL과 유튜브로 배우는 DuckDB 에 수록되어 있습니다. LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr 2024/25 EPL의 1위 팀인 리버풀(Liverpool)과 토트넘 홋스퍼(Tottenham Hotspur)의 포지션별 공격 결과를 살펴보면 수비수(Defender)의 경우 양 팀의 유효슛은 55개에 11골이 기록되어 성공률이 20%에 불과합니다. 반면 공격수(Forward)는 228개의..
2026.06.17
-
리버풀과 토트넘의 공격 효율 비교
보다 상세한 내용은 EPL과 유튜브로 배우는 DuckDB 에 수록되어 있습니다. LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 이기준 - 교보문고LUVIT EPL과 유튜브 데이터로 배우는 DuckDB | 복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB 최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구product.kyobobook.co.kr 2024/25 EPL의 선수별 통계가 저장된 playerStats_2024_EPL 테이블의 데이터를 사용하여 1위 팀인 리버풀과 손흥민 선수가 소속되어 있던 토트넘 홋스퍼의 공격 효율을 비교해보는 예입니다. 2024/25 EPL의 1위 팀인 리버풀(Liverpool)과 토트넘 홋스퍼(To..
2026.06.17