파이썬으로 데이터 분석을 하는 사람들이 늘어나고 있다. 최근에 파이참 이용자를 대상으로 한 조사에서도 이와 같은 사실을 알 수 있었다. 데이터 분석에서 빼놓을 수 없는 것 중에 하나가 데이타 시각화이다. 파이썬에는 여러가지 시각화 패키지가 있다. 각각 장단점이 있기 때문에 어느 것이 절대적으로 좋다고 말하기는 어려운 것 같다.

오늘은 파이썬 데이터 시각화 분석 패키지 BEST5에 대해서 알아보도록 하겠다.

 

 

데이터 시각화

 

 

필자가 접해본 시간과 패키지를 기준으로 아래와 같이 다섯 가지를 골라봤다.

 


1. matplotlib

가장 처음에 접하게 되는 시각화 패키지가 아닐까 싶다. 다양한 그래프로 그릴 수 있고 익숙하면 어렵지는 않지만, 분석에 사용하기에는 조금 불편하다. 그래도 원하는 모든 그래프를 그릴 수 있다는 것이 장점이다. 동적인 차트에서 애니메이션까지 할 수 있는 범위가 넓다. 하지만, 데이터 분석에는 이를 래핑한 seaborn이 사용하기 더 좋은 듯 하다.

 

matplotlib

 

 

2. seaborn

R에는 대표적인 그래프 모듈로 ggplot2가 있다. ggplot2는 데이터 분석을 하기에 좋은 문법을 가지고 있다. matplotlib을 사용하면서 문법에 대한 아쉬움이 있었다. seaborn은 matplotlib보다 쉬운 문법을 가지고 있다. 사용하기에 더 편리하고 데이터 분석에 더 용이하다

seaborn

 


3. plotly

인터랙티브한 그래프를 그리기에 가장 좋은 패키지이다. D3라는 웹기반의 자바스크립트를 이용하기 때문에, 그래프가 웹에서 그려진다. 주피터 노트북을 사용한다면 이는 큰 제한사항은 아닌다. 기본적으로 인터랙티브한 그래프가 그려지기 때문에, 프레젠테이션을 하기에도 데이터를 살펴보기에도 좋다.

최근에는 문법도 더 쉬워져서 사용하기 용이해졌다.

 

plotly

 

 

4. bokeh

웹기반의 인터랙티브한 그래프로 그릴 수 있는 패키지이다. 필자는 책에서만 봤고 사용해 보지는 못했다. plotly를 사용한다면, 굳이 사용할 필요성을 못 느끼게 되는 패키지이다. 하지만, 대화형 그래프를 그릴 때 자주 거론되는 패키지이다.

 

 

5. plotnine

시간은 없고 할 일은 많다. 목적이 갔다면 여러 가지를 배우는 것보다 하나를 배우고 싶다. R에서 ggplot2를 사용해봤다면 도전해봄직한 패키지이다. 단점은 ggplot2와  문법이 거의 유사하지만, 일부 예외가 존재한다.


오늘은 이렇게 파이썬 데이터 시각화 패키지 베스트5에 대해서 알아보았다. 파이썬은 데이터 관련된 패키지가 많이 있으며 시각화도 예외는 아니다. 아마 이외에도 다른 시각 화 패키지가 있을 것이다. 자신에게 가장 적합하고 편리한 패키지를 찾아 사용하는 것이 좋을 듯 하다.

필자는 그 중에서도 씨본(seaborn)과 플랏트리(plotly)를 먼저 사용해보길 추천한다. 특히 plotly는 대화형 그래프를 그리는 것이 가능하고, 최근에는 plotly.express를 이용하면 훨씬 쉬운 문법으로 차트를 그릴 수 있다.

반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기

댓글을 달아 주세요

">