AI 공부/데이터 끄적

    데이터 시각화를 하는 방법(matplotlib, seaborn)

    나는 그림을 그리는 방법으로 matplotlib 를 이해하려 했다. 우선 그림그리는 방법은 내가생각한 순서는 이렇다 그림을 그리는 방법 - * 준비단계 : 1. 도화지준비 2. 펜준비 3. 물감준비 * 그리기작업 : 4. 무엇을 그릴지 상상 5. 그리기 1. 도화지 준비 : 2. 펜준비 : font 그래프에 들어가는 글자들의 폰트를 설정합니다. plt.suptitle, ax.title, ax.xlabel, axes.xticklabels, ax.annotate, ax.text 등으로 곳곳의 폰트를 설정할 수 있습니다. https://jehyunlee.github.io/2020/02/13/Python-DS-2-matplotlib_defaults_and_fonts/ https://www.delftstack.c..

    EDA 순서

    EDA 를 할때도 순서를 정해서 하는건 굉장히 중요한 업무중에 하나이다. EDA 를 할때 순서를 정하지 않고 무작정 하게되면, EDA 를 통해서 도출하는 결과가 달라진다. 예로들어서 Time series 데이터에서 Feauture 값에 고유키 값이 없을때. 이것을 찾기 위해서 Feauture 본다 치자. 그러면 이때 가장 중요한건 무엇일까? 바로 Discrete data + Ordinal data or Discrete data + Norminal data 일것이다 그렇지 않고 Continuous data 를 섞어 쓰게된다면 이상한 결과치가 나올것이다 그럼으로 EDA 를 할때 무엇을 볼것이며, 어떻게 볼것이며를 생각해서 하는게 굉장히 중요하다 논리적인 자료의 요약 :