ASAP 개발
Dacon "오늘의 파이썬" EDA 본문
Lv1 EDA 1/5 python 파이썬 라이브러리 불러오기(import)
데이터를 분석하기 위해 불러오고,조작하려면 도구가 필요하다.
대표적으로 pandas, numpy, matplotlib 등이 있습니다.
최우선적으로 불러와야할 도구입니다.
↓pandas 불러오기 코드
Lv1 EDA 2/5 python 파이썬 파일 불러오기(read_csv)
pandas를 이용해 csv 파일불러왹 위해서 pandas를 import하고
약어로 지정한 pd를 사용해 read_csv파일을 불러 올 수 있습니다.
↓csv 파일 불러오기 코드
Lv1 EDA 3/5 python 파이썬 행 열 갯수 관찰하기(shape)
불러온 데이터의 행과 열의 갯수를 shape attribute로 관찰할 수 있습니다.
↓shape 를 이용해 train과test 의 행과 열의 갯수를 파악하는 코드
Lv1 EDA 4/5 python 파이썬 데이터 확인하기(head())
가장 대표적인 데이터 확인 하는 메서드 head() 입니다.
head()는 데이터 전부를 보여주지 않고 데이터의 상단부만 출력하여 보여준다.
head()와 유사한 메서드로는 tali()메서드가 있다.
tali()은 데이터의 상단부가 아닌 하단부분을 출력한다.
↓head()메서드를 활용해 데이터 상단부를 확인하는 코드
Lv1 EDA 5/5 python 파이썬 결측치 확인하기(is_null() )
결측치란 말 그대로 데이터 값이 없는 것을 의미한다.
pandas에서는 NaN값으로 표현한다.
pandas에 isnull()메서드를 사용하면 NaN값을 확인 할 수 있다.
데이터가NaN 값이면 True로,그렇지 않으면 Flase값으로 출력한다.
↓isnull()코드를 사용해서 결측치 확인하기
'BigData > Python' 카테고리의 다른 글
[데이콘 Pandas 튜토리얼1] Ch1~7 (1) | 2022.02.04 |
---|---|
DACON "오늘의 파이썬" 모델링 (0) | 2022.02.02 |
DACON "오늘의 파이썬" 전 처리 (0) | 2022.02.02 |
Comments