Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Archives
Today
Total
관리 메뉴

ASAP 개발

Dacon "오늘의 파이썬" EDA 본문

BigData/Python

Dacon "오늘의 파이썬" EDA

아라동 2022. 2. 2. 13:50

 

Lv1 EDA 1/5 python 파이썬 라이브러리 불러오기(import)
데이터를 분석하기 위해 불러오고,조작하려면 도구가 필요하다.
대표적으로 pandas, numpy, matplotlib 등이 있습니다.
최우선적으로 불러와야할 도구입니다.

 

pandas 불러오기 코드

 


 

Lv1 EDA 2/5 python 파이썬 파일 불러오기(read_csv)
pandas를 이용해 csv 파일불러왹 위해서 pandas를 import하고
약어로 지정한 pd를 사용해 read_csv파일을 불러 올 수 있습니다.

 

csv 파일 불러오기 코드

 


 

Lv1 EDA 3/5 python 파이썬 행 열 갯수 관찰하기(shape)
불러온 데이터의 행과 열의 갯수를 shape attribute로 관찰할 수 있습니다.

 

shape 를 이용해 train과test 의 행과 열의 갯수를 파악하는 코드

 

 


 

Lv1 EDA 4/5 python 파이썬 데이터 확인하기(head())
가장 대표적인 데이터 확인 하는 메서드 head() 입니다.
head()
는 데이터 전부를 보여주지 않고 데이터의 상단부만 출력하여 보여준다.
head()와 유사한 메서드로는 tali()메서드가 있다.
tali()은 데이터의 상단부가 아닌 하단부분을 출력한다.

 

head()메서드를 활용해 데이터 상단부를 확인하는 코드

 


 

Lv1 EDA 5/5 python 파이썬 결측치 확인하기(is_null() )
결측치란 말 그대로 데이터 값이 없는 것을 의미한다.
pandas에서는 NaN값으로 표현한다.
pandas에 isnull()메서드를 사용하면 NaN값을 확인 할 수 있다.
데이터가NaN 값이면 True로,그렇지 않으면 Flase값으로 출력한다.

 

isnull()코드를 사용해서 결측치 확인하기

'BigData > Python' 카테고리의 다른 글

[데이콘 Pandas 튜토리얼1] Ch1~7  (1) 2022.02.04
DACON "오늘의 파이썬" 모델링  (0) 2022.02.02
DACON "오늘의 파이썬" 전 처리  (0) 2022.02.02
Comments