본문 바로가기

Pandas

Pandas 함수 정리하기

728x90

자료형

Pandas에는 자료형이 Series , DataFrame 두 가지가 존재합니다.

Series

columns이 존재하지 않고 인덱스만 존재하는 구조 입니다.

DataFrame

index , column , value가 존재하는 구조입니다.


 

Series 함수

 

배열을 Series로 변환하는 함수.

s = pd.Series([1,2,3])

딕셔너리를 Series로 변환하는 함수

s = pd.Series({'a': 1 , 'b' : 5})

DataFrame 함수

 

DataFrame 만들기 (값이 a,b,c,d로 채워짐)

df = pd.DataFrame([[a,b][c,d]] , index=[1,2] , columns=['A','B'])

컬럼명 확인하기

df.columns

상위 행 확인하기

parameter 값만큼 출력됨 (default = 5)

df.head(parameter)

행열 크기 확인하기

df.shape

정보확인하기

df.info()

통계적 개요 보기

df.subscribe()

특정 칼럼 보기

columns에 보고싶은 컬럼의 이름을 적으면 됩니다.

df['columns']

열 정렬하기

row에 정렬하고 싶은 row를 적으면 됩니다.

df.sort_values(by='row', ascending=False)

컬럼,인덱스 이름 바꾸기

df.rename(index={'before' : 'after'} , colums={'beforr' : 'afterr'})

인덱스 만들기

df.reset_index()

NaN 값 처리

A칼럼에 NaN값을 true로 변환해줍니다.

df['A'].isnull()

NaN 삭제

A칼럼에서 NaN값을 삭제합니다.

df.dropna(subset='A')

제거하기

 

A열 삭제

pd.drop(['A'] , inplace=True , axis=1)

 

 

여러개 열 삭제

df.drop(columns = ['A' , 'B'])

 

0행 삭제

df.drop(0)

 

여러개 행 삭제

df.drop([1,2])
728x90