728x90
자료형
Pandas에는 자료형이 Series , DataFrame 두 가지가 존재합니다.
Series
columns이 존재하지 않고 인덱스만 존재하는 구조 입니다.
DataFrame
index , column , value가 존재하는 구조입니다.
Series 함수
배열을 Series로 변환하는 함수.
s = pd.Series([1,2,3])
딕셔너리를 Series로 변환하는 함수
s = pd.Series({'a': 1 , 'b' : 5})
DataFrame 함수
DataFrame 만들기 (값이 a,b,c,d로 채워짐)
df = pd.DataFrame([[a,b][c,d]] , index=[1,2] , columns=['A','B'])
컬럼명 확인하기
df.columns
상위 행 확인하기
parameter 값만큼 출력됨 (default = 5)
df.head(parameter)
행열 크기 확인하기
df.shape
정보확인하기
df.info()
통계적 개요 보기
df.subscribe()
특정 칼럼 보기
columns에 보고싶은 컬럼의 이름을 적으면 됩니다.
df['columns']
열 정렬하기
row에 정렬하고 싶은 row를 적으면 됩니다.
df.sort_values(by='row', ascending=False)
컬럼,인덱스 이름 바꾸기
df.rename(index={'before' : 'after'} , colums={'beforr' : 'afterr'})
인덱스 만들기
df.reset_index()
NaN 값 처리
A칼럼에 NaN값을 true로 변환해줍니다.
df['A'].isnull()
NaN 삭제
A칼럼에서 NaN값을 삭제합니다.
df.dropna(subset='A')
제거하기
A열 삭제
pd.drop(['A'] , inplace=True , axis=1)
여러개 열 삭제
df.drop(columns = ['A' , 'B'])
0행 삭제
df.drop(0)
여러개 행 삭제
df.drop([1,2])
728x90
'Pandas' 카테고리의 다른 글
22년 12월, 대한민국에서 가장 많이 이용한 노선은 ? (feat. Pandas) (4) | 2023.01.25 |
---|