Python/Pandas12 [Pandas] 결측치 : 비어있는 데이터(Nan) 안녕하세요. 쇼미요미입니다. 나도코딩님을 통해 학습한 내용입니다. 오늘은 결측치~ 1. Nan 채우기 1-1) 모든 Nan 데이터를 특정 문자로 채우기 : fillna df.fillna('없음') #Nan 데이터를 없음으로 채움 1-2) 특정 column만 Nan 데이터를 특정 문자로 채우기 df['SW특기'].fillna('확인중', inplace=True) #특정 Coulmn만 채우기 df 1-3) 특정 column 전체를 특정 문자로 채우기 import numpy as np df['학교'] = np.nan # 학교 데이터 전체를 Nan으로 채움 df 2. Nan 제외하기 2-1) Nan이 포함된 row 제외하기 : dropna df.dropna() 2-2) Nan이 모두 포함되거나, 하나만 포함되는.. 2022. 5. 3. [Pandas] 데이터 선택 : 조건 선택 안녕하세요. 쇼미요미입니다. 나도코딩님을 통해 학습한 내용입니다. 오늘은 조건을 이용한 데이터 선택 편입니다. 1. 하나의 조건으로 데이터 가져오기 1-1) row 데이터가 조건에 맞는지, 맞지 않는지 T/F로 판단하기 df['키'] >=185 1-2) 조건에 맞는 row 데이터 가져오기 filt = (df['키'] >=185) #키가 185 이상인 학생의 row 데이터 가져오기 df[filt] ----------------------------------------------------------- df[df['키']>=185] ----------------------------------------------------------- df.loc[df['키']>=185] #모두 같은 데이터가 출력됨 2.. 2022. 5. 3. [Pandas] 데이터 선택 : loc, iloc 안녕하세요. 쇼미요미입니다. 나도코딩님을 통해 학습한 내용입니다. 오늘은 loc, iloc를 이용한 데이터 선택 편입니다. 1. 데이터 선택 : 기본 1-1) column 선택 - label로 선택 df['이름'] - index로 선택 df[df.columns[0]] 1-2) 슬라이싱 - label로 슬라이싱 df[['이름','학교','키']][0:2] #column이 이름,학교,키 데이터 중에서 0부터 2까지 row만 가져오기 - index로 슬라이싱 df[df.columns[0:3]][0:2] #0~2까지 column, 0~2까지 row 데이터를 가져옴 #column에서 index는 제외하므로 이름이 0번째가 됨 2. 데이터 선택 : loc - 이름을 이용하여 원하는 row에서 원하는 col 선택 2.. 2022. 5. 3. [Pandas] 데이터 확인 안녕하세요. 쇼미요미입니다. 나도코딩님을 통해 학습한 내용입니다. 오늘은 index~ 1. DataFrame 확인 1-1) Column 별로 데이터 갯수, 평균, 표준편차, 최소/최대값 등의 정보 확인 : describe df.describe() 1-2) 데이터 정보 확인 : info df.info() 1-3) 처음 5개의 row 데이터 확인 : head df.head() #디폴트가 5이며, 뒤에 숫자를 넣으면 숫자 만큼 가져옴 1-4) 마지막 5개의 row 데이터 확인 : tail df.tail(3) #디폴트가 5이며, 뒤에 숫자를 넣으면 숫자 만큼 가져옴 1-5) 배열 형태의 데이터 확인 : values df.values 1-6) 인덱스 정보 확인 : index df.index 1-7) Column명.. 2022. 5. 3. 이전 1 2 3 다음