본문 바로가기

Python/Pandas12

[Pandas] 그룹화 : groupby 안녕하세요. 쇼미요미입니다. 나도코딩님을 통해 학습한 내용입니다. 마지막 그룹화입니다. 1. 정의 - 동일한 값을 가진 것들끼리 합쳐서 통계나 평균을 내기 위함 2. 1개의 그룹으로 묶기 1-1) 그룹 묶기 df.groupby('학교').get_group('북산고') #학교를 그룹으로 묶어 '북산고'만 가져옴 1-2) 그룹의 평균, 데이터 수, 갯수 구하기 df.groupby('학교').mean() #학교 그룹의 계산 가능한 데이터들의 평균값 df.groupby('학교').size() #학교 그룹의 학교별 데이터 수 df.groupby('학교').size()['능남고'] #학교 그룹의 능남고에 해당하는 데이터 수 df.groupby('학교')['키'].mean() #학교 그룹의 키 별 평균값 df.gro.. 2022. 5. 3.
[Pandas] 함수 적용 : apply 안녕하세요. 쇼미요미입니다. 나도코딩님을 통해 학습한 내용입니다. 오늘은 함수 적용하기~ 1. 함수 적용 - apply를 통해 함수 적용을 함 def add_cm(height): return str(height) + 'cm' df['키'] = df['키'].apply(add_cm) #키 데이터에 대해서 add_cm 함수를 호출한 결과 데이터를 반영 df def capital(lang): if pd.notnull(lang): #값이 Nan인지 아닌지 판단함 return lang.capitalize() #첫 글자는 대문자, 나머지는 소문자 (함수임) return lang df['SW특기'] = df['SW특기'].apply(capital) --------------------------------------.. 2022. 5. 3.
[Pandas] 데이터 수정 : 수정, 추가, 삭제, 순서변경, 이름변경 등 안녕하세요. 쇼미요미입니다. 나도코딩님을 통해 학습한 내용입니다. 오늘은 데이터 수정편입니다. 1. Column 1-1) Column 수정 - 특정 column의 하나의 cell 수정 df['학교'].replace({'북산고','상북고'}) #북사고를 상북고로 수정 - 특정 column의 여러 개의 cell 수정 df['학교'].replace({'북산고':'상북고', '능남고':'신림고'}) #북산고는 상북고로, 능남고는 신림고로 수정 #dic 형태로 묶기 - 특정 column의 cell 뒤에 특정 문자 추가하여 cell 수정 df['학교'] = df['학교'] + '등학교' # 학교 데이터 + 등학교 df 1-2) Column 추가 df['총합'] = df['국어'] + df['영어'] + df['수학.. 2022. 5. 3.
[Pandas] 데이터 정렬 안녕하세요. 쇼미요미입니다. 나도코딩님을 통해 학습한 내용입니다. 오늘은 데이터 정렬 편입니다. 1. 1개의 column으로 데이터 정렬 df.sort_values('키') #키 기준으로 오름차순 # df.sort_values('키', ascending=False) #키 기준으로 내림차순 2. 여러 개의 column으로 데이터 정렬 df.sort_values(['수학', '영어'], ascending=False) #수학, 영어 기준으로 내림차순 3. 여러 개의 column 데이터를 각각 정렬하고 싶으면? df.sort_values(['수학', '영어'], ascending=[True, False]) #수학점수는 오름차순, 영어점수는 내림차순으로 정렬 #리스트로 묶기 2022. 5. 3.