[Python] 연습

[AIFB] DataFrame 변형하기

Simon Yoon 2022. 8. 13. 22:16

Group by

데이터 분할(split) > operation 적용(applying) > 데이터 병합(combine)

> groupby 내부 함수 활용하기

>> 그룹 데이터에 적용 가능한 통계 함수(NaN은 제외하여 연산)

>> count: 데이터 개수

>> size: 집단별 크기

>> sum: 데이터의 합

>> mean, std, var: 평균, 표준편차, 분산

>> min, max: 최소, 최대값

 

> 복수 columns를 기준으로 grouping 하기

>> 통계함수를 적용한 결과는 multiindex를 갖는 DataFrame

# cust_class 와 sex_type으로 index를 정하고 이에따른 r3m_avg_bill_amt의 평균을 구하기
cust.groupby(['cust_class', 'sex_type']).mean()[['r3m_avg_bill_amt']]

 

pivot, pivot_table

DataFrame 형태를 변경하는 것(columns, row를 기준으로 데이터를 변형)

pivot > pandas.pivot(index, columns, values)

pivot table > pandas.pivot_table(index, columns, ...)

 

- pivot은 불가하고 pivot table은 가능한 경우

중복 값이 있는 경우

집계 처리가 필요한 경우

 

stack, unstack

DataFrame을 재구조화하기 위해서 사용