[Python] 연습

[Python] 범주형 변수 처리 - dummy coding

Simon Yoon 2022. 9. 18. 23:33

pandas 의 get_dummies() 함수를 사용하면 쉽게 범주형 변수를 더미변수화 할 수 있다.

사용법은 아래와 같다.

# 연습용 데이터 생성
import pandas as pd

df = pd.DataFrame({'language': ['Python', 'Java', 'Java', 'SQL', 'Python', 'Python', 'R'],
                   'score': [70, 80, 68, 40, 92, 57, 75]
                   })
df

# get_dummies()
pd.get_dummies(df)

단 한 줄 작성으로 쉽게 더미변수를 만들었다.