파이썬에서의 Series는 어떤 데이터 타입이든 보유할 수 있는 1차원 배열 자료구조이다.
Series는 index, value, data type 집합으로 구성되고 리스트 자료형으로 생성이 가능하다.
# Series를 생성하기 위해서 pandas를 먼저 import한다.
import pandas as pd
# Series 생성
mySeries1 = pd.Series([2, 6, 4, 8])
print(mySeries1)
위의 결과를 보면 각 값에 대한 index는 0, 1, 2, 3으로 부여된 것을 알 수 있다.
아래와 같이 index, value, dtype에 대한 내용도 확인이 가능하다.
# Series에 저장된 값 확인
print(mySeries1.values)
# 결과:[2 6 4 8]
# Index 확인
print(mySeries1.index)
# 결과: RangeIndex(start=0, stop=4, step=1)
# 데이터 형식 확인
print(mySeries1.dtype)
# 결과: int64
앞선 결과에서는 index를 직접 지정해주지 않아서 자동으로 0부터 3까지 지정이 되었지만, index는 다양한 자료형의 값으로 초기화가 가능하다. 아래의 코드에서는 문자와 딕셔너리를 이용해서 인덱스를 입력한다.
# 문자를 이용한 index 지정
ser_ind_char = pd.Series([2, 6, 4, 8], index = [‘a’, ‘b’, ‘c’, ‘d’])
print(ser_char)
# 딕셔너리를 이용한 index 지정
ser_ind_dict = pd.Series({‘a’ : 5, ‘b’ : 3, ‘c’ : 7, ‘d’ : 9})
print(ser_dict)
또한 Series의 이름을 지정할 수 있을 뿐만 아니라, index의 레이블을 지정할 수도 있다. 아래의 코드에서 확인할 수 있다.
ser = pd.Series([2, 6, 4, 8], index = ['a', 'b', 'c', 'd'])
# index 이름 지정
ser.index.name = 'even'
# Series 이름 지정
ser.name = 'series testing'
print(ser)
좀 더 자세한 설명은 다음을 참고해도 좋을듯합니다.
'[Python] 연습' 카테고리의 다른 글
[Python] 클래스와 상속 (0) | 2022.05.27 |
---|---|
[Python] 결측값 처리하기(dropna) (0) | 2022.03.27 |
[Python] 데이터 정규화 (0) | 2022.03.25 |
[Python] 판다스 특정 문자열 포함 판단하기 (0) | 2022.03.12 |
[Python] 판다스 문자열 구분자로 나누기 (0) | 2022.03.11 |