[Python] 연습

[Python] Series

Simon Yoon 2022. 3. 26. 21:53

파이썬에서의 Series는 어떤 데이터 타입이든 보유할 수 있는 1차원 배열 자료구조이다.

Series는 index, value, data type 집합으로 구성되고 리스트 자료형으로 생성이 가능하다.

# Series를 생성하기 위해서 pandas를 먼저 import한다.
import pandas as pd

# Series 생성
mySeries1 = pd.Series([2, 6, 4, 8])
print(mySeries1)

print(mySeries1) 결과

위의 결과를 보면 각 값에 대한 index는 0, 1, 2, 3으로 부여된 것을 알 수 있다.

 

아래와 같이 index, value, dtype에 대한 내용도 확인이 가능하다.

# Series에 저장된 값 확인
print(mySeries1.values)
# 결과:[2 6 4 8]

# Index 확인
print(mySeries1.index)
# 결과: RangeIndex(start=0, stop=4, step=1)

# 데이터 형식 확인
print(mySeries1.dtype)
# 결과: int64

 

앞선 결과에서는 index를 직접 지정해주지 않아서 자동으로 0부터 3까지 지정이 되었지만, index는 다양한 자료형의 값으로 초기화가 가능하다. 아래의 코드에서는 문자와 딕셔너리를 이용해서 인덱스를 입력한다.

# 문자를 이용한 index 지정
ser_ind_char = pd.Series([2, 6, 4, 8], index = [‘a’, ‘b’, ‘c’, ‘d’])
print(ser_char)

# 딕셔너리를 이용한 index 지정
ser_ind_dict = pd.Series({‘a’ : 5, ‘b’ : 3, ‘c’ : 7, ‘d’ : 9})
print(ser_dict)

각 Series 생셩 결과

 

또한 Series의 이름을 지정할 수 있을 뿐만 아니라, index의 레이블을 지정할 수도 있다. 아래의 코드에서 확인할 수 있다.

ser = pd.Series([2, 6, 4, 8], index = ['a', 'b', 'c', 'd'])
# index 이름 지정
ser.index.name = 'even'

# Series 이름 지정
ser.name = 'series testing'
print(ser)

인덱스와 시리즈의 이름이 생성된 결과

 

좀 더 자세한 설명은 다음을 참고해도 좋을듯합니다.

https://wikidocs.net/4364