본문 바로가기
파이썬 (투자분석용)/Pandas 및 python 일반

Pandas 시작하기: 2일차, Series 사용해보기

by amAToRoi 2024. 1. 23.
반응형

Pandas Series란?

Pandas Series는 일련의 데이터를 1차원 배열로 나타내는 객체입니다. DataFrame의 단일 열과 유사하지만, Series 자체로도 다양한 데이터 조작과 분석이 가능합니다.

Series 생성하기

Pandas Series는 리스트, 배열 외 파이썬의 기본 자료형 등 다양한 데이터 소스로부터 생성할 수 있습니다.

import pandas as pd
# 리스트를 이용한 Series 생성

data = [1, 3, 5, 7, 9]  
series = pd.Series(data)

print(series)
''' 출력
0    1
1    3
2    5
3    7
4    9
dtype: int64
'''

이 코드는 간단한 숫자 리스트를 이용하여 Series를 생성하고 출력합니다.

인덱싱(indexing)과 선택

Series에서 데이터를 선택하는 것은 Python 리스트나 배열과 유사합니다. 위치를 기반으로 한 선택 또는 라벨(label)을 기반으로 한 선택이 가능합니다.

# 위치를 이용한 선택
print(series[2])
''' 출력
5
'''

# 라벨을 이용한 선택 (인덱스를 지정하지 않았으므로 위치 인덱스가 라벨로 사용됩니다)
print(series[0:3])
''' 출력
0    1
1    3
2    5
dtype: int64
'''

Series 내부 메소드

Series는 다양한 메소드와 속성을 가지고 있습니다. 'max()', 'min()', 'mean()' 등의 메소드를 사용하여 기본적인 통계 계산을 할 수 있습니다.

# 기본 통계 메소드 사용 예
print(series.max())
''' 출력
9
'''
print(series.mean())
''' 출력
5.0
'''

결론

Series는 Pandas에서 데이터를 효과적으로 다루기 위한 기본적인 요소입니다. 다양한 데이터 유형에 대한 간단한 조작과 분석을 가능하게 합니다. Series 하위 메소드에 관한 자료는 판다스 문서를 참조하시기 바랍니다.

반응형

댓글