728x90
반응형
pandas란
파이썬 언어로 작성된 데이터를 분석 및 조작하기 위한 소프트웨어 라이브러리
자료 구조
Series, DataFrame, Panel 이 있다.
Series
- 1차원 데이터로 레이블링 되어진 배열.
- 모든 데이터 타입을 가질 수 있음.
- 파이썬의 딕셔너리(dictionary)와 유사하며 series <>dictionary형 변환 가능
import pandas as pd
pd_series = pd.Series(index=['language', 'library'], data=['python', 'pandas'])
print(pd_series)
DataFrame
- 2차원 데이터로 레이블링 되어진 배열
- 여러개의 series로 구성됨
import pandas as pd
import pandas as pd
pdDataFrame = pd.DataFrame({
'data scientist': pd.Series(index=['language', 'library'], data=['python', 'pandas']),
'web programmer': pd.Series(index=['language', 'library'], data=['java', 'Lombok'])
});
pdDataFrame
Panel
- 3차원 데이터로 레이블링 되어진 배열
참고사이트
pandas - 나무위키
- 통합 인덱싱을 활용한 데이터 조작을 가능하게 하는 데이터프레임(DataFrame) 오브젝트 - 인메모리(in-memory) 데이터 구조와 다양한 파일 포맷들 간의 데이터 읽기/쓰기 환경 지원 - 데이터 결측치
namu.wiki
pandas.pydata.org/docs/reference/index.html
API reference — pandas 1.2.3 documentation
This page gives an overview of all public pandas objects, functions and methods. All classes and functions exposed in pandas.* namespace are public. Some subpackages are public which include pandas.errors, pandas.plotting, and pandas.testing. Public functi
pandas.pydata.org
728x90
반응형