본문으로 바로가기

[pandas]pandas란

category 데이터 분석pandas 4년 전
728x90
반응형

pandas란

파이썬 언어로 작성된 데이터를 분석 및 조작하기 위한 소프트웨어 라이브러리

자료 구조

Series, DataFrame, Panel 이 있다.

Series

  • 1차원 데이터로 레이블링 되어진 배열.
  • 모든 데이터 타입을 가질 수 있음.
  • 파이썬의 딕셔너리(dictionary)와 유사하며 series <>dictionary형 변환 가능
import pandas as pd

pd_series = pd.Series(index=['language', 'library'], data=['python', 'pandas'])
print(pd_series)

DataFrame

  • 2차원 데이터로 레이블링 되어진 배열
  • 여러개의 series로 구성됨
import pandas as pd
import pandas as pd
pdDataFrame = pd.DataFrame({
    'data scientist': pd.Series(index=['language', 'library'], data=['python', 'pandas']),
    'web programmer': pd.Series(index=['language', 'library'], data=['java', 'Lombok'])
});
pdDataFrame

Panel

  • 3차원 데이터로 레이블링 되어진 배열

 

참고사이트

namu.wiki/w/pandas

 

pandas - 나무위키

- 통합 인덱싱을 활용한 데이터 조작을 가능하게 하는 데이터프레임(DataFrame) 오브젝트 - 인메모리(in-memory) 데이터 구조와 다양한 파일 포맷들 간의 데이터 읽기/쓰기 환경 지원 - 데이터 결측치

namu.wiki

pandas.pydata.org/docs/reference/index.html

 

API reference — pandas 1.2.3 documentation

This page gives an overview of all public pandas objects, functions and methods. All classes and functions exposed in pandas.* namespace are public. Some subpackages are public which include pandas.errors, pandas.plotting, and pandas.testing. Public functi

pandas.pydata.org

 

728x90
반응형