팬더(팬더)

pandas (software)
판다
Pandas logo.svg
원본 작성자웨스 매키니
개발자커뮤니티
초기 릴리즈2008년 1월 11일; 14년(2008-01-11)[citation needed]
안정적 해제
1.4.0[1] / 2022년 1월 22일; 8일 전(2022년 1월 22일)
리포지토리
기록 위치파이톤, 사이튼, C
운영 체제크로스 플랫폼
유형테크니컬 컴퓨팅
면허증새 BSD 라이센스
웹사이트pandas.pydata.org

판다는 데이터 조작과 분석을 위해 파이썬 프로그래밍 언어를 위해 작성된 소프트웨어 라이브러리다. 특히 수치표와 시계열 조작을 위한 데이터 구조와 연산을 제공한다. 그것은 3개 조항 BSD 라이센스에 따라 출시된 무료 소프트웨어다.[2] 이름은 "패널 데이터"라는 용어로, 동일한 개인에 대해 여러 기간에 걸친 관측치를 포함하는 데이터 세트계량학 용어에서 유래되었다.[3] 그것의 이름은 "피톤 데이터 분석"이라는 문구 자체에 있는 연극이다.[4] Wes McKinney는 2007년부터 2010년까지 AQR Capital에서 팬더가 될 것을 만들기 시작했다.[5]

라이브러리 기능

  • 통합 인덱싱을 통한 데이터 조작을 위한 DataFrame 객체
  • 인메모리 데이터 구조와 다른 파일 형식 간에 데이터를 읽고 쓰는 도구.
  • 누락된 데이터의 데이터 정렬 및 통합 처리
  • 데이터 세트 재구성 및 피벗
  • 레이블 기반 슬라이싱, 화려한 인덱싱 및 대용량 데이터 세트의 부분 집합.
  • 데이터 구조 열 삽입 및 삭제.
  • 데이터 세트에 분할 적용-결합 연산을 허용하는 엔진별 그룹화.
  • 데이터 집합 병합 및 결합.
  • 저차원 데이터 구조에서 고차원 데이터로 작업할 수 있는 계층적 축 인덱싱.
  • 시계열 기능: 날짜 범위 생성[6] 및 빈도 변환, 창 통계 이동, 창 선형 회귀 이동, 날짜 이동 및 지연.
  • 데이터 여과 기능 제공.

라이브러리는 Cython 또는 C로 작성된 중요 코드 경로가 있어 성능에 매우 최적화되어 있다.[7]

데이터프레임

판다는 주로 데이터 분석에 사용된다. 팬더는 쉼표로 구분된 값, JSON, SQL 데이터베이스 테이블 또는 쿼리, Microsoft Excel 등 다양한 파일 형식에서 데이터 가져오기를 허용한다.[8] 팬더는 데이터 클리닝, 데이터 논쟁 기능뿐만 아니라 병합,[9] 재구성,[10] 선택 [11]등 다양한 데이터 조작 작업을 할 수 있다.

역사

개발자 웨스 맥키니2008년 AQR 캐피털 매니지먼트에 재직하면서 금융 데이터에 대한 정량적 분석을 수행하기 위한 고성능의 유연한 도구가 필요하기 때문에 팬더 관련 작업을 시작했다. AQR을 떠나기 전에 그는 경영진에게 도서관을 오픈할 수 있도록 설득할 수 있었다.

또 다른 AQR 직원인 장쉐씨는 2012년에 도서관의 2대 기고자로 참여하였다.

2015년에 판다는 미국의 501(c)(3) 비영리 자선단체 NumFOCUS의 재정 후원 프로젝트로 서명했다.[12]

시간 표시줄:[13]

  • 2008: 판다 개발 시작
  • 2009: 팬더가 오픈 소스가 됨
  • 2012: Python for Data Analysis 초판이 발행됨
  • 2015: 팬더가 NumFOCUS 후원 프로젝트가 됨
  • 2018: 1인칭 코어 개발자 스프린트

참고 항목

참조

  1. ^ "Release Pandas 1.4.0".
  2. ^ "License – Package overview – pandas 1.0.0 documentation". pandas. 28 January 2020. Retrieved 30 January 2020.
  3. ^ Wes McKinney (2011). "pandas: a Foundational Python Library for Data Analysis and Statistics" (PDF). Retrieved 2 August 2018.
  4. ^ McKinney, Wes (2017). Python for Data Analysis, Second Edition. O'Reilly Media. p. 5. ISBN 9781491957660.
  5. ^ Kopf, Dan. "Meet the man behind the most important tool in data science". Quartz. Retrieved 17 November 2020.
  6. ^ "pandas.date_range – pandas 1.0.0 documentation". pandas. 29 January 2020. Retrieved 30 January 2020.
  7. ^ "Python Data Analysis Library – pandas: Python Data Analysis Library". pandas. Retrieved 13 November 2017.
  8. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html
  9. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html
  10. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html
  11. ^ https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html
  12. ^ "NumFOCUS – pandas: a fiscally sponsored project". NumFOCUS. Retrieved 3 April 2018.
  13. ^ "pandas - Python Data Analysis Library". pandas.pydata.org. Retrieved 29 September 2021.

추가 읽기

  • McKinney, Wes (2017). Python for Data Analysis : Data Wrangling with Pandas, NumPy, and IPython (2nd ed.). Sebastopol: O'Reilly. ISBN 978-1-4919-5766-0.
  • Molin, Stefanie (2019). Hands-On Data Analysis with Pandas: Efficiently perform data collection, wrangling, analysis, and visualization using Python. Packt. ISBN 978-1-7896-1532-6.
  • Chen, Daniel Y. (2018). Pandas for Everyone : Python Data Analysis. Boston: Addison-Wesley. ISBN 978-0-13-454693-3.
  • VanderPlas, Jake (2016). "Data Manipulations with Pandas". Python Data Science Handbook: Essential Tools for Working with Data. O'Reilly. pp. 97–216. ISBN 978-1-4919-1205-8.
  • Pathak, Chankey (2018). Pandas Cookbook. pp. 1–8.

외부 링크