본문 바로가기
반응형

파이썬4

Pandas 시작하기: 3일차, DataFrame의 깊이 있는 이해 DataFrame이란? DataFrame은 Pandas 라이브러리의 핵심 구성 요소 중 하나로, 2차원의 라벨이 붙은 데이터 구조입니다. 엑셀 스프레드시트나 SQL 테이블과 유사하며, 다양한 데이터 타입을 포함할 수 있습니다. DataFrame 생성하기 DataFrame은 여러방법으로 생성할 수 있으나, 가장 흔한 방법은 딕셔너리를 활용하는 것입니다. import pandas as pd # 딕셔너리를 사용하여 DataFrame 생성 data = { 'Name': ['John', 'Anna', 'Peter', 'Linda'], 'Age': [28, 34, 29, 32], 'City': ['New Yo.. 2024. 1. 24.
Pandas 시작하기: 1일차, 설치하고 사용해보기 Pandas란 무엇인가? Pandas는 Python 프로그래밍 언어를 위한 고성능 데이터 분석 및 조작 라이브러리 입니다. 데이터 과학자, 분석가 및 엔지니어들이 데이터를 쉽게 조작하고 분석할 수 있도록 설계되었습니다. Pandas는 크게 두가지 데이터 구조인 'Series'와 'DataFrame'을 제공합니다. Pandas 설치 Pandas를 사용하기 위해서는 먼저 설치가 필요합니다. 가장 간단한 설치 방법은 pip를 사용하는 것입니다. python과 pip의 설치 방법이 궁금하다면 링크를 따라갑니다. pip install pandas Pandas 사용을 위한 패키지 불러오기 Pandas를 사용하기 위해 Python 코드 상단에 import 구문을 추가합니다. import pandas as pd 첫 번.. 2024. 1. 22.
[python] Pandas, 데이터프레임 비교하기(pandas.DataFrame.compare()) 데이터프레임의 값을 비교하는 여러가지 방법이 있다. 언듯 생각나는 방법으로는... values, iterrows() 또는 iteritems() method와 반복문을 혼합하여 for loop으로 검토하는 방법과 compare() method를 이용하는 방법이다. 프로그래밍에 익숙하며 사후 관리 영향도를 줄이려면 반복문을 활용하는 방법이 편리한 방법일 것이며, Pandas의 강력한 기능을 최대한 활용하고자 한다면 compare()를 사용하는 것도 좋은 방법이라 판단한다. Pandas가 항상 그렇듯, 엄청나게 많은 기능을 제공하고 있음으로, 자기에게 적합한 기능을 찾고 그를 중심으로 사용하는 것이 정답에 가깝다. 1. compare 사용해보기 데이터 셋을 우선 준비해보자. df는 기본 데이터셋이며, df2는.. 2022. 2. 10.
판다스 데이터프레임과 Lambda 함수의 이해와 사용법 람다(lambda) 함수의 활용은 많은 python 개발자나 pandas 이용자들이 입을 모아 하는 말이다. 손 쉽게 적용할 수 있다고 한다. 나같은 초심자의 입장에서는 도무지 알 수가 없다. 아니, 이해는 되는데 쓸 수가 없었다. 그리고, 끝내, 원인을 찾았다. 동작절차를 모르기 때문….. 너무 당연한가? 아니, 더 정확히 말하면 DataFrame에서 x가 뭔지 몰라서 그랬다. 결론은 단순하다. df.apply( lambda x : print(x) )로 x가 무엇인지는 알고 사용하자. lambda 함수의 구조는 lambda 매개변수: 표현식 으로 이루어진다. 사실상 inline 함수선언이다. DataFrame이나 Series에서 lambda 함수를 쓰는데 매개변수 x가 무엇일까? DataFrame 에서.. 2022. 2. 4.
반응형