본문 바로가기
반응형

python14

Pandas 시작하기: 4일차, 데이터 불러오기 및 탐색하기 데이터 불러오기 Pandas의 가장 강력한 기능 중 하나는 다양한 형식의 데이터를 쉽게 불러올 수 있다는 점입니다. 가장 일반적인 형식은 CSV(쉽표로 구분된 ASCII 데이터) 파일입니다. import pandas as pd # CSV 파일 불러오기 df = pd.read_csv('path/to/your/file.csv') # 처음 몇 줄 확인 print(df.head()) Pandas는 CSV 외에도 Excel, JSON, SQL 데이터베이스 및 다양한 파일 형식을 지원합니다. 데이터 탐색 메소드 데이터를 불러온 후, 기본적인 탐색을 통해 데이터의 개요를 파악할 수 있습니다. 'head()', 'tail()': 데이터프레임의 처음과 끝 부분을 보여줍니다. 'info()': 열 데이터 타입, 누락된 값.. 2024. 1. 25.
Pandas 시작하기: 3일차, DataFrame의 깊이 있는 이해 DataFrame이란? DataFrame은 Pandas 라이브러리의 핵심 구성 요소 중 하나로, 2차원의 라벨이 붙은 데이터 구조입니다. 엑셀 스프레드시트나 SQL 테이블과 유사하며, 다양한 데이터 타입을 포함할 수 있습니다. DataFrame 생성하기 DataFrame은 여러방법으로 생성할 수 있으나, 가장 흔한 방법은 딕셔너리를 활용하는 것입니다. import pandas as pd # 딕셔너리를 사용하여 DataFrame 생성 data = { 'Name': ['John', 'Anna', 'Peter', 'Linda'], 'Age': [28, 34, 29, 32], 'City': ['New Yo.. 2024. 1. 24.
Pandas 시작하기: 1일차, 설치하고 사용해보기 Pandas란 무엇인가? Pandas는 Python 프로그래밍 언어를 위한 고성능 데이터 분석 및 조작 라이브러리 입니다. 데이터 과학자, 분석가 및 엔지니어들이 데이터를 쉽게 조작하고 분석할 수 있도록 설계되었습니다. Pandas는 크게 두가지 데이터 구조인 'Series'와 'DataFrame'을 제공합니다. Pandas 설치 Pandas를 사용하기 위해서는 먼저 설치가 필요합니다. 가장 간단한 설치 방법은 pip를 사용하는 것입니다. python과 pip의 설치 방법이 궁금하다면 링크를 따라갑니다. pip install pandas Pandas 사용을 위한 패키지 불러오기 Pandas를 사용하기 위해 Python 코드 상단에 import 구문을 추가합니다. import pandas as pd 첫 번.. 2024. 1. 22.
[python] SyntaxError: Non-UTF-8 code starting with '\xbe' 라즈베리파이(ARM 기반 리눅스)에서 작성하던 파이썬 스크립트를 윈도우10에서 실행하려다 에러메세지를 만났다. 잘 돌아가던 스크립트인데... SyntaxError: Non-UTF-8 code starting with '\xbe' '\xbe'로 시작하는 UTF-8 인코딩 방식이 아닌 문자가 등장했다는 에러로 보인다. 실제로 그런 문자를 쓴 적은 없지만, 파이썬이 스크립트 파일의 인코딩 방식에 따라 ANSI(ascii) 인 줄 알고 스크립트를 해석하다가 2 Byte 문자인 한글을 만나자 내가 작성한 한글주석의 첫 문자를 1 Byte 씩 나누어 해석하는 과정에서 오해가 발생한 듯 하다. 해결방법: 코드 제일 위에 한 줄 추가 (UTF-8로 해석하라고 알려 주자) # -*- coding: utf-8 -*- 주석.. 2022. 3. 21.
[python] Stochastic 오실레이터 그리기 스토캐스틱(Stochastic) 말고도 다양한 오실레이터(oscillator)가 있다. 오실레이터가 익숙한 사람들은 보통 공대생일 텐데, 오실레이터란 표현을 주가 분석에서 쓰는 이유는 공대의 그것과 동일한 의미를 가지기 때문이다. 오실레이터란 반복적이고 주기적인 신호를 생성하는“진동자” 주가는 투자의 심리적 요인으로 가만히 있질 못하고 오르내리는 성향이 있다. 그 성질이 크기도 하고 작은 경우도 있지만, 많은 투자자들은 소위 “발라먹는다”라며 올랐을 때 팔고 내려왔을 때 사서 이익을 극대화하기 위해 주가의 변동을 측정하려는 시도를 했다. 달리말하자면, 투자가 몰린 과매수 상태와 과매도 상태를 확인하기 위한 시도로 오실레이터가 등장하였다. Stochastic Ocillator란 그 중 가장 빨리 태어난 측.. 2022. 3. 11.
[python] 네이버금융 주요 재무정보 스크래핑 사경인 회계사는 "재무제표를 모르면 주식투자 절대로 하지마라" 라는 제목으로 책을 집필한 바 있다. 사 회계사의 의도는 책을 찬찬히 읽어본 이후에야 알 수 있겠지만, 핵심적인 사항은 주식투자 대상을 선정함에 있어 해당 기업의 사업모델과 미래 가치를 평가할 때 재무정보를 빼놓지 않아야 한다는 것이다. 1. 재무정보를 보기 쉬운 방법 포털사이트는 재무정보를 얻기 가장 쉬운 곳 중 하나이다. 에프앤가이드와 같은 재무정보 제공회사를 통해 비용을 지불하고 정제된 데이터를 무료로 제공하고 있기 때문이다. 우리나라의 대표적인 포털사이트인 네이버와 다음(Daum)은 FnGuide를 통해 같은 수준의 정보를 제공하고 있다. 네이버나 다음과 같은 포털사이트가 접근하기 가장 편리한 사이트이겠지만, 이 두 사이트의 원문을 보.. 2022. 2. 26.
[app] 한국주식의 종목별 MDD(최대낙폭) 확인하기 최대낙폭(MDD) 확인하기 과거 차트에 기반한 최대예상손실을 미리 확인하거나, 최소한 손실을 확정하기 전에라도 확인하기 위해 MDD를 확인하는 것이 좋은데 HTS나 MTS에서 기능을 제공하지 않아서 만들었다. (목이 말라서 우물을 팠다) 종목명 (기본값: 삼성전자) 낙폭계산기간 (기본값: 3개월) 시작날짜 (기본값오늘로 부터 520주=10년 전) 위 3개 인자를 아래에 입력하면 최대낙폭을 그래프로 보여준다. 종료일자는 오늘 날짜이며, 낙폭계산기간은 보유예정(계좌에 두고 참을 수 있는)기간을 입력하는 것이 좋다. 참고로, 값을 변경하면(엔터를 치면) 자동으로 아래 그래프가 변경되는 방식이다. (Heroku로 앱을 배포하고 있는데, Heroku 서버의 초기 반응이 매우 느려서, 최초 로딩 시 20초 가까이 .. 2022. 2. 14.
[python] Pandas, 데이터프레임 비교하기(pandas.DataFrame.compare()) 데이터프레임의 값을 비교하는 여러가지 방법이 있다. 언듯 생각나는 방법으로는... values, iterrows() 또는 iteritems() method와 반복문을 혼합하여 for loop으로 검토하는 방법과 compare() method를 이용하는 방법이다. 프로그래밍에 익숙하며 사후 관리 영향도를 줄이려면 반복문을 활용하는 방법이 편리한 방법일 것이며, Pandas의 강력한 기능을 최대한 활용하고자 한다면 compare()를 사용하는 것도 좋은 방법이라 판단한다. Pandas가 항상 그렇듯, 엄청나게 많은 기능을 제공하고 있음으로, 자기에게 적합한 기능을 찾고 그를 중심으로 사용하는 것이 정답에 가깝다. 1. compare 사용해보기 데이터 셋을 우선 준비해보자. df는 기본 데이터셋이며, df2는.. 2022. 2. 10.
[python, plotly] 캔들(candlestick) 차트 그리기 각 단계는 10분 이상을 소요하지 않도록 설계했다. (아마도 이해하는데는 1~2분?) 1. 캔들차트(봉차트)란? 봉차트는 생김새가 양초처럼 생겨 캔들차트라고도 불린다. 캔들차트는 기술적 분석을 위한 가장 기초적인 차트로 활용되는데, 일정기간(보통, 하루) 동안의 시가, 시작(Open) 고가, 최고지점(High) 저가, 최저지점(Low) 끝, 마지막(Close) 을 한눈에 표시하는 표기법이다. 자세한 설명은 생략한다. 하루 이상 차트를 보았다면, 모를리 없는 바로 그 차트. 그래도 모르는 사람들을 위해 내가 좋아하는 슈카의 영상을 남긴다. 30분 10초(자동시작 설정해둠)부터 한 4분 정도 보고도 심심하면 처음부터 다시 보시길... 2. 차트 데이터 수집하기 내 블로그의 2개 다른 글을 통해 종목코드를 받.. 2022. 2. 5.
티스토리 블로그에 Plotly 그래프 넣기 1. Plotly 란? plotly.com 잘은 모르겠다. 자바스크립트에 기반한 시각화 모듈이다. 맷플롯립(MatPlotLib) 보다 훨씬 깔끔하고 다양한 기능을 제공한다. enterprise 비즈니스모델이 있어서 그런지 세세하기 들어가기 시작하면 설명이 그렇게 친절하지 않은 점은 있으나, 사용자 커뮤니티를 활용하면 되는 거니까. 중요한건, Interactive 하면서 동시에 fancy 한 시각화가 가능한데, 간편하다는 것. 2. 설치하기 티스토리에 그래프를 넣기 위해서는 구조만 이해하면 되기 때문에 python 및 plotly library의 클라이언트 설치는 불필요하다. 하지만, python으로 코드를 짤 사람들만 pip을 이용하자. $ pip install plotly [참고] 데이터구조 plotl.. 2022. 2. 5.
반응형