본문 바로가기
Quant

파이썬, 구글 코랩 / 야후 파이낸스로 주가 데이터 추출

by KTCF 2021. 7. 10.

야후 파이낸스로 주가 데이터 추출

이번에는 야후 파이낸스로 주가 데이터를 추출하는 방법을 알아보고자 한다.

데이터 분석의 꽃은 주식 데이터 분석이고, 주식 데이터 분석은 주가를 불러오는 것에서 시작한다.

 

!pip install yfiance
import pandas as pd
import yfinance as yf

우선, 구글 코랩에서 야후 파이낸스 라이브러리를 설치해야 한다.

구글 코랩에서 라이브러리를 설치할 때는 pip install이 아니라, !pip install을 사용한다.

라이브러리 설치가 완료되면 import 하자.

 

그리고 데이터 분석에 필수적인 라이브러리인 pandas도 import 하자.

 

df_aapl = yf.download('AAPL', start='2020-01-01', end='2020-12-31', progress=False)

주식 데이터를 받기 위해 다운로드 메소드를 입력했다.

AAPL은 애플의 티커이고, 2020-01-01은 추출할 데이터의 시작 범위, 2020-12-31은 데이터 추출을 종료할 범위이다.

즉, 위의 명령은 2020년 1월 1일부터 2020년 12월 31일까지의 애플 주식 데이터를 불러오라는 뜻이다.

progress는 밑에서 다시 설명하겠다.

 

결과는 위와 같이 출력된다.

* head()는 데이터프레임의 상위 5개를 불러오는 메소드

Open은 시가, High는 고가, Low는 저가, Close는 종가이다.

Adj Close는 수정주가(종가), Volume은 거래량이다.

* 수정주가는 액면분할, 증자 등의 영향을 고려한 주가

 

df_aapl = yf.download('AAPL', start='2020-01-01', end='2020-12-31')

progress=False
progress=False를 지운 경우

progress=False를 지우면, 위와 같이 나타난다.

차이는 밑에 ****100%****가 없다는 점.

즉, progress=False는 진행 막대를 표시하지 말라는 뜻이 된다.

progress를 설정하지 않거나 progress=True를 할 경우, 진행 막대가 표시된다.

 

df_aapl = yf.download('AAPL', start='2020-01-01', end='2020-12-31', progress=False, actions=True)

actions=True

이번엔 actions=True가 추가됐다.

아래 결과값을 보자.

 

Dividends와 Stock Splits가 추가됐다.

배당(Dividends)과 액면분할(Stock Splits)를 볼 수 있다.

 

df_aapl = yf.download('AAPL', start='2020-01-01', end='2020-12-31', progress=False, auto_adjust=True)

auto_adjust=True

이번에는 auto_adjust=True를 보자.

메소드 이름에서 알 수 있듯이, 수정주가를 다운로드 해달라는 메소드이다.

auto_adjust 설정 안 했을 경우
auto_adjust=True

위는 맨 처음 애플의 주식 데이터를 출력한 결과값이고, 아래는 auto_adjust=True를 적용한 결과값이다.

위는 Adj Close라는 열(Column)이 있는 반면, 아래는 Adj Close가 사라졌다.

대신, Close 열의 값이 위의 Adj Close 열의 값과 같은 것을 확인할 수 있다.

다시 말해, 종가 데이터가 수정 주가로 자동으로 변환되어 추출된 것이다.

 

끝.

댓글