본문 바로가기

투자/퀀트19

파이썬, 구글 코랩 / 야후 파이낸스로 주가 데이터 추출 이번에는 야후 파이낸스로 주가 데이터를 추출하는 방법을 알아보고자 한다. 데이터 분석의 꽃은 주식 데이터 분석이고, 주식 데이터 분석은 주가를 불러오는 것에서 시작한다. !pip install yfiance import pandas as pd import yfinance as yf 우선, 구글 코랩에서 야후 파이낸스 라이브러리를 설치해야 한다. 구글 코랩에서 라이브러리를 설치할 때는 pip install이 아니라, !pip install을 사용한다. 라이브러리 설치가 완료되면 import 하자. 그리고 데이터 분석에 필수적인 라이브러리인 pandas도 import 하자. df_aapl = yf.download('AAPL', start='2020-01-01', end='2020-12-31', progres.. 2021. 7. 10.
Time Series 2: 시계열 모형 소개 시계열 모형 대표적인 시계열 모형은 다음과 같다. - Autoregressive Model(AR모형): 현재 시계열이 과거 시계열 데이터에 종속되는 모형. 데이터는 random walk와 유사하다. 평균회귀 특성을 가진다. - Moving Average Model(MA모형): 현재 시계열이 과거 잔차의 가중 평균으로 구성되는 모형. 현재 데이터 는 과거 white noise의 평균으로 설명된다. 평균회귀 특성을 가진다. - Autoregressive Moving Average Model(ARMA모형): AR model과 MA model을 혼합한 모형. 현재 시계열은 과거 시계열 데이터와 과거 잔차의 조합으로 설명된다. ARMA model 역시 평균회귀 특성이 있다. 따라서 stationary한 시계열 분.. 2020. 5. 11.
Time Series 1: Stationary(정상성) vs. Non-Stationary(비정상성) Time Series(시계열) 시계열 데이터: 시간에 따라 값이 관측되는 데이터. 금융 시계열 데이터로는 대표적으로 주가, 거래량 등이 있다. 시계열 데이터는 일반적으로 i.i.d(identical independent distribution)가 성립하지 않는다. 위를 통해 알 수 있듯이 삼성전자 주가의 수익률은 정규분포를 가정하고 그린 랜덤워크 보다 이상값이 자주 관측되고 있다. 시계열 데이터가 가지는 특징은 다음과 같다. - Trends(추세성) - Volatility(변동성) - Seasonality(계절성) - Aberration(이변성) - Nonlinearity(비선형성) Stationary(정상성) vs. Non-stationary(비정상성) 시계열 데이터가 가진 중요한 특징이다. 시계열 분.. 2020. 4. 26.
VaR 구하기 1 VaR 개요 VaR(Value at Risk): 자산 포트폴리오의 특정 기간 동안의 손실 위험을 변동성에 기반해 측정한 '최대예상손실액'. 조건이 주어질 때 발생할 수 있는 최대 손실 가능액이다. 특정 기업이 '위험'을 겪고 살아남을 수 있을지를 '숫자'로 표현하기 위해서 사용된다. 𝑝=ℙ[X>𝑉𝑎𝑅]=1−𝐹(𝑉𝑎𝑅) 과 같이 계산될 수 있다. VaR에 영향을 끼치는 요소로는 1. 확률 2. 듀레이션 3. 포트폴리오의 분포 4. MTM 이 있다. Historical VaR를 구해보자 삼성전자의 역사적 데이터를 바탕으로 VaR을 구했다. 기간은 2010년 1월 1일부터 2020년 1월 31일까지로 설정했다. 이 값을 해석하면 다음과 같다 VaR(5%)는 95%의 신뢰도로 투자금의 손해가 2.65%를 넘지 .. 2020. 3. 26.
Efficient Frontier와 Capital Market Line 그리기 Efficient Frontier 개요 Efficient Frontier(효율적 투자선)은 서로 다른 위험-수익률로 구성된 종목들 중 지배원리에 따라 가장 우수한 종목들을 연결한 선이다. **지배원리: 같은 위험 하에서 기대수익률이 높은 종목이 기대수익률이 낮은 종목을 지배한다는 원리(기대수익률이 같을 경우는 낮은 위험이 superior 하다) 즉, 포트폴리오 비중을 어떻게 구성하느냐에 따라 더 높은 수익률과 더 낮은 위험을 기대할 수 있다는 것이다. Efficient Frontier를 그려보자 포트폴리오는 Apple, Goldman Sachs, Gold ETF로 구성했고, 기간은 2010년 1월 1일부터 2020년 1월 31일까지로 설정했다. 구성한 세 종목의 정규화된 가격 추이를 보자. 골드만삭스와 .. 2020. 3. 18.
CAPM α 와 β 구하기 CAPM 개요 CAPM(Capital Asset Pricing Model): 𝐸(𝑅𝑖)=𝑅𝑓+𝛽𝑖(𝐸(𝑅𝑀)−𝑅𝑓) where 𝐸(𝑅𝑖) = 자산 i의 기대수익률, 𝑅𝑓= 무위험이자율, 𝐸(𝑅𝑀) = 시장수익률, 𝛽𝑖=𝑐𝑜𝑣(𝑅𝑖,𝑅𝑀)/𝑣𝑎𝑟(𝑅𝑀) CAPM(자본자산가격결정모형)은 시장위험율이 주어져 있을 때, 개별 자산(포트폴리오)의 가격을 구할 수 있는 모형이다. 리스크 요인이 하나만 있는 모형으로, 이때 리스크는 시장 지수가 된다. 즉, 시장 지수와 연동돼서 수익률이 나타나게 된다는 것이다. 이때 β는 민감도로, 종목의 수익률이 시장 지수에 대해 얼마나 반응하는지이다. 만약 시장보다 반응하는 정도가 크다면 β 값이 1보다 크게 나타날 것이고 그렇지 않다면 β 값이 1보다 작게 나타날 것이다. CA.. 2020. 3. 10.
퀀트 투자 / Weekend Effect(주말효과) 검증하기 - 주식시장 가설 검증, 삼성전자 주말효과, 주식 기술적 분석, 요일별 수익률, 주식 파이썬 코딩 Weekend Effect(주말효과) : 주식시장에서 월요일에 평균 수익률이 낮고, 주말인 금요일에 평균 수익률이 높게 나타난다는 효과. 정보효과 가설에 입각해 기업의 나쁜 정보가 있을 때, 기업이 의도적으로 해당 정보를 폐장 이후에 발표하므로 월요일의 수익률이 특히 낮다는 가설이다. 윗 가설이 맞다면 주가는 요일 별 계절성을 띌 것이다. 따라서 해당 가설이 맞는 지 직접 검증해 보자. 종목은 삼성전자, SK하이닉스, 네이버, 현대차, 셀트리온, LG화학, 포스코, 신한지주, SK텔레콤, 카카오를 선정했다. 제조업 그리고 IT 위주로 선정했다. 파이썬으로 코딩했으며, yahoo finance api를 활용해서 10년 치 데이터를 제공 받았다. 이를 정규화 과정을 거친 후, 요일 별 수익률을 구했다. 윗 .. 2020. 2. 17.