SW/주가 예측

시계열 데이터 : 정상성이란? : 개념, 분석

얇은생각 2019. 6. 29. 12:30
반응형

정상 시계열 데이터란?


우선 정상성은 무엇일까요?

평균과 분산 같은 통계적 특성이 시간에 대해 일정한 성질을 정상성이라고 합니다. 따라서 전에 포스팅 했던 랜덤과정을 기억하시나요? 정상성이 있는 랜덤 과정을 정상과정이라고 합니다.


정상 과정은 상당히 중요한 개념입니다. 우리가 살고 있는 세상을 이러한 데이터로 풀어낼 수 있어서 중요합니다.




정상 과정 시계열 데이터와 비정상과정 시계열 데이터를 알아보겠습니다. 


우선 두 그래프 모두 증감을 반복합니다. 하지만 첫번째 그래프는 평균을 기준으로 움직이는 PATTERN이 보이시나요? DATA의 움직임 또한 일정 수준을 넘어가지 않고 있습니다. 


두번째 그래프는 어떤가요? 평균값 중심이 아닌 것이 보이시나요? 변동 폭 역시 다양합니다.




연구할 데이터가 정상 시계열이라면 상당히 운이 좋다고 할 수 있습니다. 일정한 통계적 특성에 따라 움직이기 떄문입니다. 따라서 기존 시계열 데이터 모델을 사용하거나, 직접 개발하기만 하면 됩니다. 


정상성은 주식과 같은 금융 시계열 데이터에서 많이 활용되고 있습니다. 각종 수학적 이론을 제공하는 중요한 위치를 가지고 있습니다. 




주식은 정상성이 없지 않나요?

제 생각도 마찬가지입니다. 하지만, 주가 데이터를 분석, 투자하는 방법에는 정상성과 연관되어 있는 것이 많기 때문입니다.  

반응형