SW/주가 예측

시계열 데이터 : 특성, 특징, 개념, 중요한 점

얇은생각 2019. 6. 28. 12:30
반응형



시계열 데이터의 특성


핸들링 하려는 데이터가 어떤 시계열적 특성이 있는지를 아는 것은 매우 중요합니다.


이미 많은 모델이 연구되어 있습니다. 그리고, 끊임없이 연구가 되고 있으므로, 시계열 데이터의 특성을 명확히 알 수 있다면, 좋은 모델을 적용해 좋은 성과를 얻을 수 있습니다.



주요 특성들


Abrupt Change : 데이터가 가파른 변동을 보이는지


Outliers : 다른 값들과 동떨어진 Outlier가 관측되는지


Trend : 측정 값이 시간의 흐름 에 따라 증감, 반복을 하는 일정한 Pattern, 경향이 있는지


Seasonality : 일, 월, 년, 계절 등 일정 시간에 따라 지속해서 반복되는 Pattern이 있는지


Constant Variance : 측정값이 일정한 수준 이내로 변동되는지, 변동이 랜덤하게 발생하는지


Long-run Cycle : 오랜 기간 반복되는 Pattern이 있는지




시계열의 데이터의 특징을 볼 떄 중요한 점은 무엇이 있을까요?


바로 데이터의 범위라고 할 수 있습니다. 같은 데이터에도 불구하고, 범위에 따라 패턴을 발견할 수 있습니다. 반대로 범위에 따라 패턴을 발견하지 못할 수 있습니다. 


주가 그래프에서도 알 수 있습니다. 시계열 데이터는 아무리 같은 데이터라고 하더라도, 그 범위에 한정해서 데이터를 본다면 패턴과 트렌드과 다르게 파악될 수 있습니다.  또한 패턴과 트렌드를 발견하지 못할 수도 있습니다. 따라서 시계열 데이터를 분석할 때에는 이러한 특성을 주의하여야 합니다.





반응형