반응형
시계열 데이터란?
시계열 데이터는 순서를 갖는 데이터를 의미합니다. 즉, 일정한 시간 간격을 측정되거나, 순서가 존재하는 데이터인 것입니다.
이것은 결국, 시간의 흐름에 따라 값이 변하는 데이터라 할 수 있습니다.
예를 들면 어떤 것이 있을까요?
온도 정보, 주가 정보, 환율 정보 등등이 그 예라 할 수 있습니다.
시계열 데이터는 시간의 흐름이 존재합니다. 그리고 그 흐름에 따라 변수가 변화합니다. 이 변화를 보여주는 것을 통해, 데이터에 순서가 있고, 그 값이 끊임없이 변해갑니다.
즉, 시계열 데이터가 시간이라는 독립 변수에 의해 영향을 받고, 종속변수와의 관계를 나타내는 것이라 할 수 있습니다.
시계열 데이터가 아닌 데이터를 처리하는 경우를 생각해 봅시다. 이경우에는 데이터의 순서를 변형하거나 필요에 따라 데이터를 정렬해도 상관이 없습니다.
하지만, 시계열 데이터는 시간의 값에 따라 변수의 변화량을 나타냅니다. 그러므로, 순서를 바꾸거나 무작위로 데이터를 추출하면 그 데이터는 의미가 없어지는 것입니다.
그리고 시계열 데이터에 또 중요한 것은 일정한 간격으로 측정되어야 하는 것입니다. 만약 불규칙한 간격으로 데이터를 측정하면, 무의미해지겠죠? 따라서 데이터를 수집할 떄는 반드시 동일한 방법을 측정해야 합니다. 그래야만, 데이터가 객관성을 가지게 됩니다.
반응형
'SW > 주가 예측' 카테고리의 다른 글
주식, 비트 코인 예측 : 알고리즘 트레이딩 시스템 SW 구성 (0) | 2019.06.27 |
---|---|
주식, 비트 코인 예측 : 시계열 데이터 분석 : 개념, 목표, 정의 (0) | 2019.06.27 |
python, 통계 : 공분산 개념, 예제 (0) | 2019.06.26 |
python : 주식 데이터 파싱, 저장, 받아오기 : 예제 (0) | 2019.06.25 |
비트코인 주식 예측 프로그램 : 파이썬, 텐서플로우, 케라스, RNN 예제 (23) | 2019.06.14 |