R 데이터 분석을 위해서 기본이 되는 R언어에 대해서 학습을 시작하도록 하겠습니다. 특별히 데이터 분석을 할때 데이터의 종류가 보통 1차원 데이터하고 2차원 데이터를 대상으로 합니다. 이번 포스팅에서는 1차원 데이터를 분석하는데 있어서 R언어를 어떻게 사용할까에 초점을 두고 알아보겠습니다.
들어가기에 앞서서 R언어의 특징을 한번 알아보겠습니다. R언어는 기본적으로 자료분석이나 통계작업에 특화된 소프트웨어로 알려져 있습니다. 일반적으로 컴퓨터를 이용해서 계산 작업을 많이 합니다.
그 계산기로도 R을 쓸수가 있습니다. R이 프로그래밍 언어하고도 비슷하다 라는 느낌을 받게되는데 맞습니다. R을 이용해서 간단한 프로그래밍도 가능합니다. 또 R은 자료분석이나 통계분석을 위해서 굉장히 많은 함수들 그리고 패키지 이런것들을 무료로 제공하기때문에 우리가 학습용으로 뿐만아니라 실제로 데이터 분석을 위한 업무용으로도 손색이 없는 그런 공개 소프트웨어입니다.
그리고 이제 Java나 C같은 전통적인 프로그래밍 언어들이 있죠. 그런 언어들하고 연동도 가능하기때문에 활용도가 매우 높습니다. 이런 장점에도 불구하고 소프트웨어의 크기가 100M 이내이기 때문에 굉장히 compact해서 노트북과 같은 그런 작은 컴퓨터에서도 실행이 잘 됩니다. 무엇보다 제일 좋은점은 오픈소스 소프트웨어이기 때문에 무료로 이용할 수 있는 게 큰 장점입니다.
또 일반적으로 R의 장점을 얘기하면 시각화 기능 뛰어난 시각화 기능을 많이 얘기합니다. 위처럼 R을 이용하면 굉장히 화려하고 복잡하고 다양한 형태의 그래프를 그릴 수가 있게 되기때문에 사람들이 많이 활용합니다.
보통 자료분석을 위한 도구 크게 두가지를 얘기를 합니다. 하나는 이제 파이썬이라고 하는 훌륭한 도구와 R입니다. 이 두가지가 데이터 분석 작업에는 많이 쓰이는 도구가 되는데 사실 어느것이 더 좋으냐 이것은 말하기가 좀어렵습니다. 그냥 파이썬은 파이썬 나름대로의 장점이 있고 R은 R나름대로의 장점이 있기 때문입니다. 그런데 현재까지는 순수하게 데이터분석 이 부분만 보면 R이 조금 더 파이썬에 비해 많이 쓰이고있는 언어입니다.
R을 처음 설치하면 R에서 기본적으로 제공해주는 사용자 인터페이스가 있습니다. 그런데 이것은 기능이 단순하기 때문에 조금 더 분석작업을 잘할 수 있도록 도와주는 R스튜디오를 활용하기 때문에 실제로 R에서 제공하는 인터페이스를 이용할 일은 잘 없지만 기억을 해두면 좋습니다.
자 그러면 이제 본격적으로 R을 사용해보도록 할까요. R을 가장 기본적으로 사용하는 방법은 계산기로 쓰는겁니다. 윈도우에도 계산기 어플이 있죠. 그것처럼 R도 계산을 위해서 쓸수가 있습니다. 즉, 대화식으로 반응하면서 결과를 내어 주는 툴입니다.
계산기로 이용하자고 하면 보통 많이 사용하는 연산자들이 있겠죠? 여기에 있는 것처럼 사칙연산자들을 많이 씁니다. 더하기, 빼기, 곱하기, 나누기가 대표적입니다. 꺽쇠는 제곱입니다. 그리고 그 연산자 중에 퍼센트기호 두개는 나머지 연산자입니다.
그 다음에 명령어 뒷부분에 보면 #하고서 파란색 글씨로 되있는 부분이 보입니다. # 다음에 내용을 쓰게 되면 주석문으로 설명해주는 역할을 합니다. 그러기 때문에 이것은 실제로 실행이 되지 않습니다.
즉 주석문 부분은 실제 실행을 할때는 무시가 됩니다. 다만 명령어를 편집해서 저장을 해놓으면 이 명령이 어떤것인지 나중에 이해하기 쉽게 하도록 그런 용도로 주석문을 씁니다.
그다음에 R에서 제공하는 기본적인 함수들이 있습니다. 어떤 단어 나오고 괄호 열고 닫고 나오면 아 이건 함수다 이렇게 이해하면 됩니다. log함수, 제곱근, 두값중에 큰값을 알려주는 max 함수 들이 있습니다. 예를 들면 max함수 같은 경우는 max (5,3) 그러면 5하고 3중에서 더 큰수가 무엇인지를 찾아 그 수를 알려주는 함수입니다.
'SW > R' 카테고리의 다른 글
R : 벡터(vector) 개념 및 예제 (0) | 2019.01.29 |
---|---|
R : 변수(variable) 개념 및 예제 (0) | 2019.01.29 |
R, RStudio 설치 방법 (0) | 2019.01.10 |
빅데이터 개념 (0) | 2019.01.09 |
데이터 시대 개념 (0) | 2019.01.09 |