SW/Python

R과 Python : 차이점은 무엇이고 뭐가 더 좋을까?

얇은생각 2019. 9. 7. 07:30
반응형

R과 Python은 모두 커뮤니티가 큰 오픈 소스 프로그래밍 언어입니다. 새로운 라이브러리 또는 도구는 해당 카탈로그에 지속적으로 추가됩니다. R은 주로 통계 분석에 사용되는 반면 Python은 데이터 과학에 대한보다 일반적인 접근 방식을 제공합니다.

R과 Python은 데이터 과학을 지향하는 프로그래밍 언어 측면에서 최신 기술입니다. 물론 두 가지를 모두 배우는 것이 이상적인 솔루션입니다. R과 Python에는 시간 투자가 필요하며 그러한 사치는 모든 사람에게 제공되지는 않습니다. 파이썬은 문장을 읽을 수 있는 범용 언어입니다. 그러나 R은 통계학자가 작성했으며 특정 언어를 포함합니다.

 


R

학계와 통계 학자들은 20년 동안 R을 개발했습니다. R은 이제 데이터 분석을 수행 할 수있는 가장 풍부한 생태계 중 하나입니다. CRAN (오픈 소스 저장소)에는 약 12000 개의 패키지가 있습니다. 수행하려는 분석에 대한 라이브러리를 찾을 수 있습니다. 다양한 라이브러리 덕분에 R은 통계 분석, 특히 특수 분석 작업에 가장 적합합니다.

R과 다른 통계적인 차이는 출력입니다. R에는 결과를 전달하는 환상적인 도구가 있습니다. Rstudio는 라이브러리 knitr와 함께 제공됩니다. 결과물을 프리젠 테이션이나 문서로 쉽게 전달할 수 있습니다.

 

 


파이썬

파이썬은 R과 거의 같은 작업을 수행 할 수 있습니다 : 데이터 핸들링, 엔지니어링, 기능 선택, 웹 스크랩 핑, 앱 등. Python은 대규모로 기계 학습을 배포하고 구현하는 도구입니다. 파이썬 코드는 R보다 유지 관리가 쉽고 강력합니다. 파이썬에는 많은 데이터 분석 및 기계 학습 라이브러리가 없었습니다. 최근에 Python은 따라 잡고 기계 학습 또는 인공 지능을 위한 최첨단 API를 제공합니다. 데이터 과학 작업의 대부분은 Numpy, Pandas, Scipy, Scikit-learn 및 Seaborn의 5 개의 Python 라이브러리로 수행 할 수 있습니다.

반면에 파이썬은 R보다 복제성 및 접근성을 더 좋게 만듭니다. 실제로 응용 프로그램이나 웹 사이트에서 분석 결과를 사용해야 하는 경우 Python이 최선의 선택입니다.

 

 


인기 지수

IEEE 스펙트럼 순위는 프로그래밍 언어의 인기도를 정량화하는 지표입니다. 왼쪽 열은 2017 년 순위와 2016년 오른쪽 열을 보여줍니다. 2017 년에 파이썬은 1년 전 3위에 비해 1 위를 차지했습니다. R은 6 위입니다.

 

 

 

직업 기회

채용 공고 JD 비율

위 그림은 프로그래밍 언어 별 데이터 과학과 관련된 채용 공고 JD 비율을 보여줍니다. SQL이 훨씬 앞선 다음 Python과 Java가 뒤 따릅니다. R은 5 위입니다.

 

파이썬 (노란색)과 R (파란색) 사이의 장기적인 추세에 초점을 맞추면, 파이썬이 업무 설명에서 R보다 더 자주 인용되는 것을 볼 수 있습니다.

 

 

 

R과 Python이 수행한 분석

분석한 비율

그러나 데이터 분석 작업을 살펴보면 R이 가장 좋은 도구입니다.

 

 

 

전환하는 사람의 비율

전환 비율

위 그림에는 두 가지 핵심 사항이 있습니다.
- 파이썬 사용자는 R 사용자보다 더 충성합니다
- Python으로 전환하는 R 사용자의 비율은 Python에서 R보다 두 배입니다.

 

 

 

R 또는 파이썬 사용법

Python은 1991년경 컴퓨터 전문가 Guido van Rossum에 의해 개발되었습니다. Python에는 수학, 통계 및 인공지능을 위한 영향력있는 라이브러리가 있습니다. 머신 러닝에서 파이썬을 순수한 플레이어라고 생각할 수 있습니다. 그러나 파이썬은 아직 계량 경제와 의사 소통을 위해 완전히 성숙하지는 않습니다. Python은 머신 러닝 통합 및 배포를 위한 최상의 도구이지만 비즈니스 분석에는 적합하지 않습니다.

좋은 소식은 R이 학자와 과학자에 의해 개발되었다는 것입니다. 통계 문제, 기계 학습 및 데이터 과학에 대답하도록 설계되었습니다. R은 강력한 통신 라이브러리로 인해 데이터 과학에 적합한 도구입니다. 또한 R에는 시계열 분석, 패널 데이터 및 데이터 마이닝을 수행하기 위한 많은 패키지가 장착되어 있습니다. 게다가 R에 비해 더 나은 도구는 없습니다.


알고리즘 작동 방식을 배우고 싶습니까?
모델을 배포하고 싶습니까?



두 질문 모두에 대한 대답이 예라면, 아마도 파이썬을 먼저 배우기 시작할 것입니다. 한편으로, 파이썬에는 행렬을 조작하거나 알고리즘을 코딩하는 훌륭한 라이브러리가 포함되어 있습니다. 초보자는 처음부터 모델을 작성하고 기계 학습 라이브러리에서 함수로 전환하는 방법을 배우는 것이 더 쉬울 수 있습니다. 반면에 이미 알고리즘을 알고 있거나 즉시 데이터 분석에 들어가고 싶다면 R과 Python을 모두 사용하는 것이 좋습니다. 통계적 방법에 중점을 둘 경우 R의 장점 중 하나입니다.

둘째, 통계보다 더 많은 것을 원한다면 배포와 재현성을 말하면 Python이 더 나은 선택입니다. R은 보고서를 작성하고 대시 보드를 작성해야하는 경우 작업에 더 적합합니다.

간단히 말해서 R과 Python 사이의 통계 격차가 가까워지고 있습니다. 대부분의 작업은 두 언어로 수행 할 수 있습니다. 필요에 맞는 것을 선택하고 동료가 사용하는 도구를 선택하는 것이 좋습니다. 모두가 같은 언어를 사용하는 것이 좋습니다. 첫 번째 프로그래밍 언어를 알고 나면 두 번째 프로그래밍 언어를 배우는 것이 더 간단합니다.

 

 


결론

결국 R 또는 Python 중에서 선택할 떄는 다음을 고려하셔야 합니다.

목표 : 통계 분석 또는 배포
투자 할 수 있는 시간
회사 / 산업에서 가장 많이 사용되는 도구

반응형