반응형

2735

R : 군집화-Clustering, 분류-Classification (개념 및 예제)

군집화(Clustering)대상 데이터를 일부 카테고리(클래스)로 그룹화하는 것을 뜻합니다. 같은 그룹의 데이터는 비슷한 특징을 가지고 있습니다. 따라서 그룹이 1에 얼마나 "근접"하고 있는가를 근거로 군집을 가리킵니다. 보통 비지도 학습(Unsupervised learning)에서 활용됩니다. 분류(Classification)새로운 데이터를 알려진 범주 중 하나로 분류하는 것을 뜻합니다. 카테고리에는 "라벨"을 보유합니다. 현실에서는 예측 문제에서 적용하고 있습니다. 주로 지도 학습(Supervised learning)에서 활용합니다. 분류분석 절차1. 라벨(클래스) 정보가 있는 대상 데이터셋을 준비한다.2. 대상 데이터셋을 트레이닝 데이터 및 테스트 데이터로 나눈다. - 테스트 데이터의 라벨은 모른다..

SW/R 2019.03.13

주식 : 생명공학, 바이오, 제약 기업 주식 투자 방법

바이오테크놀로지 투자바이오테크놀로지 투자는 항상 불확실한 제안입니다. 이 부문의 주식들이 보여주듯이 말이죠. 올해 들어 지금까지 나스닥 생명공학 지수는 S&P 500 지수보다 17% 하락했습니다. 10년 만에 바이오 지수가 5배로 늘어난 후, 2015년 중반에는 사상 최고치에 도달했고, 그 이후로는 27%나 떨어졌습니다. 바이오테크놀러지는 제약회사들이 착수할 수 없는 길을 개척하는 연구소와 같습니다. 용기와 기량에 의해 연구하여 사람들의 건강을 증진시키는 눈부신 발견을 합니다. 대표적 사례일루미나, 유전자 배열에서 놀라운 일을 해왔습니다. 지난 7년 동안, 주식은 거의 4배 증가했습니다. 그리고 거의 모든 종류의 주식에 불황이었던 해에도 일루미나는 20%를 앞서고 있습니다. 하지만 프로테나와 같은 부정적..

일상/주식 2019.03.13

삼성바이오로직스 : 주식 투자 분석

삼성바이오로직스의 목표주가를 상향 조정삼성바이오로직스의 주식 투자에 대한 전문가들의 이야기와 기업 상황을 정리해보았습니다. 증권사 애널리스트들은 2011년 창사 이래 처음으로 연간 흑자 전환에 성공한 삼성바이오로직스의 목표주가를 상향 조정했습니다. 삼성바이오로직스는 지난해 영업이익이 전년보다 307% 늘어난 630억 원의 흑자로 돌아섰다고 최근 발표했습니다. 같은 기간 매출액은 4598억 원으로 56.1% 증가했습니다. 또, 적자는 992억 원으로 줄었습니다. 1공장과 2공장의 생산성 향상으로 매출이 늘고 수익성이 개선됐다고 회사 측은 설명했습니다. 한국 투자 증권 분석레미케이드 바이오시밀러 렌플렉시스(renflexis)의 판매는 최근 출시 이후 부진했습니다. 하지만 유럽 최초의 바이오시밀러인 벤팔리는 ..

일상/주식 2019.03.13

R : 로지스틱 회귀 ( 개념 및 예제 )

로지스틱 회귀일반적인 회귀 문제에서는 종속변수가 수치데이터(양적 자료)입니다. 즉, 예측 해야 할 종속 변수가 수치데이터가 아닌 범주형 데이터 (Yes or No) 일 때를 로지스틱 회귀라고 한다. 또, 범주나 그룹을 예측하는 문제를 ‘분류(classification)’ 문제 라고 합니다. 실습 : iris 품종 예측먼저 iris 품종을 예측하기 위해 회귀식을 구하겠습니다. head(iris)# Sepal.Length Sepal.Width Petal.Length Petal.Width Species# 1 5.1 3.5 1.4 0.2 setosa# 2 4.9 3.0 1.4 0.2 setosa# 3 4.7 3.2 1.3 0.2 setosa# 4 4.6 3.1 1.5 0.2 setosa# 5 5.0 3.6 1...

SW/R 2019.03.12

현대 2019 더 뉴 아반떼 : 집중 탐구

현대 아반떼 리프레쉬가 실용성을 발휘현대자동차가 아반떼를 개조해 만든 신형 아반떼는 연비와 안전성의 측면에서 일상적인 도시 주행에 적합한 엔트리 레벨 차량임을 입증했습니다. 남양주에서 2시간 동안 진행된 130km의 시운전에서는 6세대 아반떼가 평균 연비 16.5kpl을 자랑했고, 수많은 안전기능이 선전했습니다. 테스터는 1.6L 가솔린 엔진, 지능형 가변 변속기(IVT) 및 17인치 타이어를 장착한 풀 패키지 모델이었습니다. 아반떼 페이스리프트는 고성능 자동차나 프리미엄 모델이 아닌 만큼 가속, 제동, 코너링 등 기능 면에서 많은 기대를 충족시켰습니다. 20, 30대와 소가족에게 이상적인 차종이라 생각됩니다. 전반적으로 준비가 좋은 성능으로 보여집니다. 하지만, 이 자동차는 도로와 바람 소리가 실내로 ..

일상/자동차 2019.03.12

R : 중선형 회귀 분석 (개념 및 예제)

중선형 회귀영어로 Multiple linear regression입니다. 독립 변수가 2개 이상일 때 중선형 회귀라 합니다. 따라서 중선형 회귀식의 형태는 선형 회귀식과 유사합니다. 실습 : 연봉 예측 모델특정 직군의 연봉을 3가지 변수(교육년수, 여성비율, 평판)를 가지고 예측해보겠습니다. 사용하는 데이터는 car 패키지의 Prestige입니다. library(car)# 필요한 패키지를 로딩중입니다: carData head(Prestige)# education income women prestige census type# gov.administrators 13.11 12351 11.16 68.8 1113 prof# general.managers 12.26 25879 4.02 69.1 1130 prof#..

SW/R 2019.03.11

재테크 : 과소비를 줄이는 좋은 방법

최고의 목표를 가지고 있을 수도 있지만, 때때로 한 가지 물건을 사기 위해 가게에 갔을 때, 세 개의 가방을 들고 나옵니다. 누구나 가끔 너무 많은 돈을 쓰지만, 돈을 줄이는 것은 생각보다 쉽습니다. 단지 너무 많은 돈을 쓸 때를 인식하기만 하면 됩니다. 부엌에서 시작미국인들은 구입하는 식료품 중 25% 이상을 낭비하고 있습니다. 과소비를 막는 가장 좋은 방법은 가공 식품 대신에 덜 비싼 완제품 음식을 사는 것입니다. 보통 마트의 바깥 쪽에서 그것들을 찾을 수 있습니다. 그러니 중앙에서 벗어나 유혹을 피하세요. 리스트를 만들고 가지고 가세요. 만약 어떤 물건이 목록에 없다면, 다음 주에 쉽게 쓰레기통에 버려질 수 있는 충동구매일 것입니다. 일상 생활 중 지출충동구매는 언제든지 유혹합니다. 앱을 사용하여 ..

일상/재테크 2019.03.11

R : 데이터 마이닝과 단순 선형 회귀 (개념 및 예제)

데이터 마이닝지금까지는 주로 전통적인 통계 분석 도구를 이용하여 데이터를 분석하는 방법을 배웠습니다. 데이티 마이닝 도구를 학습하면 데이터로 부터 다양한 정보를 얻을 수 있습니다. 데이터 마이닝은 데이터 안에서 의미 있는 패턴, 추세 등을 발견해나가는 과정을 의미합니다. 앞으로 회귀분석, 분류, 군집화 등에 대해 알아보겠습니다. 단순 선형 회귀종속 변수(y) 와 독립변수(x) 사이의 선형 관계를 파악하고 이를 예측에 활용하는 방법을 뜻합니다. (x)와 (y) 사이의 관계식을 모델(model) 이라 한다. 보통 회귀 모델, 예측 모델이라 합니다. 단순 선형 회귀식은 다음과 같은 형태를 나타냅니다. y = Wx + b 즉, 상수인 W와 b 를 찾는 것이 모델을 만드는 과정이다. 현실세계에서는 두 변수가 선형..

SW/R 2019.03.10

재테크 : 저축액 늘리는 법, 돈 모으는 법

여러분의 재테크를 완벽히 했다고 생각하시나요? 저축예금을 보기 전까지는 모릅니다. 저는 소비가 그렇게 유혹적일 때 저축하는 것이 어려울 수 있다는 것을 압니다. 하지만, 저축은 확실히 필수입니다. 건강한 저축예금은 삶이 우리를 곤경에 빠뜨릴 때, 그리고 삶이 우리의 재정을 날려버릴 때 도움을 줍니다. 그러나 필수적인 소비 비용이 있을 때 저축을 하거나 저축할 여분의 돈을 찾는 것은 어려울 수 있습니다. 몇 가지 방법들에 대해 알아보겠습니다. 케이블 끊기요즘 케이블 비용이 터무니없이 비싸고 주문형 스트리밍과의 대규모 경쟁에도 불구하고 점점 더 낮아지는 것 같지 않습니다. 케이블을 끊고 가입 서비스를 선택하는 것은 매달 돈을 절약하는 좋은 방법이다. 그런 다음 이러한 돈을 월 몇 만원 저축을 위해 자동적으로..

일상/재테크 2019.03.10

재테크 : 닻 내리기 효과 (개념, 사례, 인식)

닻 내리기 효과 닻 내리기 효과는 1970년대 초에 심리학자들이 기록한 인지적 편견입니다. 이 편견은 사람들이 추정치를 형성해야 할 때 일어납니다. 사람들은 초기 값을 0으로 시작하는 경향이 있습니다. 다시 말하면, 사람들은 최초 가치에 대해 지나치게 '축소'하는 경향이 있습니다. 사례예를 들어, 실제로 닻내리기 효과의 존재를 증명하기 위해 사용되었던 실험에 대해 논해 보겠습니다. 실험 기간 동안, 참가자들은 아프리카인 유엔 국가들의 비율을 추정하도록 요청 받았습니다. 그러나 참가자들에게 이 특정한 질문에 답하도록 요청하기 전에, 그들에게 무작위 숫자(0에서 100 사이)가 주어졌다. 참가자는 자신의 추측이 이 무작위 숫자보다 높거나 낮는지 대답해야 합니다. 연구자들이 발견한 것은 대상자들의 후속 추정치..

일상/재테크 2019.03.09

재테크 : 목표 설정 팁, 이유

목표 설정 팁목표를 유지할 수 있도록 도와줄 수 있는 도구들이 있습니다. 목표 추적을 위한 금융 앱이 도움이 될 수 있습니다. 멋진 로드맵을 제공할 수 있는 여러 가지 목표 타이머, 경고 및 프롬프트를 제공합니다. 구태의연한 방법도 있습니다. 냉장고 문에 붙어있는 우리의 사진, 아마도 외딴 해변에서 은퇴한 후 보내는 즐거움을 시뮬레이션하는 것은 멋진 시각적 자극이 될 것입니다. 만약 그것을 본다면, 여러분은 그것을 믿으세요. 그것은 여러분이 돈을 아끼도록 동기를 부여할 수 있습니다. 그 방법이 무엇이든, 올바른 길로 인도한다면, 그럴만한 가치가 있습니다. 마침내 목표에 가까워지면, 약간의 보상을 찾는 것은 당연한 진리입니다. 금융 재테크에서도 마찬가지입니다. 점진적인 성장이나 은퇴 후 최종 목표를 달성한..

일상/재테크 2019.03.08

R : ggmap-특정 지역 지도 보기 (개념 및 예제)

개요구글맵 API 기능을 이용하여 구글지도상에 정보를 표시할 수 있습니다. 실습 전에 필요한 패키지가 있습니다. ggmap과 ggplot을 설치해주세요. ggmap은 구글맵과 연동을 위해 필요합니다. ggplot2은 구글맵 위에 그래프를 출력하기 위해 설치합니다. 아래 그림을 참고해주세요. ggmap 오류 해결법최근 google map 시용 환경의 변화에 따라 현재 설치된 ggmap 패키지로는 구글 지도 서비스 이용이 안됩니다. 주소를 좌표로 바꾸는 함수, 지도를 가져오는 함수가 작동하지 않습니다. 이제부터는 반드시 구글 API 키를 이용하도록 강제하기 때문입니다. 해결책은 현재 ggmap과 관련된 패키지를 삭제하고 최신버전을 새로 설치합니다. 그 이후 API 키를 발급받아 사용해야 합니다. 아래 명령어..

SW/R 2019.03.07

재테크 : 목표, 종류 설정하는 법

재테크 목표 차트 개발재테크 목표 차트를 개발하는 것은 재테크를 시작하는 좋은 방법입니다. 목표 차트를 설정하기 위해 지침들에 대해 알아보겠습니다. - 우선 개인의 재테크 목표 하나를 적습니다. 구체적이고, 측정 가능하고, 행동 지향적이고, 현실적이고, 날짜 계획이 있어야 합니다.- 목표가 단기, 중기 또는 장기인지 결정하고, 그 목표에 대한 날짜 계획을 만드세요. 이것은 상황에 따라 언제든지 변경될 수 있습니다.- 목표에 도달하기 위해 얼마나 많은 돈을 절약해야 하는지 결정하고 그 금액을 월 또는 연도별로 구분합니다.- 그 목표에 도달할 수 있는 모든 방법을 생각해 보세요. 비용 절감, 추가 비용 확보 또는 추가 리소스 발굴을 포함합니다.- 어떤 것이 목표에 도달하는 가장 좋은 방법인지 결정하고 그것들..

일상/재테크 2019.03.07

R : 이상치-데이터 전처리 ( 개념 및 예제 )

이상치(outlier)정상 범위 밖에 있는 값을 뜻합니다. 잘못 입력한 값일 수도 있지만 실제 값일 수도 있습니다. 이런 이상치들은 전체 데이터 분포의 특성에 영향을 미칩니다. 품질 관리에 있어서 불량을 찾을 때 제일 먼저 찾아 보는 것이기도 합니다. 또 금융 사기 거래를 탐지할 떄 사용되기도 합니다. 이상치를 제외하고 분석을 할지, 포함해서 분석을 할지 판단해야 합니다. 이상치 판단 방법논리적으로 있을 수 없는 값이 있는 지 찾아봅니다. 성별에서 좋아하는 색깔을 1~5로 표시하기로 했는데 7인 경우에는 잘못된 값입니다. 또, 상식을 벗어난 값이 있는 지 찾아봅니다. 나이가 100살이 넘는 경우우는 힘들겠죠? 또 이상치를 판단할 때 boxplot을 활용해봅니다. 이상치 탐색을 해보겠습니다. 아래 예제코드..

SW/R 2019.03.06

재테크 : 목표 설정 방법, 성공 방법

재테크 목표 설정하는 방법에 대해 포스팅하겠습니다. - 중요한 게 뭔지 알아야 합니다. 실용적이고 압박감 있는 것부터 기발한 것과 멀리 있는 것까지 모든 것을 감안해야 합니다. 도달 가능한 범위 내에 있는 것, 시간이 좀 걸릴 것, 그리고 장기적인 전략의 일부여야 할 것을 분류합니다.- 목표 전략을 적용합니다. 즉, 야망이 구체적이고, 측정 가능하고, 달성 가능하고, 시기적절하게 이루어지도록 하세요.- 현실적인 예산을 만듭니다. 무엇이 들어오는지, 무엇이 나오는지 잘 파악한 다음, 목표를 달성하기 위해 노력하세요. 예산으로 소비의 지출을 차단하세요.- 현실적이고 물샐틈없는 계획이라도 적어도 몇 천원은 남아 있을 것입니다. 그 금액이 얼마든 간에, 위 목록의 몇 가지 사항을 해결하기 위한 계좌로 송금하십시..

일상/재테크 2019.03.06

R : 데이터 병합-merge (개념 및 예제)

병합(merge)여러 데이터가 있는 경우, 하나로 합쳐서 데이터를 처리해야할 때가 있습니다. 그런 경우 merge를 활용해 진행해야합니다. 병합하는 경우에 대해서 알아보겠습니다. 공통 컬럼을 매개로 하여 2개의 2차원 배열을 하나로 병합합니다. 공통된 컬럼의 값이 없는 경우 생략합니다. 아래 예제를 참고하세요. x y # name korean # 1 a 75 # 2 b 60 # 3 d 90 merge(x,y, all.x=T) # name math korean # 1 a 90 75 # 2 b 80 60 # 3 c 40 NA merge(x,y, all.y=T) # name math korean # 1 a 90 75 # 2 b 80 60 # 3 d NA 90 merge(x,y, all=T) # name mat..

SW/R 2019.03.05

블로그 상위 노출 : 포스팅, 업데이트 주기

블로그는 온라인 콘텐츠 마케팅 전략의 중추이거나 최소 조건입니다. 하지만 블로그는 광고판처럼 작동하지 않습니다. 좋은 콘텐츠를 만들어 게시하고 결과를 기대하면 안 됩니다. 대신 해당 콘텐츠를 홍보하고 정기적으로 변경, 업데이트 및 추가하고 새 콘텐츠를 정기적으로 추가해야 합니다. 그렇다면 얼마나 자주 블로그를 업데이트해야 할까요? 이 문제는 크게 두 가지 각도에서 검토하겠습니다. 먼저 웹 사이트에 게시하는 새로운 소규모, 정기 블로그 게시물입니다. 다음으로, 전체 사이트에 영향을 미치는 업데이트 또는 재설계를 검토합니다. 새로운 포스팅 먼저 새로운 콘텐츠를 제작하는 데 필요한 요소부터 살펴보겠습니다. 일반독자 만약 여러분의 컨텐츠가 고품질이라면, 독자 여러분은 블로그에 새로 게시된 컨텐츠를 기대하게 될 ..

일상/IT 2019.03.05

R : 데이터 전처리, 결측값-missing value ( 개념 및 예제 )

데이터 전처리 개요분석을 위한 데이터셋을 확보했다 하더라도 바로 분석을 할 수 없는 경우가 많습니다. 그 이유는 바로 결측값, 이상치, 오입력 등이 있습니다. 따라서 데이터 분석에 적합하도록 데이터셋을 정제해야 합니다. 바로 이것을 전처리(data preprocessing)라고 합니다. 실제 데이터를 분석하는 시간보다 전처리에 더 많은 시간이 소요되는 경우가 많습니다. 효율적으로 데이터를 전처리 할 수 있는 능력이 중요합니다. 결측값(missing value)결측값은 입력이 누락된 값을 의미합니다. 보통 NA로 출력됩니다. 결측값이 포함되면 산술 연산에 문제가 생깁니다. 대부분의 산술 연산 함수는 결측값을 제외할 수 있는 옵션을 제공합니다. 아래 예제를 참고하세요. x

SW/R 2019.03.04
반응형