SW/머신러닝

실시간 기계 학습을 위한 스트리밍 최우선 인프라

얇은생각 2023. 8. 18. 07:30
반응형

머신러닝의 지속적인 학습에 대한 동기, 어려움 및 잠재적인 해결책에 대해 설명하겠습니다.

실시간 기계 학습은 실제 데이터를 제공함으로써 기계 학습 모델을 지속적으로 개선하는 것을 말합니다. 데이터 분석가/과학자 또는 개발자는 이전 테스트 세트의 모음을 사용하여 오프라인에서 모델을 만듭니다. 모든 부문과 산업은 인지 연구든 자동 연속 프로세스든 기계 학습에서 가능한 모든 이점을 얻기 위해 최선을 다합니다. 구글 홈과 같은 스마트 홈 비서나 스마트 활동 추적 장치, 알렉사나 시리와 같은 음성 인식 시스템 또는 자동화된 자동차를 생각해 보십시오. 이 인공 기술은 많이 발전했습니다. 

기계 학습은 아래에 정의된 다른 유형으로 더 세분화됩니다:

지도 학습: 모델이 정확한 결과/라벨을 예측합니다. 대부분의 지도 학습 알고리즘은 선형 및 로지스틱 회귀를 포함합니다;

비지도 학습: 이 학습은 데이터 세트에 기존 레이블이 있는 패턴을 찾습니다;

강화 학습: 이 학습은 일부 행동이 억제되거나 권장되는 방법을 나타냅니다;

 

기계 학습 모델의 정확성은 데이터 드리프트 때문에 시간이 지남에 따라 저하됩니다. 업데이트 빈도에 따라 모델이 얼마나 효과적으로 작동하는지가 결정됩니다. Google, Alibaba Facebook과 같은 기업은 실시간 파이프라인을 사용하여 생산 중인 여러 알고리즘을 지속적으로 변경하고 성능을 개선할 수 있지만, 다른 많은 기업은 여전히 손으로 모델을 업데이트합니다. 이 기사에서, 우리는 기계 학습의 현재 지속적인 학습 상태에 대한 동기, 어려움 및 잠재적인 해결책에 대해 논의할 것입니다.

기계 학습 모델에 공급되는 데이터의 가치는 적합한 의사 결정을 위해 즉시 사용될 수 있을 때 가장 중요하지만, 사용자 데이터는 일반적으로 기계 학습 모델에 의해 사용되기 전에 오랫동안 섭취, 변환, 저장 및 유휴 상태로 남겨집니다. Headspace 앱과 같은 소비자 대면 제품은 소비자 데이터를 사용하여 실시간 통찰력과 판단을 제공함으로써 에지 사용자 피드백 루프를 크게 줄일 수 있습니다. 이는 사용자가 소비자를 위해 더 의미 있고 개인적으로 맞춤화되고 상황적으로 조정된 콘텐츠 제안을 생성하기 위해 아이템에 완전히 통합될 수 있는 조치를 바로 직전에 취하기 때문입니다.

그러나 스트리밍 또는 실시간 데이터의 경우 멤피스 플랫폼이 널리 사용되며 기계 학습 알고리즘으로 교육을 제공합니다.

실시간 기계 학습은 정확한 데이터를 제공함으로써 기계 학습 모델을 지속적으로 개선합니다. 머신 러닝 모델은 스트리밍 데이터 파이프라인에 적용됩니다. 이 워크플로우는 스트리밍 머신 러닝으로 알려진 프로세스에서 공급자와 목표 사이의 실시간 청크에서 데이터를 흡수하고 수정합니다. 스트리밍 인프라를 통해 지속적인 학습 및 기계 학습 예측 지연을 개선할 수 있습니다. 컴퓨팅의 일부는 작은 데이터 세트를 위한 배치 처리입니다.

머신 러닝 및 데이터 분석 기술은 거대한 스트리밍 시스템의 보안을 지원하는 데 적합합니다. 모델 교육으로도 알려진 머신 러닝은 필요한 데이터로부터 예측 모델을 생성합니다.

실시간 머신러닝이나 심층신경망 등 지식기반 알고리즘을 적절히 활용할 경우 가장 큰 혜택을 볼 수 있으며, 이미지 식별 실생활에서 흔히 사용되고 널리 보급되는 머신러닝 애플리케이션은 이미지 인식입니다.

 

 

실시간 기계 학습이 요구되는 이유

교육을 위해 사전에 더 많은 데이터가 있어야 하거나 데이터가 다른 경향에 반응해야 할 때 실시간 기계 학습이 도움이 될 수 있습니다. 예를 들어, 고객의 선호도와 요구가 시간에 따라 달라진다면, 지속적으로 개선되고 있는 기계 학습 기반 아이템 추천자는 추가적인 재교육의 필요 없이 그러한 변화에 적응할 수 있습니다. 따라서, 새로운 트렌드를 식별하고 이를 반영하도록 조정함으로써, 실시간 기계 학습은 기업과 소비자에게 보다 즉각적인 정확성을 제공할 수 있습니다.

실시간 기계 학습 모델은 일반적으로 데이터가 모델에 지속적으로 주입되는 이벤트 기반 아키텍처에서 이러한 방식으로 운영됩니다. 데이터 스트림 처리를 위한 파이프라인은 데이터가 모델에 입력될 준비가 되도록 하는 데 필요한 모든 데이터 정제 및 조작을 처리합니다. 파이프라인은 실시간 데이터를 사용하여 모델과 모델이 구축된 참조 데이터 집합을 동시에 수정합니다

 

실시간 기계 학습을 위한 스트리밍 최우선 인프라

 

고성능 기술은 지난 몇 년 동안 우리의 일상 생활에서 매일 증가하고 있습니다. 인공 지능의 범위와 그들 각각의 직업은 이제 업계에서 많은 존경을 받고 있습니다. 시리 또는 알렉사와 같은 음성 비서에서 첨단 커피 제조기에 이르기까지, 이러한 것들은 우리의 일상 생활의 중요한 부분이 되어 기계 학습 인공 지능 직업의 긍정적인 진화로 이어지고 있습니다. 

 

 

실시간 데이터 스트리밍 플랫폼

실시간 데이터 스트리밍 서비스를 통해 대용량 데이터를 실시간 앱 및 분석 서비스로 수집, 처리, 평가 및 지속적인 스트리밍을 제공할 수 있습니다. 개발자는 안전하고 접근성이 높고 강력하며 적응력이 뛰어난 중앙 관리 서비스를 활용하여 실시간 앱을 쉽게 만들 수 있습니다.

실시간 데이터 스트리밍은 여러 소스에서 일련의 데이터를 수집하고 흡수한 후 실시간으로 데이터를 해석하여 정보를 얻을 수 있습니다. 실시간 데이터 스트리밍을 통해 사용자는 결과를 얻기 위해 기간이나 더 오랜 시간을 기다려야 하는 것이 아니라 데이터를 즉시 검사하고 처리할 수 있습니다.

스트리밍 데이터는 웹 애플리케이션, 전자 상거래 선불, 소셜 네트워크의 데이터, 금융 플랫폼의 거래 정보, 지리 분석 서비스, 스마트 기기의 위성 추적 등의 사용자가 생성하는 로그 파일입니다. 실시간 데이터 스트리밍에는 다음과 같은 5가지 구성 요소가 있습니다:

출처: 모바일, 웹 앱 등과 같은 수천 개의 장치가 매초 수백만 개의 데이터를 생성합니다.

스트림 섭취: 위에서 언급한 장치에서 생성된 수천 개의 데이터를 파악할 수 있습니다;

스트림 스토리지: 다양한 데이터를 저장하는 데 사용되는 메모리

스트림 처리

대상: 추가 분석을 위한 분석 비밀을 위한 스트리밍 데이터 제공;

 

데이터 스트림을 지속적으로 처리하는 데 널리 사용되는 주요 플랫폼 중 하나는 멤피스입니다. 

 

 

멤피스

멤피스는 실시간 시스템 개발의 모든 문제에 대한 새로운 해결책입니다. 그것은 가장 빠른 해결책이라고 주장하며, 그것이 바로 그것임이 증명되었습니다. 그것은 시장의 어떤 플랫폼보다 더 빠르게 스트리밍 플랫폼을 구축할 수 있도록 도와줍니다. 멤피스의 주요 이점은 공개적으로 액세스할 수 있는 오픈 소스 플랫폼이라는 것입니다. 이 플랫폼은 쉽게 액세스할 수 있는 실시간 데이터 통합업체입니다.

 

특징

현재

몇 분 만에 완전히 최적화된 메시지 브로커를 제공합니다.

명령줄 인터페이스와 같은 직관적인 사용자 인터페이스를 제공합니다.

데이터 수준에서 관측 가능성을 제공합니다.

전송 중에 메시지의 경로를 제공합니다.

Python Node.JS 등의 소프트웨어 개발 키트를 사용합니다.

 

미래

더 많은 SDK를 사용할 것입니다.

준비된 연결 및 분석 도구를 제공합니다.

인라인 처리를 제공합니다.

 

 

멤피스 사용의 장점

Memphis의 플랫폼은 대량의 스트리밍 및 향상된 데이터, 현재 프로토콜, 제로 운영, 신속한 개발, 획기적인 비용 절감, 데이터 지향 프로그래머 및 데이터 엔지니어의 개발 시간 단축을 요구하는 차세대 애플리케이션을 구축할 수 있도록 지원합니다. Memphis의 주요 목표는 다음과 같습니다:

성능캐시 활용도 향상;

복원력 – 99.95%의 가동 시간 제공;

관찰 가능성문제 해결 시간을 단축하는 올바른 관찰;

개발자 경험인라인 처리, 스키마 관리, 모듈성 및 최고 수준;

 

 

실시간 기계학습 시나리오

비즈니스 연구 인공지능을 위해, 컴퓨터 시스템은 모든 클라이언트 데이터를 사용하기 위해 기계 학습을 사용할 수 있습니다. 그것은 다른 상황에 여전히 변화하거나 적응하면서 이미 프로그래밍된 필수 명령을 고수합니다. 이전에 행동을 수행할 수 없는 능력을 표시하는 데이터는 알고리즘을 변경하게 합니다.

디지털 어시스턴트는 상황을 이해할 수 있다면 이메일을 읽고 중요한 정보를 검색할 수 있습니다. 이러한 이해는 미래의 고객 행동을 예측할 수 있는 기능을 내장하여 제공됩니다. 그 결과, 고객의 요구에 더 적극적이고 유연하게 대처했을 수 있습니다.

딥 러닝은 기계 학습에 해당합니다. 신경망은 3개의 계층을 가지고 있습니다. 단일 계층 신경망을 사용하여 대략적인 추정을 할 수 있습니다. 계층을 더 추가하면 정밀도와 성능이 모두 향상될 수 있습니다. 기계 학습은 다양한 블록과 비즈니스에 도움이 되며 시간이 지남에 따라 더 효율적으로 앞으로 나아갈 수 있습니다. 다음은 기계 학습을 위한 실제 적용 사례 5가지입니다.

 

 

패턴/이미지 인식

패턴 또는 이미지 인식은 물리적 세계에서 기계 학습의 일반적이고 널리 사용되는 응용 프로그램입니다. 어둡고 밝은 픽셀 또는 흑백 또는 컬러 이미지의 픽셀의 심각도에 따라 항목을 디지털 사진으로 인식할 수 있습니다. 그 실제 예는 암이 있는지 여부를 X선으로 진단하는 것입니다.

인공지능의 한 분야인 이미지 인식의 범주에 속하는 방법들의 집합체는 어떤 활동의 자동화를 가능하게 하기 위한 이미지의 검출과 해석을 의미하며, 이미지에서 사물, 사람, 장소, 기타 다양한 측면을 식별하고 분석을 통해 이에 대한 결론을 도출할 수 있는 방법입니다.

 

음성 인식

텍스트에 대해 말하는 것은 기계 학습의 능력입니다. 텍스트 파일은 발화된 것과 녹음된 것 또는 녹음된 것 모두를 변환할 수 있는 특정 컴퓨터 소프트웨어를 사용하여 생성될 수 있습니다. 스피치는 시간-주파수 대역 상의 강도에 기초하여 세그먼트들로 더 특징지어집니다. 실제 단어 예들은 음성 다이얼링 및 음성 검색을 포함합니다.

마이크로폰은 어떤 시스템도 음성을 이해하기 전에 파동을 닮은 전기 신호를 만들어야 합니다. 이 신호는 컴퓨터 또는 컴퓨터 네트워크에 의해, 예를 들어 기기의 사운드 카드에 의해 이진 코드로 변환됩니다. 음성 인식 소프트웨어는 음성의 기본 구성 요소인 뚜렷한 모음 소리를 식별하기 위해 디지털 데이터를 조사합니다. 단어들은 자음을 재결합함으로써 만들어집니다. 그러나, 매우 많은 단어들이 비슷한 소리를 가지고 있기 때문에, 알고리즘은 올바른 용어를 선택하기 위해 상황에 의존해야 합니다.

 

의료 진단

기계 학습은 의학 진단에 도움이 될 수 있습니다. 많은 임상의들은 질병 군집을 식별하기 위해 음성 소프트웨어를 사용합니다. 그것의 실제 예는 체액 분석을 포함합니다.

 

예측 분석

이용 가능한 데이터는 기계 학습에 의해 연구자가 정한 규정에 의해 추가로 정의된 범주로 분류될 수 있습니다. 연구자는 분류가 완료된 후 결함의 가능성을 결정할 수 있습니다. 실제 예로는 거래가 유효한지 또는 사기인지 확인하는 것이 포함됩니다.

 

추출

비정형 데이터에서 머신 러닝은 특정 데이터를 검색할 수 있습니다. 기업은 무수한 양의 클라이언트 데이터를 수집합니다. 예측 데이터 분석 도구를 위해 데이터 세트에 자동으로 레이블을 지정하는 프로세스는 머신 러닝을 위한 알고리즘을 사용합니다. 실제 예로는 의사의 문제 치료를 돕고 쉽게 진단하는 것이 있습니다. 이 추출은 클라우드를 사용하여 보다 현실적이고 포괄적인 시스템을 제공하기 때문에 우리에게 더 도움이 됩니다.

 

온라인 예측

AI 플랫폼 예측은 전용 모델을 사용하여 데이터를 가능한 한 빨리 처리하도록 설계되었습니다. 서비스는 사용자로부터 작은 데이터 묶음을 수신하고 예측에 응답합니다. 로그를 유지 관리하는 비용 때문에 자동 네트워크 예측 도구는 기본적으로 쿼리에 대한 기록된 정보를 제공하지 않습니다. 매초 여러 요청이 있는 온라인 예측은 클라우드 모니터링에 의해 청구되는 많은 양의 로그를 생성할 수 있습니다. 온라인 예측 컨텍스트는 다른 인스턴스와 별도로 각 예제에 대해 지연 시간이 짧은 시나리오에서 예측하려는 경우에 사용됩니다. 예를 들어, 예측을 사용하여 지불해야 할 금액이 사기일 가능성이 가장 높은지 빠르게 판단할 수 있습니다.

 

온라인 예측

지속적인 학습의 광범위한 채택은 아직 20년이 남아 있다고 생각하지만 온라인 예측으로 전환하기 위한 기업의 상당한 노력을 관찰하고 있습니다. 우리는 배치 예측 시스템부터 시작하여 세션 내 적응에 도움이 되는 배치 특성을 사용하는 간단한 온라인 예측 시스템의 요구 사항을 설명할 것입니다. 나중에 배치 및 스트리밍 기능을 모두 사용하는 온라인 예측 도구를 개발하는 것에 대해 논의할 것입니다.

 

 

요구 사항들

이 단계에서는 다음을 수행해야 합니다:

배치 예측에서 세션 기반 예측으로 모형을 전환합니다.

온라인 예측 도구에 세션 데이터를 포함합니다.

온라인 예측을 사용하는 동안 사이트를 보지 않는 사용자를 위해 예측을 만들 필요가 없습니다. 예를 들어, 2020년에 그럽 허브는 3,100만 명의 월간 활성 소비자와 62만 건의 평균 주문을 보고했습니다. 소비자의 2%만 매일 앱에 로그인한다고 상상해 보세요.

매일 모든 클라이언트에 대한 예측을 생성하는 경우 온라인 예측의 98%를 생성하는 데 필요한 컴퓨팅 성능은 무용지물이 될 것입니다.

                                                  

지속적인 학습

점진적 학습이라고도 불리는 지속적인 학습의 배경에 있는 아이디어는 새로운 작업을 훈련할 때 이전에 수행된 작업에서 얻은 정보를 무시하지 않고 많은 여러 작업에 대한 모델을 연대순으로 학습하는 것입니다.

사람들은 "지속적인 학습"이라는 말을 들으면 5분에 한 번 꼴로 모델 업데이트를 자주 떠올립니다. 대부분의 기업에서는 다음과 같은 이유로 정기적으로 변경할 필요가 없다고 주장합니다:

- 재교육된 타임라인을 이해하려면 트래픽이 필요합니다.

- 그들의 모델은 그렇게 빨리 저하되지 않습니다.

 

그들의 의견에 동의합니다. 하지만, 지속적인 학습은 모델이 얼마나 자주 재교육을 받는지에 관한 것이 아니라, 어떻게 재교육을 받는지에 관한 것입니다. 대부분의 기업은 상태 비저장 재교육을 사용하는데, 이 교육은 모델이 처음부터 프로그래밍될 때마다 이루어집니다. 지속적인 학습은 모델이 새로운 입력으로 계속 학습하는 상태 저장 교육을 가능하게 합니다. 지속적인 학습은 우리가 목표로 하는 것이며 많은 기업이 결국 따라 할 것이라고 생각하는 것입니다.

에지 배치와 지속적인 학습이 결합될 때 정점에 도달합니다. 엔비전은 새로운 장치(휴대폰, 웨어러블 시계 등)로 기본 모델을 제공하고 해당 모델을 자동으로 추적하고 환경에 맞게 사용자 지정할 수 있습니다. 장치와 클라우드 간에 데이터를 지속적으로 전송할 필요가 없으며 클라이언트 서버 비용도 들지 않습니다.

 

결론

실시간 기계 학습의 주요 문제는 장비입니다. 플랫폼 팀과 컴퓨터 분석 또는 기계 학습 팀은 해결책을 찾기 위해 협력해야 합니다. 지속적인 학습과 온라인 예측을 위해서는 개발된 스트리밍 플랫폼이 필요합니다. 지속적인 학습의 교육 구성 요소는 일괄적으로 완료될 수 있지만 온라인 평가 구성 요소는 스트리밍을 필요로 합니다. 스트리밍은 어렵고 비용이 많이 들어 많은 개발자들이 걱정합니다. 3년 전에는 정확했지만 스트리밍 기술은 크게 발전했습니다. 많은 유명 기업이 현재 스트리밍으로 비즈니스 전환을 단순화하기 위한 솔루션을 제공하고 있으며 점점 더 제안하고 있습니다. 멤피스는 클라우드 기반 시스템의 도움으로 스트리밍의 효율성을 높이며 스트리밍에서 주요 역할을 수행합니다.

오늘날 많은 개발자들이 실시간 기계 학습 사용법과 산업 장애물에 대해 더 배우기 위해 여론 조사를 실시하고 있습니다. 여러분이 의견을 그들과 공유하는 데는 몇 분밖에 걸리지 않을 것입니다. 사용자는 결과가 정리되고 요약되면 결과를 알 수 있습니다.

 

 

기계 학습 배치 아키텍처

기계 학습은 시간이 지남에 따라 더 높은 플랫폼으로 발전했습니다. 그러나 대부분의 대학, 블로그 및 기타 소스가 여전히 기계 학습의 원리 또는 파이프라인에 대한 부분적인 이해를 제공할 필요가 있다는 것은 유감스러운 일입니다. 해당 원리는 모델의 형성, 훈련 및 테스트에만 제시됩니다. 모델을 사용 사례 및 설계와 함께 배포하는 다양한/다중 사용 가능한 방법을 아는 것이 중요하지만 모델 배포가 논의되는 위치는 의외로 적습니다.

이러한 최종 고객에게 접근 가능한 머신 러닝 모델을 제공하는 행위를 모델 배포라고 하며, 개발된 모델은 고객 기반의 요청을 수용한 후 동일한 시청자에게 출력을 제공할 수 있어야 합니다. 모델을 배포할 때마다 애플리케이션을 사용하여 해당 사용 사례를 제시하거나 최소한 모델을 배포하는 데 사용되는 게이트웨이를 구축합니다. 이는 모든 모델에 완료해야 하는 특정 사용 사례가 있기 때문입니다.

예를 들어, 가장 기본적인 모델 배포는 사용자 입력을 수용하고, 입력을 이용하여 모델을 실행한 후 결과를 클라이언트에 전달할 수 있는 웹 페이지를 통해 수행될 수 있습니다. 이 경우, 기본적인 웹 페이지가 애플리케이션의 역할을 하게 됩니다. 이를 고려하여 다음의 네 가지 모델 배포 아키텍처를 살펴보도록 하겠습니다:

 

내장형 건축/임베디드 건축

설계에 따르면, 모델은 애플리케이션 구축 시에 완성된 제품에 번들링되어 이니셔티브의 요구 사항으로서 그 안에 임베디드 방식으로 제공됩니다.

 

모델이 데이터로 게시

이 아키텍처는 애플리케이션에서도 스트리밍을 지원하기 때문에 애플리케이션에서 액세스할 수 있는 모델을 유지하고 유지하기 위해 스트리밍 프로그램을 사용합니다. 이 설계는 훨씬 더 정교하고 많은 도전적인 사용 사례를 처리할 수 있으며 나머지보다 훨씬 더 발전되었습니다.

 

오프라인 예측

이 아키텍처만 다른 아키텍처에 비해 일부 기능이 부족합니다. 또한, 이 경우, 교환은 전체 메커니즘 아키텍처 및 복잡성을 향상시키는 데 상당히 유리합니다. 이 아키텍처는 다소 구식이지만, 예측이 유효한지 또는 유효하지 않은지 확인해야 할 때와 같은 여전히 많은 가치 있는 애플리케이션을 가지고 있습니다.

 

스트리밍 우선 인프라의 과제

개발자, 데이터 과학자 및 보안 엔지니어는 실시간 스트리밍 사이트의 효과적인 배포 및 흡수를 보장하기 위해 다양한 어려움을 해결해야 합니다. 그러나 실시간 머신 러닝의 스트리밍 우선 인프라 중에 직면한 몇 가지 문제는 다음과 같습니다:

 

필요한 데이터 구조, 형식 및 체계 선택

일반적으로 스트리밍 데이터는 현장 또는 클라우드 기반의 대용량 데이터 저장소로 전송됩니다. 개발자, 프로그래머 및 주제 전문가는 이 데이터를 분석하여 통찰력을 도출하고 패턴을 이해하며 다양한 데이터 스트림에 실시간으로 배치되는 방법을 개발하여 효율성을 높이고 보다 상업적인 가치를 도출합니다.

모니터링되는 장비에 대한 오작동 정보는 일반적으로 RUL, 상태 모니터링 또는 APM 프로그램과 같은 예측 유지보수 알고리즘을 생성하는 데 필요합니다. 증가하는 리소스 또는 생존 작업을 운영하는 것은 실패할 때까지 너무 비싸거나 실행 불가능할 수 있습니다.

 

알고리즘 평가 및 인증

리소스의 제어 매개 변수가 올바르게 인식되고 보고되도록 하려면 전문가들이 알고리즘이 통합 환경 내에서 검증되는 방법을 고려해야 합니다. 알고리즘 검증 및 분석을 위해, 스트리밍 프로그램은 이러한 문제를 해결하기 위해 저장된 데이터 스트림을 반복할 수 있어야 합니다. 일반적으로, 실제 스트리밍 시스템의 축소된 버전인 검증 시스템이 이 단계에 사용될 것입니다.

시뮬레이션 기법은 알고리즘 개발 프로세스 내에서 모델링된 입력이 활용되는 것과 같이 불리하거나 에지 시나리오를 평가하기 위해 인공 데이터를 생성하고 전송하는 데 적용되어야 합니다. 이러한 시스템에 구현된 기법은 기업 소프트웨어 응용 프로그램이 처리되는 방식과 같이 특정 비즈니스의 기능에 점점 더 중요해짐에 따라 수명 주기의 유효성과 올바른 사용에 걸쳐 관리되어야 합니다. 여기에는 생성 프로세스 전반에 걸쳐 알고리즘의 정확성과 효과를 평가하고, 알고리즘을 생성하는 데 활용된 데이터와 평가 결과를 유지하며, 알고리즘의 가능한 적용에 대한 세부 정보와 함께 결과를 지속적으로 기록하는 기능이 포함됩니다.

 

확장성 및 효과

실시간으로 데이터를 스트리밍하는 시스템은 해당 데이터에 미리 정해진 시간 내에 응답해야 합니다. 추가적인 가젯이 온라인으로 제공되므로 지속적으로 작동하므로 적응할 수 있어야 합니다. 유명한 스트리밍 아키텍처에서 사용하는 일반적인 파티셔닝에 따르면 시스템은 확장, 진화 및 확장되어야 합니다. 특정 아이디어 또는 스트림이 생성됨에 따라 추가적인 데이터 흐름 컨텍스트가 생성되어야 합니다. 클라우드 기반 기술의 유연성을 활용할 수 있는지 확인하십시오.

 

증권

설계에서 컴퓨터 시스템 배치에 이르기까지 전체 워크플로우의 보안 영향을 설계자와 개발자가 고려해야 합니다. 스트리밍 프로그래머는 이러한 활동을 수용하기 위해 회사의 현재 보안 수준과 인터페이스를 수행하고 개인의 기능에 따라 데이터 및 시스템에 대한 액세스를 제한해야 합니다. 스트리밍 프로그램이 다른 장치 및 장치에 대한 제어를 행사하고 모니터링할 때 특히 최종 장치에 대한 액세스를 제어하는 것도 이에 포함됩니다. 또한 플랫폼은 데이터의 보안, 전송 중 및 정지 상태의 레코드 모두의 프라이버시, 알고리즘의 중요한 기능을 지원해야 합니다. 이러한 방법론이 주로 클라우드 서비스 또는 시스템 소프트웨어를 통해 액세스되는 경우 플랫폼은 데이터의 보안, 전송 중 및 정지 상태의 레코드 모두의 프라이버시 및 알고리즘의 중요한 기능을 지원해야 합니다.

 

 

결론

비록 여러분이 그것을 수용할 준비가 되어 있다고 할지라도, 실시간 기계 학습이 오고 있습니다. 대부분의 사업체들이 여전히 온라인 예측과 지속적인 학습의 장점을 주장하는 반면, 다른 사업체들은 재정적인 수익을 보기 시작했습니다. 그들의 실시간 프로그램들은 그들이 경쟁자들보다 한 발 앞서 있도록 도와주는 데 중요한 역할을 할 수도 있습니다. 모델 런타임을 철저히 검사한 결과 유명 스트리밍 기술로 전환하면 용량 계획의 정확성과 예측 가능성, 최대 기간 동안 모델 처리량이 모두 향상된다는 사실을 확인할 수 있었습니다. 더 이상 위성 시스템을 구축하거나 프로그래밍을 구성하여 실패와 실패를 관리할 필요가 없습니다.

 

헤드스페이스 머신러닝

Headspace 머신 러닝 팀은 여전히 이러한 플랫폼에 대한 상업적 사용 사례를 제시하고 있습니다. Headspace는 실시간 예측을 활용하여 소비자 행동과 맞춤형 콘텐츠 제안 사이의 최종 지연을 크게 줄입니다. 이전 결과, 인앱 이동성 활동, 생체 인식 등 일반 인스턴스에서 스트리밍된 이벤트는 헤드스페이스 애플리케이션을 사용하는 동안 고객에게 제공하는 제안을 변경하는 데 모두 사용될 수 있습니다.

 

업계의 기계학습 현황

기계 학습 산업 혁신은 사용자의 정보를 사용하는 권장 사항으로 옮겨가고 있습니다. 기계 학습 부문 내부의 혁신 덕분에 데이터에 대한 실제 가능성이 눈앞에 다가오고 있습니다. 설명 가능한 예측, 작은 워크로드의 빠른 움직임 및 모듈식 스트리밍 분석의 교차점에서 문제는 즉시 해결되어야 합니다. 이제 기계 학습 준비가 된 데이터는 모니터링되고, 볼 수 있으며, 대규모 플랫폼에서 지원되며, 주로 스트리밍 방법을 통해 분석됩니다. 데이터는 볼 수 있고, 적절한 플랫폼에서 지원되며, 주로 기계 학습을 준비할 때 통과를 통해 처리됩니다.

반응형