사람들이 혈액 및 소변 검사를 받도록 안내할 수 있는 세상을 상상해 보았습니다. 이 모든 것이 건강 관리 기록, 게놈 데이터, 의료 이미지, 심박수를 모니터링하는 과거 데이터, 혈압을 분석하는 AI 시스템에 의해 결정될 수 있습니다. 그리고 이 시스템에 의해 권장된 사항은 수백만 명의 환자를 관찰한 수 천 개의 훈련 사례가 있는 수백만 개의 세포 생물학 데이터 세트를 기반으로 합니다.
혈액 검사에서 신체 변화 또는 신체 유전자에서 발현된 모든RNA 분자의 합계가 감지될 수 있습니다. 소변 검사는 또한 대사 산물의 변경 또는 모든 대사 산물의 총합 (대사 기능에 필요한 물질)을 감지하여 신경 근성 퇴행성 장애가 있음을 시사합니다.
태어날 때 자궁에서 관련 병원성 변형체를 조작할 수 있었기 때문에, AI 시스템은 부작용 가능성이 높다고 경고했습니다. 마지막으로, 개인 데이터, 게놈 및 전사체에 따라 조작된 유전자 약을 제공해줍니다.
1 년 동안 약을 투여 한 후 장치가 팔의 힘과 같은 정보를 기록함에 따라, 신경 근육 변성의 증상이 사라졌습니다. 얻은 데이터는 전 세계의 다른 사람들에게 더 나은 맞춤형 치료를 제공하기 위해 시스템으로 다시 공급됩니다.
현재 말한 이야기들은 공상 과학에 나올만한 이야기라고 생각할 수 있습니다. 그러나 Nature Biotechnology의 "Biomedicine의 딥 러닝"으로 요약 된 이 이야기는 향후 몇 년 안에 의학이 어떻게 급격히 변할 것인지에 대해 알 수 있는 내용입니다. 그렇다면, 머신 러닝과 딥 러닝이 의료 시스템의 미래에 막대한 영향을 미치는 이유와 방식은 무엇일까요?
건강 관리는 개인화되지 않는다
현재, 더 나은 치료 계획을 세우기 위해 제대로 활용되지 않고 있는 것은 게놈, 전사체 및 대사체입니다. 진단 및 치료를 위해 게놈 데이터 및 일반적으로 생체 의학 데이터를 환자에게 사용하지 않는 가장 큰 이유 중 하나는 육안으로는 해석 할 수 없다는 사실입니다.
유전 학자 에릭 랜더는 13 년 동안 인간 게놈 프로젝트(HGP)를 완료 한 후, 한 번은 이렇게 말했습니다. 핵심은 인간이 게놈을 읽거나 표적-약물 반응을 예측하거나 cFDNA의 메틸화 패턴을 이해하는 데 능숙하지 않다는 것입니다. 생의학을 위해서는 AI와 같은 계산 방법을 사용하여 이 문제를 해결해야 한다는 것입니다. 이 기사에서는 딥 러닝 + ML의 응용 프로그램을 하나의 큰 문제, 즉 유전자 데이터 이해로 세분화 할 것입니다. 의료 영상 또는 약물 발견과 같은 주제를 둘러싼 다른 많은 예가 있으며, 앞으로의 포스팅에서는 관련 분야에서 딥 러닝과 ML을 사용하기 위한 최신 모델을 살펴 보겠습니다.
유전자 데이터 응용
유전학에서 가장 큰 문제 중 하나는 유전자형과 표현형 사이의 관계를 파악하는 것입니다. 유전자형은 단순히 특정 형질을 코딩하는 DNA의 유전자 세트이며 표현형은 물리적 표현 또는 특성입니다. 표현형은 유전자형과 주변 환경의 차이에 의해 영향을 받습니다. 이 문제를 해결하기 위해 대부분의 연구자들이 채택한 모델은 통계적으로 유전자 위치의 변이와 표현형 사이의 연관성을 확립하기에 충분한 데이터를 수집해야 합니다.
특정 유전자 변이를 식별하면 관련 생물학적 경로를 찾아 약물 발견의 오브젝트를 제안할 수 있습니다. 총 결과는 다형성 위험 점수라고 하는 선형 첨가 모델을 사용하여 유전자 변이로 인한 질병 위험을 모델링하는 데 사용할 수 있습니다. 이것은 염색체에 걸쳐 여러 고정 위치의 변이 및 관련 가중치를 기반으로 한 숫자입니다.
여러 유전자 변이를 고려할 때 만들 수 있는 특성을 예측하는 가장 좋은 방법 중 하나입니다. 이 모델은 키나 정신 분열증과 같은 매우 복잡한 유전적 특성 또는 장애에 사용할 수 있습니다. 정신 분열증과 같은 장애에서는 일반적인 유전적 변이가 큰 표현형 변이의 원인이 되기 때문입니다. 통계 및 다형성 위험 점수를 사용하여 유전자형-표현형 관계를 설명하는 방법을 찾을 수 있습니다.
유전자 변형을 찾기 위해 적용되는 딥 러닝의 예는 DNA 및 RNA 서열로 부터 전사 인자 및 RNA- 결합 단백질 결합을 예측하는 DeepBind입니다. 결합 친화도를 예측하는 데, 높은 정확도를 달성하기 위해 이 모델을 훈련시킨 후, 서열에서 특정 뉴클레오티드를 편집하고 모델을 사용하여 결합에 긍정적 또는 부정적인 영향을 미치는지 확인할 수 있습니다.
그러나 딥 러닝 모델이 DNA 및 기타 게놈 데이터에서 학습하려면 벡터 및 행렬과 같은 것을 사용하여 모델이 학습 할 수 있는 방식으로 처리 해야합니다. DNA 서열로부터 학습하는 대부분의 모델은 4개의 가능한 뉴클레오티드 A, C, G 및 T에 대해 4개의 채널을 사용하는 one-hot encoding이라는 것을 사용합니다.
그러나 TensorFlow 작업을 사용하여 DNA one-hot 인코딩을 수행하는 다양한 방법이 있습니다. 이를 달성하기위한 일반적인 알고리즘을 이해하려면 Hannes Bretschneider 박사의 기사를 확인해보세요.
결론
다가오는 해에 센서와 다른 의료 기기를 사용하여 수집되는 유전자, 분자, 생체 및 화학 데이터의 기하 급수적 인 성장으로 인해 의료 실무가 중단 될 것입니다. DNA 서열의 비용이 저렴 해짐에 따라, 우리의 게놈은 개인화된 의약품을 만드는 주요 방법 중 하나인 것으로 보입니다. 그러나 우리의 게놈과 그 과정을 이해하는 것은 AI와 같은 계산 방법의 도움 없이는 달성하기 어려울 것입니다. 생물학은 인간이 이해하기가 복잡하고 딥 러닝은 대량의 데이터를 이해하는 가장 유망한 방법 중 하나입니다. 현재의 의료 시스템 및 임상 루틴에서 딥 러닝이 널리 받아 들여지기를 바랍니다.
주요 테이크 아웃
- 오늘날의 건강 관리는 개인화되지 않았습니다. 그것은 다른 환자의 통계를 중심으로합니다.
- AI와 의료 데이터의 기하 급수적인 성장을 통해 우리는이를 바꿀 수있는 가장 큰 기회 중 하나입니다.
- 생물학은 복잡하고 이해하기 어렵습니다. 딥 러닝은 게놈을 이해하고, 유전자 변이를 감지하고 유전자형-표현형 격차를 해석하는 가장 좋은 방법 중 하나입니다.
https://medium.com/@seyonec/deep-learning-for-medicine-48513b6ad83b
아래 내용은 위 사이트를 해석한 내용입니다. 구체적이고 정확한 내용은 해당 내용을 참고해주세요.
'SW > 인공지능' 카테고리의 다른 글
딥러닝 : 심층 학습의 병목 현상은 무엇일까요? (0) | 2020.01.01 |
---|---|
인공지능 : 영상 의학과 딥러닝과의 관계 (0) | 2019.10.28 |
케라스 : classification : 분류 예제 실습 (2) | 2019.10.24 |
Hyper Parameters : 개념, 종류, 팁 (0) | 2019.10.23 |
확률적 경사 하강 : Stochastic Gradient Descent (SGD) : 개념, 원리 (0) | 2019.10.21 |