본문 바로가기

SW/딥러닝

15. 딥러닝 : 딥 뉴럴 네트워크 : 기본 구조 이해, 원리, 개념

반응형

입력 값과 히든레이어 연결 구조

 

이미 이 그림을 보았습니다. 딥 러닝의 기본 그림이라고 할 수 있습니다. 이 포스팅에서 간단하게 알아보도록 하겠습니다.

첫 번째 레이어는 입력 레이어입니다. 각 원은 별도의 입력을 나타냅니다. 이 그래프에는 8 개의 입력이 있습니다. 이 입력은 텐서플로우 프레임 워크에서 모델을 학습하기 위해 공급하는 데이터입니다.

예측을 할 떄, 8 개의 입력이 있다고 상상하십시오. 예를 들어 평균, 온도, 최고 온도, 최저 온도, 습도, 강수량, 대기압, 구름, 거리의 가시성 등이 있습니다. 이러한 입력을 선형으로 결합한 다음 비선형성을 추가합니다.

선형화하는 것은 쉽습니다. 좋은 오래된 선형 모델을 사용합니다.

 

 

 

첫번재 가중치 행렬

 

입력은 X입니다. 이를 선형적으로 결합하려면이 예제에서 가중치가 필요합니다. 가중치는 8 x 9입니다. 1x8 x 8 x 9의 행렬은 1x9의 형태를 가진 값을 줄 것입니다. 따라서 이 연산을 수행하면 길이 9 또는 1 x 9 행렬의 벡터를 얻게됩니다. 모든 화살표는 입력에서 첫 번째 히든 레이어로 이동합니다.

각 화살표는 특정 값의 수학적 변환을 나타냅니다. 따라서 특정 방법이 적용되면 비선형성이 추가됩니다. 선형성은 표현의 형태를 바꾸지 않고 선형성을 변경합니다. 그래서 화살표는 가중치와 비선형을 나타냅니다. 그러나 가중치는 몇 가지 가중치일까요. 매트릭스는 8 x 9입니다. 그래서 72 가중치가 있습니다.

또한 72 개의 화살표가 9 개의 화살표가 각각 밖으로 나가서 유닛을 숨기고 숨겨진 유닛에 넣습니다. 8 개의 입력 유닛을 가지고 있기 때문에 72 개의 화살표가 더욱 구체적으로 나타납니다. 각 가중치에는 두 개의 인덱스 번호가 있습니다. 동일한 로직을 사용하여 숨겨진 유닛을 선형으로 결합하고 비선형성을 적용 할 수 있습니다.

다음에는 유닛에 9개의 입력 히트가 있고 유닛에 가중치는 9 x 9 행렬에 포함됩니다. 마지막으로 비선형성을 적용하고 두 번째 숨겨진 레이어에 도달합니다. 이렇게하면 계속해서 원하는 경우 100 개의 숨겨진 레이어를 추가 할 수 있습니다.

 

 

 

전체 구조

 

작업을 다시 한 번 적용하면 마지막 숨겨진 레이어가 표시됩니다. 출력 레이어에 도달합니다. 출력 유닛은 원하는 출력 수에 따라 다릅니다.

해당 그림에서는 4개가 있습니다. 온도 습도 강수량 및 압력이 있을 수 있습니다. 이 시점에 도달하기 위해 우리는 예상대로 36 가중치를 나타내는 9 x 4 행렬을 갖게 될 것입니다. 최적화 목표 이전에 입력을 변환 할 수 있는 주요 값을 찾는 것입니다. 이번에는 단일 선형 모델을 사용하지 않고 의미있는 결과를 제공 할 가능성이 훨씬 높은 복잡한 구조를 사용하고 있지만, 머신 러닝이 얼마나 강력한 지 알 수 있을 것입니다. 

딥 뉴럴 네트워크의 로직을 알아 본 후에도 끊임없이 세부 로직에 대해 알아보아야 합니다. 다음 선형 레이어를 만들기 위해 각 선형 조합 후에, 왜 비선형이 필요한지 알아보아야 합니다. 다음 포스팅에서는 이러한 개념과 원리에 대해 알아보도록 하겠습니다.

반응형