아키텍쳐

architecture

아키텍처는 딥러닝(deep learning) 네트워크의 설계나 구조를 나타냅니다. 예컨대 네트워크가 몇 개의 레이어(layer)로 구성되어 있는지, 각 레이어의 유닛(unit) 수는 얼마인지, 레이어들 사이의 연결 패턴은 어떻게 되는지, 어떤 활성화 함수가 사용되는지 등의 구조적인 정보를 포함합니다.

Untitled

쉽게 말해서, 아키텍처는 네트워크의 "설계도"나 "골격"과도 같은 개념입니다. 따라서 CNN, RNN, Transformer, ResNet, LSTM, BERT 등은 모두 특정한 아키텍처를 나타냅니다.

아키텍처는 여러 모델들의 기반이 될 수 있으며, 각각의 모델은 동일한 아키텍처를 가지면서도 다른 학습 데이터나 초기화 방법 등에 의해 서로 다른 결과를 낼 수 있습니다.

Untitled