본문 바로가기

Blog

딸기로 이해하는 딥러닝 - 2 [Design X AI 3편]

인간이 딸기의 특징을 추출하는 방법

그렇다면 인간은 어떻게 딸기의 특징을 추출해낼 수 있었을까요?

 

눈에 들어온 빛 정보는 눈 안쪽에 있는 ‘망막'에 투영됩니다.
이 시각 정보는 먼저 뇌 뒤쪽에 있는 1차 시각 영역에 있는 뉴런(신경세포)들에게 전해집니다.
그러나 1차 시각 영역에 있는 각각의 뉴런들은 단순한 ‘선분'정도의 형태밖에 파악하지 못합니다.
그 후 1차 시각 영역의 뉴런들은 자기 할 일을 다하고, 자신들이 파악한 ‘선분'정도의 형태정보들을 2차 시각 영역의 뉴런들에게 보냅니다.

 

그럼 2차 시각영역은 그 선분 정보들을 조합하여 좀 더 그럴듯한 형체정보들을 얻고, 다시 3차 시각 영역의 뉴런들에게 그 정보들을 보냅니다.
또 정보를 받은 3차 시각영역의 뉴런들은 좀 더 복잡한 형태를 판단하기 시작하며,
이런 식으로 겹겹의 영역을 거치면서 끝단에 있는 ‘딸기같은 역삼각형 형태에 반응하는 뉴런'이 활성화 되는 것입니다.
같은 방식으로 다른 곳의 뉴런들은 1차, 2차, 3차… 등을 거쳐 ‘붉은색에 반응하는 뉴런'이 활성화되고요.

 

이렇게 딸기를 보면 1차 시각영역에서는 많은 뉴런들이 활성화되지만, 최종적으로는 딸기와 관련된 ‘특정 뉴런'만 활성화 됩니다.
인간은 이런 활성화된 뉴런에 의한 정보를 조합시켜 눈앞의 물체를 딸기라고 인식하는 것입니다.

 

1차-2차-3차-4차-5차까지 있는 신경 회로

 

컴퓨터 안에 신경망을 만들어 내는 딥러닝

컴퓨터에서 위와 같은 신경회로를 본떠 만든 시스템을 ‘뉴럴 네트워크'라고 합니다.

 

뉴럴 네트워크는 데이터를 받아들이는 ‘입력층(Input Layer)',
학습 내용에 따라 네트워크의 연결 방식을 바꾸는 ‘숨겨진 층(Hidden Layer)’,
그리고 최종 데이터를 내보내는 ‘출력층(Output Layer)’로 나뉘어 집니다.

 

입력층은 눈에서 망막까지, 숨겨진 층은 1~N차 시각 영역, 출력층은 마지막으로 활성화된 뉴런으로 대응해서 이해할 수 있겠습니다.

 

뉴럴 네트워크

 

이러한 뉴럴 네트워크를 깊게 여러 층을 겹쳐 만들어진 시스템이 딥러닝입니다.

 

딥러닝 역시 화상을 읽어 들이게 했을 경우 인간의 시각 영역과 마찬가지로 입력층에 가까운 부분에서는 뿔뿔이 해체된 화소의 단순한 모양밖에 판별할 수 없습니다.
그러나 층을 겹침으로써 더욱 복잡한 특징을 얻을 수 있습니다.
그리고 최종적으로 컴퓨터는 딸기 그 자체의 개념을 확보할 수 있게 되는 것이죠.

 

 

하지만 딥러닝의 정확성은 좀처럼 좋아지지 않아서 2010년대까지는 세상에 잘 알려지지 않았습니다.

그 이유는 ‘학습' 부분에 있었는데,
”딸기의 특징은 어떻게 확보하면 좋을까?"
”딸기와 관련된 전달되는 정보들의 중요도는 어떻게 설정하면 좋을까?” 등의 문제에 있어서,
인공지능이 이런 것을 자동적으로 배우기 위한 세련된 학습 방법이 여러 해 동안 탄생하지 않았던 것입니다.

 

다음 시간에는 인공 지능이 특징을 추출할 수 있게 된 비결,

신경망을 깊게 쌓은 딥러닝을 보완할 수 있었던 머신러닝에 대해 알아보겠습니다.

 

본 포스팅은 <뉴턴 하이라이트 121 - 인공지능, 기초부터 미래의 전망까지>를 요약한 글입니다.

태그