역전파 알고리즘부터 전이학습까지...AI 용어의 모든 것

인공지능(AI)은 이제 많은 이들에게 익숙해진 용어다. 그러나 인공지능의 갈래들인 머신러닝이나 딥러닝이 구체적으로 무엇인지, 인공지능을 구현하는 방법들을 어떤 것들이 있는지는 많은 이들에게 아직 블랙박스처럼 다가오는 것이 현실이다.

'로봇의 부상' 저자 마틴 포드가 전 세계적으로 유명한 AI 전문가들과 AI에 대한 다양한 주제로 대담한 내용을 정리한 책 AI마인드에는 AI 용어가 비교적 쉽게 정리돼 있어 공유해볼까 한다.

우선 기본부터 시작해 인공지능에 대해 알아보자.

인공지능은 사람이 수행하는 지능적인 작업을 컴퓨터가 모방할 수 있도록 하는 모든 기술을 말한다. 즉, 인간의 지능을 기계로 구현하는 것이 바로 인공지능이다. 스팸메일을 자동으로 분류하거나 자율주행차 등이 인공지능의 예라고 할 수 있다. 예전에는 규칙들을 사람들이 수동으로 만들어 컴퓨터에 주입하면 인간 수준의 인공 지능을 만들 수 있다고 믿었는데, 이러한 방법을 심볼릭 AI 또는 규칙 기반 인공지능이라고 한다.

다양한 일들을 처리할 수 있는 인간 수준의 지능을 일반 인공 지능 혹은 강인공지능이라고 하며 인간의 수준을 훨씬 뛰어넘는 고차원적인 사고를 가지는 지능을 초지능이라고 부른다.

요즘은 머신러닝이라는 말이 많이 회자되는데, 머신러닝은 AI를 만들기 위한 한 방법이다.

기계가 지능을 가지도록 스스로 학습하는 것을 머신러닝이라고 한다. 예를 들어 컴퓨터에게 고양이 사진을 보여주면 고양이의 특징을 알려주지 않아도 컴퓨터 스스로가 고양이의 특징인 귀가 뾰족한 콧수염이 있다 등을 학습한다.

신경망이라는 말도 있다.

데이터를 통해 자동으로 규칙을 학습하는 머신러닝의 방법에는 다양한 알고리즘들이 있다. 그중 인간의 뇌를 구성하는 뉴런에 영감을 받는 것이 신경망 또는 인공신경망이다. 이러한 신경망을 구성하는 기본 단위를 퍼셉트론이라고 한다. 신경망의 구조는 입력층-은닉층-출력층으로 이루어져 있으며 입력층으로부터 주입된 데이터를 은닉층에서 활성화 함수를 거쳐 규칙을 찾아낸다. 활성화 함수는 입력 데이터를 적절하게 변환해주는 함수다. 그리고 마지막으로 출력층에서 결과를 출력하게 된다. 데이터를 통해 규칙을 찾아내기 위해서는 신경망을 학습해야 하는데  이때 경사하강법과 역전파 알고리즘이 사용된다.

  • 손실함수: 신경망 학습이 잘되고 있는지를 확인할 때 손실 함수를 사용한다.  비용 함수, 목적함수, 오차함수로 다양하게 부르고 있다.
  • 경사하강법: 신경망을 데이터에 최적화하기 위해 손실함수의 경사를 구하고 기울기가 낮은 쪽으로 계속 이동시킨다. 예를 들어 산을 내려가는 것이 우리의 목적이라면 산을 내려가기 위해서 경사를 따라 아래쪽으로 계속 내려갈 수 있게 하는 방법을 의미한다.
  • 역전파 알고리즘: 딥러닝 네트워크 구조에서 입력을 통하여 나온 경사(미분값)를 역방향으로 다시 보내어 신경망을 업데이트하는 방법이다.

머신러닝에 이어 딥러닝이라는 말도 많이 들리는데, 딥러닝은 머신러니의 한 갈래로 볼 수 있다.

딥러닝은 은닉층을 깊게 쌓은 신경망 구조를 활용해 학습하는 방법을 말한다. 이처럼 깊게 쌓은 신경망을 활용한 딥러닝은 최근 몇 년간 놀라운 성과를 보였고 얼굴인식, 음성인식, 기계 번역 등 다양한 분야에서 사용되고 있다.

다음은 신경망의 여러 종류들이다.

  • 합성곱 신경망: 얀 르쿤이 제안한 방법으로 이미지를 처리하는 컴퓨터 비전을 비롯한 여러 분야에서 활용되고 있다.
  • 순환 신경망: 시계열 데이터와 언어를 처리하는 분야에서 주로 활용되는 방법이다.
  • 적대적 생성 신경망(GAN): 실제 데이터와 구분하기 어려운 데이터를 만드는데 사용되는 신경망이다. 예를 들어 가짜 미술 작품을 만드는 위조범이 만든 작품을 판매상에 보여준다. 판매상은 진짜 미술 작품과 같은지 평가한다. 비슷하지 않다는 평가를 받는 위조범은 다시 제작한다. 이와 같은 방법을 반복하여 결국에는 훌륭한 미술 작품을 만들어낸다.

베이지안 네트워크나 볼츠만 머신이라는 용어도 있는데 솔직히 처음 들어본다.

베이지안 네트워크: 확률 기반의 그래프 모델이다. 이 네트워크는 변수간의 단순한 상관성 뿐만 아니라  인과성까지 고려한다. 또한 사전 지식사전 등을 반영하여 사용할 수도 있다.

볼츠만 머신: 제프리 힌튼이 발명한 신경망 구조로  단계별 층과 같은 층의 노드들이 서로 모두 연결되어 있다.

인공지능 학습 방법과 관련한 용어들도 많다.

지도학습: 정답이 주어진 데이터를 사용해 컴퓨터를 학습하는 방법이다. 예를 들어 강아지와 고양이를 분류할 수 있는 시스템을 만들기 위해 강아지 사진과 고양이 사진과 함께 이 사진이 강아지인지 고양이인지 알 수 있는 답을 활용한다. 강아지 사진을 넣었을 때 이 분류기는 강아지라고 예측해야 하며, 고양이라고 예측한다면 틀렸다는 피드백을 준다. 피드백을 받게 된 시스템은 다시 수정하고 이 과정을 반복하면서 학습을 하고 수정을 거쳐 강아지과 고양이를 구분할 수 있게 된다. 지도학습은 머신러닝 방법론 중에서 가장 흔히 쓰이고 있으며 문자 인식, 음성 인식, 이미지 분류, 언어 번역 등 거의 모든 애플리케이션에서 활용하늡 방법이다.

비지도학습: 지도학습과는 달리 데이터에 대한 정답이 주어지지 않은 데이터를 활용해 학습하는 방법이다. 정답이 없기 때문에 맞는 예측을 했는지에 대한 피드백을 받을 수 없고 교정을 할 수도 없다. 예를 들어 고양이와 강아지 사진이 있다고 해도 컴퓨터는 이 사진이 고양이인지 강아지인지 알지 못하는 대신 비슷한 사진들끼리 묶어 2개 집단으로 분리한다. 비지도 학습의 대표적인 방법으로 군집화가 존재하며 페이스북에서 특정 집단의 사람들을 그룹화하는 알고리즘 등에서 쓰인다. 지도학습에 비해 활용되는 정도가 낮지만 수십만, 수천만 개의 데이터에 일일이 정답을 만들 수 없으므로 머신러닝의 발전에 필요한 방법론 중 하나로 평가되고 있다.

강화학습: 머신러닝 방법론 중 하나로 에이전트가 주어진 환경에서 어떤 환경을 취하고 이로부터 어떤 보상을 얻으면서 학습을 진행한다. 즉 강화학습은 시행착오를 통해 학습하는 방법 중 하나다. 현재 강화학습은 대부분 게임 및 로봇 분야의 문제를 푸는데 활용되고 있지만 실제로 유명한 애플리케이션을 만든 사례는 아직 없다. 하지만 구글의 자회사이자 알파고를 만든 딥마인드와 같은 기업들이 강화학습에 대한 연구를 활발히 진행하고 있으며, 자율주행차, 자원관리, 교육 시스템 등에 활용될 것이라 생각된다.

자기 지도학습: 지도학습의 특별한 경우이지만 별도 범주라고 생각할 수 있다. 보통 정답을 사람이 주지만 사람의 개입 없이 입력 데이터로부터 정답을 얻는다. 예를 들어 고양이 사진이 있으면  그 사진이 고양이라는 정답은 없지만 동물과 관련된 지식, 눈, 코, 귀 등의 특성들을 스스로 찾아내고 그 정보들을 활용해 학습한다.

전이학습: 이미 잘 훈련된 모델이 있고 해당 모델과 유사한 문제를 해결하기 위해 특성 추출, 레이어 조정, 학습 모델 등을 활용해 학습하는 방법을 말한다.  예를 들어 컵을 감지하는 시스템을 만들었다고 하면  그 시스템 모델을 주전자를 감지하는 모델을 만드는데에 활용하기 위해 컵을 감지할 수 있는 모델을 가져와 세부 조정을 거쳐 주전자를 감지하는 모델을 학습하는 것이다.

테크잇 뉴스레터를 전해드립니다!

오피니언 기반 테크 블로그 'TechIt'
테크 비즈니스를 보는 다양한 통찰들을 이메일로 간편하게 받아 볼 수 있습니다.

About the author

endgame
endgame

테크 블로거 / 공유할만한 글로벌 테크 소식들 틈틈히 전달하겠습니다

No more pages to load


TechIT

테크 비즈니스를 보는 다양한 통찰 '테크잇'

독자 여러분들께서 좋은 의견이나 문의 사항이 있으시면 아래 양식에 따라 문의 주시기 바랍니다.

Contact