딥러닝은 많이 혁신을 이뤘지만 속이는 것도 여전히 쉽다

딥러닝은 인공지능(AI) 분야에서 가장 진보된 기술 중 하나로 꼽힌다. 최근에는 딥러닝을 통해 사람이 필요 없는 자동화 환경을 구현하려는 시도도 많이 이뤄지는 분위기다. AI 기반 컨택센터, 통·번역 등 딥러닝을 활용한 프로젝트들이 여기저기에서 쏟아진다.

딥러닝이 과연 사람이 없는 콜센터를 구현하고 통역사 없는 통번역을 구현할 수 있을까? 당장에는 쉽지 않아 보인다. 게리 마커스, 어니스트 데이비스가 쓴 2029 기계가 멈추는 날을 보면딥러닝은 많이 발전한 것도 사실이지만 빈틈도 여전히 많다.  실수하면 큰일날 수 있는 영역에서 딥러닝에만 의존하는 것은 시기상조라는게 저자들 생각이다.

딥러닝은 대상 인식과 음성 인식의 문제뿐 아니라 사람들이 이전에는 달성하리라고 생각조차 못했던 많은 과제에서 깜짝 놀랄 만큼 유용한 것으로 밝혀졌다. 딥러닝은 과거 대가들의 스타일을 묘사하는 작품을 만들고 오래된 사진에 색깔을 입히는 일에서 눈에 띄는 성공을 거두었다. 또한 딥러닝은 특히 생성적 대립 신경망이라고 알려진 본보기에 라벨을 붙여줄 필요가 없는 비지도 학습이라는 과제를 해결할 수 있다. 딥러닝을 게임 시스템의 구성 요소로 사용하면 시스템은 때로 초인간적 수준의 게임을 하기도 한다.

음성인식, 언어 번역과 같은 특정 분야에서는 명백한 진전이 있었지만 딥러닝은 여전히 보편적 해결책이라고 볼 수 없다. 딥러닝은 우리가 열린계에서 필요로 하는 범용 지능과는 별 관계가 없다.

나름 완성도가 높다고 해도 딥러닝은 속이기가 쉽다. 논란이 됐던 마이크로소프트 AI 챗봇 테이나 스캐터렙 AI  챗봇 이루다에서 볼수 있듯 딥러닝을 무력화시킬 수 있는 방법은 의외로 많다.

심층 네트워크를 속이는 방법은 말 그대로 수십 가지가 있다. MIT의 연구자들은 3차원 거북이 이미지를 고안해 딥러닝 시스템이 소총으로 오인하게 만들었다. 거북이를 물속에 넣어 놓아도 결과는 달라지지 않았다. 마찬가지로 이 팀이 갈색 글러브 안에 든 야구공에 약간의 거품을 묻혀두자 네트워크는 공을 에스프레소로 생각했다. 각도와 상관이 없었고 심지어는 야구 글러브 바로 앞에 놓았을 때도 결과는 마찬가지였다.

어떤 연구팀은 이미지의 구석에 크게 드러나지 않는 무의미한 방해 요소들을 임의로 덧붙였다. 이에 속아 넘어간 신경망은 돼지 저금통을 살쾡이로 생각했다.

또 다른 팀은 바나나와 같은 현실적인 대상에 사이키델릭한 토스터 사진이 있는 작은 스티커를 붙여서 딥러닝 시스템이 이 장면을 왜곡된 작은 토스터 사진 옆에 놓인 바나나가 아니라 왜곡된 토스터로 생각하게 만들었다. 만약 당신의 자녀가 이 사진을 보고 바나나를 알아보지 못한다면 아이를 당장 신경과 전문의에게 데려가지 않을까? 또한 딥러닝 시스템은 고의적으로 변경을 가한 정지 표지판을 속도 제한 표시로 오해했다.

또 다른 연구팀은 이미지를 흑백으로 전환하거나 색상을 바꾸거나 회전시키는 등 10가지 방식으로 왜곡시킨 12개의 과제를 두고 딥러닝 시스템과 사람을 비교했다. 거의 예외 없이 인간이 더 나은 성적을 냈다. 우리의 시각 체계는 이를 구별할 수 있도록 만들어져 있지만 딥러닝은 별로 그렇지가 못했다. 또 다른 연구는 딥러닝이 비정상적인 자세로 있는 평범한 사물을 인식하는데 어려움을 겪는다는 것을 보여주었다. 예를 들어 아래의 사진과 같이 뒤집힌 스쿨버스를 딥러닝은 제설기로 오인했다.

언어 영역도 마찬가지다.

언어에 대해서는 문제가 더 괴상해진다. 스탠퍼드대학교의 컴퓨터 과학자 로빈 지아와 퍼시 리앙은 제1장에서 언급한 스쿼드 과제를 처리하는 시스템들에 대해 연구했다. 여기에서 딥러닝 시스템을 문제를 읽고 글에 있는 답에 밑줄을 그었다. 딥러닝 시스템에 주어진 글을 다음과 같았다.

페이턴 매닝은 여러 번의 슈퍼볼 경기에서 두 개의 다른 팀을 이끈 최초의 쿼터백이 됐다. 그는 서른아홉의 나이로 슈퍼볼에서 뛴 최고령 선수이기도 했다. 이전의 기록 보유자는 서른 여섯 살에 33회 슈퍼볼에서 브롱코스를 승리로 이끌었으며 현재 덴버의 미식 축구 운영 부문 수석 부사장이자 브롱코스의 총감독인 존 얼웨이다.

여기에서 질문은 서른 여덟 살의 나이에 33회 슈퍼볼에서 뛴 쿼터백 이름은 무엇입니까? 였다. 한 딥러닝 시스템은 정확하게 존 얼웨이에 밑줄을 그었다. 거기까지는 좋았다. 하지만 지아와 리앙이 이 단락의 끝에 전혀 관련이 없는 제프 딘은 34회 챔프볼에서 등번호 17번을 달았다라는 문장을 덧붙이고 아까와 같은 질문을 하자 시스템은 완전히 혼란을 일으켜서 존 얼웨이가 아닌 제프 딘이라고 대답했다. 다른 두 챔피언전에 대한 두 문장을 한데 섞자 어떤 문장도 제대로 이해하지 못했다는 것이 드러났다.

딥러닝은 그리 심층적이지가 않다. 딥러닝이라는 용어에서 딥이라는 단어는 신경망에 있는 층의 숫자를 의미할 뿐임을 알아야 한다. 그 맥락에서의 딥은 그 시스템이 입력된 데이터에 대해 개념적으로 특별히 의미 있는 어떤 지식을 배웠다는 뜻이 아니다. AI 스타트업 바이케이러스가 최근 명쾌하게 입증했듯이 딥마인드의 아타리 게임 시스템을 구동하는 심층 강화학습 알고리즘은 '벽돌 깨기' 게임을 수백만 번 하고서도 공을 튕겨내는 평평한 도구인 패들이 무엇인지 결코 학습하지 못한다.

테크잇 뉴스레터를 전해드립니다!

오피니언 기반 테크 블로그 'TechIt'
테크 비즈니스를 보는 다양한 통찰들을 이메일로 간편하게 받아 볼 수 있습니다.

About the author

endgame
endgame

테크 블로거 / 공유할만한 글로벌 테크 소식들 틈틈히 전달하겠습니다

No more pages to load


TechIT

테크 비즈니스를 보는 다양한 통찰 '테크잇'

독자 여러분들께서 좋은 의견이나 문의 사항이 있으시면 아래 양식에 따라 문의 주시기 바랍니다.

Contact