알렉사는 아직 오늘의 날씨 정도나 물어 보는 것이 좋다

얼마전까지만 해도 시리, 구글 어시스턴트, 아마존 알렉사 같은 AI 비서 얘기가 많았는데, 요즘은 좀 뜸해진 것 같다. 개인적으로 아이폰을 쓰지만 시리는 거의 쓰지 않는다. 켜놓키는 하는데, 유용하다 느낀 적은 별로 없다. 시리어스(Serious)라는 표현을 종종 쓰는데, 그럴때마다 시리가 켜져 어처구니가 없을 때도 있다.

IPTV로 기기지니를 쓰는데, 거실에선 지니나 시리가 서로 대답을 하려고 싸운다. 지니를 부를때다 시리를 부를 때나 둘다 대답을 한다. 그래도 둘다 부르지 않는다. 나에겐 AI비서는 있는건 알겠지만 좋은건 잘 모르는 존재다. 마이크로소프트가 AI 비서 소프트웨어인 코타나 관련해 개인용 서비스는 접었는데, 이건 아니다고 생각해서 그런건 아닌지 근거없는 상상도 하게 된다. 

앞으로는 좀 괜찮아 지려나?게리 마커스, 어니스트 데이비스가 쓴 2029 기계가 멈추는 날을 보면 AI 비서가 지금 수준에서 확 달라지는 쉽지 않아 보인다.

이 책은 머신러닝, 딥러닝과 같은 AI 기술은 유용하게 쓰이는 면이 적지 않지만 과대포장돼 있는 측면이 있으면, 문제를 해결하기 위해서는 지금과 같은 AI 접근으로는 한계가 있으며, 보다 근본적인 대안이 필요하다는 점을 강조하는데 초점이 맞춰져 있다.

사람처럼 맥락을 이해하고 추론을 하기 위해서는 딥러닝을 넘어 딥언더스탠딩을 위한 새로운 접근 방식을 취해야 한다는 것이다. 현재로선 단기간에 딥언더스탠딩 기반 AI가 현실화될 가능성은 크지 않다.

아무튼 저자들은 AI 비서들에도 지금의 AI가 가진 근본적인 한계가 그대로 반영돼 있다고 지적한다.

시리, 코타나, 구글 어시스턴트, 알렉사와 같이 음성을 중심으로 하는 AI 비서들은 어떨까? 좋은 점은 그들이  구글 서치와는 달리 단순히 링크 목록을 내주는데 그치지 않고 어떤 조치를 취한다는 것이다. 애초에 그들은 질문을 무작위적인 핵심어의 조합이 아닌 실제 질문으로 해석하도록 설계됐다.  하지만 AI 비서들이 나온지 몇년이 흘렀지만 모든 것은 여전히 복불복인 상태다. 어떤 영역에서는 효과적이지만 어떤 영역에서는 전혀 그렇지 못한 것이다.

예를 들어 모든 AI 비서들이 "1957년 월드시리즈 우승팀은"과 같이 사실로 받아들여지는 질문에는 대단히 강하다. 또 각자가 뚜렷한 강점을 보이는 분야가 있다. 구글 어시스턴트는 길안내를 하고 영화표를 구하는데 능하다. 시리는 길안내를 하고 예약을 하는데 능하다. 알렉사는 계산에 재능이 있고 미리 만들어진 농담을 꽤나 잘하며 아마존에서 물건을 주문하는데 능하다.

그러나 특별히 강세를 보이는 분야 외에는 어떤 결과를 얻을지 전혀 짐작할 수가 없다. 얼마전 작가 모나 부슈널은 이 네개 AI 비서 전부에게 가장 가까운 공항으로 가는 길을 물었다. 그러자 구글 어시스턴트는 여행사 목록을 주었다. 시리는 수상비행기 이륙장으로 가는 길을 알려주었다. 코타나는 익스피디아와 같은 항공권 웹사이트 목록을 내놓았다. 또 우리 저자들이 경험한 바로는 최근 운전 중에 "도널드 트럼프는 사람인가?", "아우디는 자동차인가?", "에드셀은 자동차인가?"라는 질문을 하자 알렉사는 100퍼센트의 정확도로 답을 냈다. 하지만 "아우디에 휘발유를 사용할 수 있는가?", "아우디로 뉴욕에서 캘리포니아까지 갈 수 있는가?", "상어는 자동차인가?"라는 질문에는 형편없는 답을 내놓았다.

말을 거꾸로 알아듣는 경우도 종종 벌어진다.

이런 예도 있다. 저자 게리는 최근 트위터에서 시리에게 "맥도날드가 아닌 가까운 패스트푸드 판매점을 찾아줘"라고 질문한 사람이 얻은 답변의 스크린샷을 받았다. 시리는 충실하게 인근 세곳의 식당 목록을 제시했다. 모드 패스트푸드 점이었고 하나같이 맥도날드였다. '아닌'이라는 단어는 완전히 무시됐다.

왓슨에 대해서는 더욱 비판적이다.

그런 왓슨은 뭐란 말인가? 왓슨은 제퍼디에서 정답을 찾아내 두명의 인간 챔피언을 물리쳤다. 하지만 불행히도 왓슨은 보이는 것 만큼 강력하지 못하다. 제퍼디에서 나온 답의 거의 95%는 위키피디아 페이지 표제인 것으로 밝혀졌다. 그런 유형의 지식 정보 검색기와 진정으로 생각하고 사유하는 시스템 사이에는 큰 거리가 있다. 최근 IBM 웹페이지에서 찾아봤을 때 우리가 발견한 것은 제한적으로 시뮬레이션된 자동차에만 초점을 맞춘 왓슨 어시스턴트의 구형 시제품 뿐이었다. 그 시제품은 애플, 구글, 마이크로소프트, 아마존의 더욱 다재다능한 상품들과는 견주기 어려운 수준에 머물러 있었다.

AI 비서의 현재는 AI 기술 전체의 한계를 보여주는 거울이기도 한 것 같다.

시리나 알렉사 같은 AI 비서들의 유용성이 커지고 있다는 점은 확실하지만 아직 갈길이 멀다. 그보다 중요한 사실은 구글 서치가 잘 보여주듯이 정보에 대한 통합이 거의 이루어지고 있지 않다는 점이다. 우리가 아는한 다중 정보로부터 유연한 방식으로, 즉 당신이 알만조와 알레 피츠제럴드에 대해 읽을 때 했던 방식으로 정보를 취합하려는 시도는 극히 적었다.

사실 현재의 어떤 AI 시스템도 그런 상황에서 인간이 하는일, 즉 일련의 문장들을 통합하고 다뤄진 내용과 그렇지 않은 내용 모두를 재구성하는 일을 복제하지 못한다. 당신이 우리가 하는 말을 알아듣고 있다면 당신은 기계가 아닌 인간이다. 언젠가는 알렉사에게 대통령에 대한 월스트리트저널과 워싱턴포스트 보도를 비교해 달라고 부탁할수 있게 될지도 모르겠다. 하지만 지금으로서는 그런 일은 환상에 불과하다. 알렉사에게는 오늘의 날씨나 물어보는 것이 좋다.

지금 우리앞에 놓인 존재는 무엇인가? 유용할 때도 있지만 결코 완전히 신뢰할 수 없는, 그 어떤 것도 우리 인간이 책을 읽을 때마다 하는 일을 할 수 없는 잡다한 AI 비서들 뿐이다. AI의 역사가 60년이 됐지만 기능적인 면에서 컴퓨터는 여전히 문맹 상태다.

테크잇 뉴스레터를 전해드립니다!

오피니언 기반 테크 블로그 'TechIt'
테크 비즈니스를 보는 다양한 통찰들을 이메일로 간편하게 받아 볼 수 있습니다.

About the author

endgame
endgame

테크 블로거 / 공유할만한 글로벌 테크 소식들 틈틈히 전달하겠습니다

No more pages to load


TechIT

테크 비즈니스를 보는 다양한 통찰 '테크잇'

독자 여러분들께서 좋은 의견이나 문의 사항이 있으시면 아래 양식에 따라 문의 주시기 바랍니다.

Contact