눈덩이 처럼 불어나는 딥마인드의 적자에 비친 AI의 미래

세계 최대 연구 중심 인공지능 조직일 가능성이 높은 딥마인드는 많은 돈을 빠르게 손해 보고 있다. 지난 3년간 10억달러 이상을 까먹었다. 딥마인드는 또한 앞으로 1년안에 지불해야할 10억달러 이상의 채무도 있다.

이것은 딥마인드가 무너지는 것을 의미하는가? 로버스트닷AI 설립자 겸 뉴욕대 심리 및 신경과학 교수인 개리 마쿠스는 전혀 그렇지 않다고 주장한다.

그는 최근 IT매거진 와이어드에 쓴 칼럼에서 이같이 주장했다.

그에 따르면 딥마인드는 매년 많은 연구를 하고 있다. 이와 관련된 달러는 크다. 아마도, 어떤 이전 AI 연구 조직보다도 그럴 것이다. 그러나 일부 과학 분야 대규모 프로젝트들에서 쓰였던 금액과 비교하면 결코 이례적인 것은 아니다.

대형 입자가속기(The Large Hadron Collider)에 매년 10억달러 가까운 금액이 투입되고 있고, 힉스입자(Higgs Boson)를 찾는데 들어간 비용은 100억달러 이상인 것으로 추정된다. 확실히 진정한 머신 인텔리전스(인공지능으로도 알려진)는 보통 영어로 이뤄지는 모든 종류의 쿼리를 분석하는 역랑을 갖춘 스타트렉 같은 컴퓨터가 작동하게 할 수 있다. 그 이상의 가치가 있을 수 있다.

여전히 커지는 딥마인드의 손실 규모는 고려할만한 가치가 있다. 딥마인드의 적자 규모는 2016년 1억5400만달러, 2017년 3억4100만달러, 2018년 5억7200만달러다. 마커스 교수는 여기에는 3가지 중요한 질문에 있다고 했다. 딥마인드는, 과학적으로 올마는 트랙에 있는 것인가? 이같은 규모의 투자가 알파밧의 관점에서 정상적인 것인가? 어떻게 이 손실이 전반적으로 AI에 어떤 영향을 미칠 것인가?가 그것이다.

첫번째 질문에 대해 회의론을 위한 이유는 있다.

딥마인드는, 그들의 달걀 대부분을 한 바구니에 담으려고 해왔다. 딥 강화 학습( deep reinforcement learning)이 그것이다. 이 기술은 인지 패턴에 주로 딥러닝과 보상 동기에 기반한 학습에 초점이 맞춰진 '강화학습'을 결합하는 개념이다. 보상 동기란 게임 점수나 체스 같은 게임에서 승리 또는 패배 같은 것을 말한다.

딥마인드는, 2013년 어떻게 단일 신경망 네트워크 시스템에서 브레이크아웃, 스페이스 인베이더스같은 다양한 아타리 게임들을 인간 만큼 또는 인간보다 잘 플레이하기 위해 훈련될 수 있는지 보여주는 흥미로운 논문에서 강화학습이라는 이름을 사용했다.

이 논문은 엔지니어링적으로 역작이었고, 2014년 딥마인드가 구글에 인수되는데, 핵심적인 역할을 했을 것이다. 나아가 강화학습의 진화는, 딥마인드가 바둑과 컴퓨터 게임인 스타크래프트에서 인상적인 승리를 하도록 이끌었다.

고민은, 강화학습은 특정 환경에서 매우 특화돼 있다는 것이다. 브레이크아웃을 플레이하는 것을 예를 들면, 노(Paddle)를 몇몇 픽셀 위로 올리는 것 같은 사소한 변화도, 큰폭의 성능 저하를 일으킬 수 있다. 딥마인드의 스타크래프트 성과는, 유사하게 제한적이었다. 싱글 캐릭터 레이스로 싱글맵에서 플레이했을때, 인간보다 나은 결과가 나왔다. 다양한 맵과 다양한 캐릭터에서의 결과는 좋지 않았다. 캐릭터를 바꾸기 위해, 시스템을 처음부터 다시 훈련시킬 필요가 있다.

어떤 면에서 딥 강화학습은 터보 충전지가 달린 기억 시스템과 같은 종류다. 딥 강화학습을 사용하는 시스템들은 놀라운 재주를 발휘할 수 있다. 그러나, 단지 그들이 하고 있는 것에 대한 얄팍한 이해만 할 수 있다. 그 결과, 현재 시스템은 유연성이 부족하다. 따라서 세상이 조금이라고 바뀌면 보완할 수 없다. 딥마인드의 최근 결과는 유사한 방식으로 의문이 제기돼왔다.

딥 강화 학습은 또한 막대한 규모의 데이터를 필요로 한다. 예를 들면, 수백만번의 바둑 자가 플레이아다. 바둑에서 월드 클래스가 되기 위해  인간보다 훨씬 더 많은 것을 요구한다. 그것은 자주, 어렵고 비싸다. 구글 규모 컴퓨터 자원을 요구하게 된다. 이것은, 많은 실제 세계 문제들에서 계산 시간만으로도 대부분의 사용자들이 고려하기에는 너무 비쌀것이라는 점을 의미한다.

예를 들면 알파고를 위한 훈련 시간을 위해 3500만달러의 비용이 들어갔다. 여기에 들어간 에너지량은 1만2760명의 인간 두뇌가 자지 않고 3일동간 계속 돌아가는데 소비된 에너지와 맞먹는 수준이다. 

그러나 이것은 단지 경제학이다. 실제 문제는, 어니스트 데이비스와 내가 조만간 내놓을 책 리부팅 AI에서 주장하는 것처럼, 신뢰다. 현재로선 딥 강화학습은 단지, 잘 통제된 환경에서만 신뢰될 수 있다. 그것이 바둑에서 잘 돌아가는 것은 거의 놀랄것이 없다. 바둑은 2000년 이상 바둑판이나 룰이 바뀌지 않았다. 그러나 당신은 많은 실제 세계 상황에서 딥 강화학습에 의존하는 것은 원치 않을 것이다.

딥 강화학습은 아직까지 상업적인 성공은 거의 없다는 점도 지적됐다.

딥마인드가 초점을 맞추고 있는 게임들 만큼 통제된 실제 세계의 문제는 거의 없다. 이에 딥마인드는 아직, 딥 강화학습을 대규모로 적용할 수 있는 분야를 찾지 못했다. 지금까지 알파벳은 딥마인드에 20억달러 정도를 투자했다. 여기에는 2014년 딥마인드를  인수하는데 들어간 6억5000만달러도 포함됐다. 홍보를 제외하고 직접적인 금융 보상은, 지난해 딥마인드가 1억2500만달러 가량의 매출을 올린 정도로 대단하지 않다. 이중 일부는, 구글 서버 냉각 비용을 줄이기 위해 딥 강화학습을 알파벳내에 배치하는 것에서 나왔다.

물론 딥 강화학습의 잠재력을 무시할수는 없다. 트랜지스터급 혁신이 될 수도 있다.

바둑에서 먹혀들었지만 딥마인드가, AI로 풀기를 열망하는 암이나 청정 에너지 같은 도전적인 문제들에선 돌아가지 않을 수도 있다. IBM은 제퍼디(Jeopardy)에서 승리한 왓슨 프로그램을 의학 진단에 적용하려 시도했을때 이것이 어려운 방법이라는 것을 알았다. 거의 성공하지 못했다. 왓슨은 일부 사례에선 잘 돌아갔고 일부에선 실패했다. 때때로 1학년 의대생도 분명하게 찾아낼 수 있는 심장병 같은 징후를 놓쳤다.

물론 이것은 간단하게 말해 시간의 문제일 수도 있다. 딥마인드는 적어도 2013년부터 딥 강화학습과 관련해 작업을 진행왔다. 아마 더 오래전부터 해왔을수도 있다. 그러나 과학적인 진보는 하루아침에 제품으로 나타나는 경우는 거의 없다.  딥마인드나 다른 회사들은 결국 딥 강화학습으로 깊고, 보다 안정적인 결과를 내는 방법을 찾아낼 수도 있고 그러지 못할 수도 있다. 딥 강화학습은 궁극적으로, 세상을 완전히 바꾼 기업 실험실의 연구 발명인 트랜지스터처럼 될수도 있다. 아니면, 존 메이너드 스미스가 한때, 문제를 찾는 솔루션이라고 불렀던, 일종의 학문적인 호기심일 수도 있다.

마커스 교수는 딥 강화학습의 미래에 관련한 개인적인 생각도 밝혔는데,  유용한 것과, 광범위한 도구 사이에서 어디쯤에 위치할 것으로 내다봤다. 하지만 세상을 바꾸는(a world-changer) 수준은 아닐 것이라고 선을 그었다. 하지만 딥마인드가 대단한 일을 하고 있는 회사라는 점은 부인하지 않았다.

그들의 현재 전략이, 많은 사람들이 기대했던 것보다 풍부하지 않다고 해도 누구도 딥마인드를 무시해서는 안된다.

딥 강화학습은 인공 일반 지능으로 가는 왕도는 아닐수도 있지만, 그러나 딥마인드 스스로는, 무시무시한 조직이다. 단단하게 돌아가고 자금도 잘 갖춰져 있다. 수백명의 박사들이 있다.

바둑, 아타리, 스타크래프트의 성공를 통해 얻은 유명세는 보다 재능있는 이들이 딥마인드에 합류하도록 유혹했다. AI에서 바람이 바뀌면 딥마인드는 다양한 방향으로 갈 수 있도록 잘 고정돼 있다. 

알파벳이라는 큰 맥락에서 1년에 5억달러는 큰 베팅이 아니다. 알파벳은 그 자체로도 빠르게 성장하고 있는 구글 브레인같은 다른 AI 프로젝트들에도 현명하게 베팅해왔다. 알파벳은 다양한 방식으로 AI 포트폴리오의 균형을 바꿀수 있다. 하지만 검색부터 광고 추천까지 모든 것에서 AI에 의존하고 있는 연매출 1000억달러짜리 회사인 알파벳에서 몇몇 상당한 투자를 하는 것은 미친짓이 아니다.

마지막 질문은  딥마인드의 경제적인 성과가 AI 전체적으로 어떤 영향을 미칠 것이냐 하는 것인데, 이것은 답을 쉽게 할 수 있는 문제는 아니라는게 마커스 교수 생각이다. 그러나 그의 칼럼을 보면 우려하는 뉘앙스가 꽤 엿보인다.

광풍이 실제로 전달하는 것을 초과하면 AI 겨울을 야기할 수도 있다. 지지자들 조차도 투자를 꺼릴 수 있다.  딥마인드의 손실이 계속해서 매년 두배가 된다면, 알파벳 조차도 결국 손을 떼는 압박을 받을 수도 있다. 어떤 지점에서 투자자들은 AI에 대한 그들의 열정을 다시 평가하도록 압력을 받을 수 있다.

이것은 단지 딥마인드에 대한 문제가 아니다. 스스로 운전할수 있는 자동차나, 대화를 이해할 수 있는 챗봇등 몇년전 약속했던 많은 진보들이, 아직 구체화되지 않았다. 말은 저렴하다. AI 열풍의 궁극의 수준은 무엇을 가져올 수 있느냐에 달려 있을 것이다.

현재로선 진정한 머신 인텔리전스는 개발보단 과열에 휩싸이기 쉽다. 광고나 음성 인식같은 제한된 영역에선 대단한 진보가 있는 반면에  AI는 의심할 여지 없이 가야할 길이 많다. 대용량 데이터세트의 타당한 분석의 혜택은 부정될 수 없다. 제한된 영역에선 AI는 이미 강력한 도구다. 기업 세계는 AI에 대해 덜 달아오를 수 있지만 완전히 빠져나올 수는 없다.

마커스 교수는 강화학습 이외의 분야를 주목할 필요가 있다고도 주문했다.

지금부터 10년간 우리는 딥 강화학습이 2010년대 후반에 과대 평가됐고 많은 다른 연구 영역들이 무시됐다고 결론 내릴 것이다. 강화학습에 투자된 모든 달러들은, 그밖에 다른 영역에 투자된 달러가 아니다. 예를 들면 인간 인지 과학의 통찰력은, 귀중한 단서들을 만들어낼 수도 있다.

머신러닝의 연구자들은, 이제 종종 묻는다. 어떻게, 머신이 상당한 양의 데이터를 사용해 복잡한 문제들을 최적화할 수 있을 것인가? 우리는 또한 물을 수 있다. "어떻게 아이들이 언어를 습득하고, 세계를 이해할 수 있을 것인가. 현재 AI 시스템들이 하는 것보다 에너지와 데이터를 덜 사용해서 말이다. 우리가 보다 많은 시간과, 돈 그리고 에너지를 전자보다 후자의 질문에 쓴다면, 우리는 인공 일반 지능을 보다 빨리 얻을 수 있을지도 모른다.

테크잇 뉴스레터를 전해드립니다!

오피니언 기반 테크 블로그 'TechIt'
테크 비즈니스를 보는 다양한 통찰들을 이메일로 간편하게 받아 볼 수 있습니다.

About the author

endgame
endgame

테크 블로거 / 공유할만한 글로벌 테크 소식들 틈틈히 전달하겠습니다

No more pages to load


TechIT

테크 비즈니스를 보는 다양한 통찰 '테크잇'

독자 여러분들께서 좋은 의견이나 문의 사항이 있으시면 아래 양식에 따라 문의 주시기 바랍니다.

Contact