왜 포커 챔피언 꺾은 AI 파괴력을 주목해야 하는가

카네기 멜론 대학이 개발한 머신러닝 시스템 리브라투스는 2017년 1월 최고의 포커 선수들과 3주에 걸쳐 1대1 게임을 했다. 결과는 리브라투스의 승리였다. 구글 딥마인드가 개발한 알파고가 이세돌 9단을 꺾은 지 1년여 만에 벌어진 일이다.

이 분야 전문가들은 리브라투스의 승리에 대해 깜짝 놀라는 반응을 보였다. 포커는 바둑이나 체스와는 급이 다르다는 이유에서였다.

빅토어 마이어 쇤베르거, 토마스 람게가 공저한 책 데이터 자본주의에 따르면 AI가 가진 의사 결정의 잠재력을 보여주는 상징적인 사건이었다.

포커는 멋진 게임이다. 심리학, 확률, 게임이론 등이 결합되어 있기 때문이다. 뛰어난 기억력, 계산 능력, 합리적인 사고가 모든 훌륭한 포커 선수의 능력의 근간을 이루고 있다. 하지만 이러한 특성만으로는 충분하지 않다. 프로선수라면 의사 소통 능력도 뛰어나야 한다. 테이블 앞에 앉아 상대가 보여주는 신호를 읽어야 한다. 단지 상대가 어떻게 앉아 있는지 어떻게 쳐다 보는지 카드는 어떻게 쥐고 있는지 뿐만 아니라 베팅하는 행동이 무엇을 나타내는지도 읽어내야 한다. 동시에 자신에 대해서는 아무런 말을 하지 말아야 한다. 그리고 때로는 상대가 미끼를 물기 바라면서 속임수도 써야 한다.

많은 측면에서 포커는 체스나 바둑 같은 상징적이고 추상적인 게임보다는 전략을 짜고 신호를 보내고 협상을 하고, 거래를 하는 현실적 경험에 더 가깝다. 실제 돈을 걸고 전략과 속임수에 관한 소문과 신호를 읽고 보내는 미묘한 관계 등 구성 요소가 매우 유사하다. 그래서 포커 챔피언을 꺾은 컴퓨터가 사람들을 깜짝 놀라게 하는 것이다. 그렇다면 중간에서 거래와 계약을 원만하게 하고 전략을 세우고 의사 소통을 하는 인간의 능력을 얼마나 고유한 것일까?

저자들은 리브라투스의 등장은 컴퓨터가 인간보다 사업적인 거래도 더 잘할 수 있다는 것을 보여준다고 강조한다.

리브라투스의 인상적인 승리는 컴퓨터가 인간보다 시장에서 거래를 더 잘할 수도 있으며, 혹은 최소한 인간이 시장에서 거래를 할 때 큰 도움을 줄 수 있다는 것을 나타낸다. 컴퓨터의 초당 계산 속도가 인간보다 더 빠르기 때문이 아니라 인간과 다르게 인지 제약의 영향을 받지 않고 명쾌한 상태를 유지하기 때문이다.

베팅 전략에 대해 생각해보자. 인간 포커 선수는 대부분 얼마 되지 않는 판을 따기 위해 큰 액수를 베팅하는 논리를 이해하지 못한다. 만일 어느 선수가 작은 판을 이기려고 큰 액수를 건다면 상대는 보통 돈을 거는 사람이 게임을 하는 방법을 잘 모르거나 형편없는 속임수를 쓰고 있다고 생각한다. 상대가 더는 돈을 걸지 않아 이기더라도 딸 수 있는 액수가 제한적이기 때문이다. 하지만 리브 라투스는 규칙적으로 큰 액수를 걸었고 마침내 큰 성공을 거두었다.

여러 가지 인지 편향의 영향으로 작은 판에 큰 돈을 거는 전략은 인간의 의사 결정에 혼란이 더해져 사용하지 않는다. 반대로 리브라투스는 상황이 바뀔 때마다 전략을 재평가했고 그날의 게임을 체계적으로 복기하고 상대방 인간의 행동 패턴을 추론하여 자신만의 전략을 갈고 닦으며 밤을 지새웠다. 그리고 리브라투스는 인간이 감당하기 어려운 거대한 양의 데이터를 집어삼켰다. 그 결과 리브라투스는 인간보다 훨씬 많은 승리를 거두었다.

전략의 재평가와 과거 데이터의 학습을 결합한 리브라투스에게 토너먼트 대회는 수많은 개별적인 게임이 아니라 인간 행동에 대한 값비싸고 고정된 모델에 머물지 않고 상대방의 행동과 약점을 찾아내는 일련의 게임으로 볼 수 있었다. 이것은 혁명한 현명한 협상가가 협상의 여러 과정에 걸쳐 사용하는 일종의 전략이자 순발력 있는 상인이 채택하는 전략으로 특히 반복적 시장 거래에 사용된다. 아니나 다를까, 리브라투스를 설계한 샌드홀름 교수는 복잡한 시장 거래에서 소비자와 기업을 대신하여 거래하는 시스템의 상용화를 계획하고 있다. 하지만 이것은 시작일 뿐이다. 리브라투스의 승리는 경제에 훨씬 근본적인 변화를 예시한다.

닉 보스트롬, 존 그레이엄-커밍, 피터 노빅, 토시 월시 등이 저자로 참여한 책 '기계는 어떻게 생각하고 학습하는가'에서도 리브라투스는 혁신적인 사례로 묘사된다.

포커를 잘하는 인공지능이 대단한 이유는 포커가 불완전한 정보를 다루는 게임이기 때문이다. 플레이어는 상대방의 카드 패를 모르고, 그래서 게임 상황의 전체 정보를 알 수가 없다. 다시 말해 인공지능은 상대방에 어떻게 플레이를 하는지, 또는 블러핑을 하는 것인지를 고려해 좋은 패가 들어왔을 때 포기하지 않도록 전략을 다시 다듬어야 한다. 이 승리는 인공지능에게 또 하나의 중요한 이정표가 되었다. 리브라투스의 알고리즘은 포커에만 한정된 것이 아니고 게임에만 한정된 것도 아니다. 이 인공지능은 어떤 젼략도 먼저 입력받지 않고 주어진 정보(여기에서는 포커 규칙)에 기초해 스스로 플레이하는 방식을 만들어내야 했다. 즉 리브라투스는 불완전한 정보에 근거한 대응이 필요한 어떠한 상황에도 적용해 쓰일 수 있다는 뜻이다.

우리의 일상적인 삶은 불완전 정보로 가득하다. 리브라투스를 개발한 카네기멜런 대학교의 연구팀은 사이버보안, 협상, 군사 상황, 경매와 같은 상황에서 이 인공지능이 유용하게 쓰일 수 있다고 생각한다. 또 인공지능이 게임 전략처럼 치료 계획을 분석해 감염 질병과의 싸움을 도울 수 있게 하는 방법도 연구해왔다.

테크잇 뉴스레터를 전해드립니다!

오피니언 기반 테크 블로그 'TechIt'
테크 비즈니스를 보는 다양한 통찰들을 이메일로 간편하게 받아 볼 수 있습니다.

About the author

endgame
endgame

테크 블로거 / 공유할만한 글로벌 테크 소식들 틈틈히 전달하겠습니다

No more pages to load


TechIT

테크 비즈니스를 보는 다양한 통찰 '테크잇'

독자 여러분들께서 좋은 의견이나 문의 사항이 있으시면 아래 양식에 따라 문의 주시기 바랍니다.

Contact