구글, 자율주행차에 딥마인드 기술 투입..."재훈련 AI 역량 주목"

구글 모회사 알파벳 산하 자율주행 스타트업인 웨이모가 같은 알파벳 계열사인 딥마인드와 자율주행차용 AI 기술과 관련해 협력하고 있다는 소식이다. 자율주행차는 시시각각 변화하는 환경에 직면할 수 밖에 없는데, 양사 협력은 시시각각 변화하는 환경에 AI가 잘 대응할 수 있도로 ㄱ하는데 초점이 맞춰져 있다.

답마인드 블로그와 MIT테크놀로지 보도에 따르면 양사는, 예전에 딥마인드가 비디오 게임 알고리즘을 다듬기 위한 사용한 기술인  인구 기반 트레이닝(population-based training: PBT)을 자율주행차에 적용한다. 

PBT는 생물학적인 진화에서 영감을 받았다고 한다. 알고리즘 인구에서 후보자 코드가(주어진 업무를 가장 효율적으로 하는) 최적의 표본을 끌어오게 함으로써, 머신러닝 알고리즘의 선택 속도와 특정한 업무를 위한 매개변수 속도를 끌어올린다. 

이같은 방식으로 AI 알고리즘을 다듬는 것은 웨이모의 내공을 끌어올리는데 도움이 될 수 있다. 자율주행차를 안내하는 알고리즘은 차량이 보다 많은 데이터를 수집하고, 새로운 지역에 배치됨에 따라 재훈련 및 재측정될 필요가 있다.

십여개 회사가, 최고의 자율주행 기술을 보여주기 위해 실제 도로에서 레이스를 벌이고 있는 가운데,  웨이모는 머신러닝 알고리즘 개발을 가속화하고 자동화하는 다양한 다른 방식들을 모색하고 있다.

실제로 머신러인 코드를 재훈련하기 위한 보다 효율적인 방식은 AI가 다양한 맥락에서 유연하고 유용성을 갖도록 해줄 것이라는 설명이다.

매튜 데민 웨이모 머신러닝 인프라 스트럭처 부문 디렉터는 "한 산업 시스템에서 머신러닝을 하려는 누구나 직면한 핵심 도전들 중 하나는 새로운 코드의 이점을 활용할 수 있도록 시스템을 재개발하는 것"이라며 "우리는 끊임없이 네트워크를 재교육하고, 코드를 재작성할 필요가 있다. 당신이 재교육할때, 당신은 당신의 매개변수들을 수정할 필요가 있다"고 말했다. 상황 변화에 맞게 AI를 빠르게 개조할 수 있는 역량이 자율주행차를 실전에 투입하는데 있어 중요한 경쟁력이 됐다는 얘기다.

최신 자율주행차들은 거의 대부분 알고리즘과 기술들의 루비 골드버그 조합(Rube Goldberg combination)에 의해 통제된다. 

많은 머신러닝 알고리즘은 센서 데이터에서 차선, 다른 차량, 보행자들을 찾아내는데 사용된다. 이들 작업은 차량을 통제하기 위해 전통적인 기술이나 손으로 짜여진 코드와 협력하게 된다. 그리고 다양한 가능성에 반응한다. 또 각각의 새로운 자율주행시스템 버전은 엄격한 시뮬레이션 환경에서 테스트되어야 한다.

요즘의 자율주행차량들은, 특히 딥러닝에 많이 의존한다. 하지만 적합한 속성과 매개변수를 가진 딥 신경망을 설정하는 것은 어려운 일이다.  후보 네트워크와 매개변수들은 대체로 수작업으로 선택되는데, 이것은 시간을 소모하는 일이다. 한 컴퓨터에 대해 무작위로 수정될 겅우 많은 프로세싱 파워가 필요하다.

웨이모에서 머신러닝 인프라스트럭처 엔지니어로 있는 조시 첸은 "웨이모에서 우리는 수없이 다른 신경망을 훈련한다. 연구자들은 어떻게 이들 신경을 가장 잘 훈련시킬지 이해하기위해 많은 시간을 들이고 있다"면서 "우리는 그것에 대한 필요성을 인식하고 이같은 작업에 뛰어들었다"고 말했다.

첸에 따르면 그의 팀은 이제 좁은 길 표시, 차량, 보행자를 감지하고 다른 머신러닝 알고리즘들에 공급되는 라벨이 붙은 데이터의 정확도를 검증하는 딥러닝 코드 개발을 향상하기 위해 PBT를 사용하고 있다. PBT를 통해 신경망을 재교육하는데 요구되는 컴퓨터 파워를 절반 가량 줄였고, 개발 사이클 속도는 2~3배 끌어 올렸다는게 그의 설명이다.

 구글은 머신러닝 모델을 훈련시키는 프로세스를 자동화할 수 있는 다양한 기술들을 개발중이다. 구글은 이미 그들중 일부를 클라우드 오토 ML로 알려진 프로젝트를 통해 고객들에게 제공하고 있다. AI 훈련을 보다 효율적이고 자동화시키는 것은 확실히 AI를 상업화하고 수익을 거두는데 결정적인 요인이다.

 PBT 기술을 발명한 사람 중 하나이자 딥마인드에서 수석 연구 과학자로 있는 오리올 빈얄스는  웨이모에서 PBT를 도입하는 아이디어는 그가 데빈을 방문했을때 나왔다고 말한다. 

비냘스와 그의 동료들은 처음에 스타크래프트2 게임을 하기 위해 PBT를 개발했다. 강화학습을 통한 컴퓨터 훈련 속도를 끌어올리기 위해서였다.

강화학습은 머신러닝의 방법론 중 하나로 에이전트(특정 목적에 대해 사용자를 대신하여 작업을 수행하는 자율적 프로세스)가 주어진 환경에서 어떤 환경을 취하고 어떤 이로부터 어떤 보상을 얻으면서 학습을 진행합니다. 즉 강화학습은 시행착오를 통해 학습하는 방법 중 하나입니다. 현재 강화학습은 대부분 게임 및 로봇 분야의 문제를 푸는데 활용되고 있지만 실제로 유용한 애플리케이션을 만든 사례는 아직 없습니다. 하지만 구글의 자회사이자 알파고를 만든 딥마인드와 같은 기업들이 강화학습에 대한 연구를 활발히 진행하고 있으며, 자율주행차, 자원관리, 교육시스템 등에 널리 활용될 것이라 생각됩니다.-AI마인드 용어 정리 부분 인용

PBT를 채용한 이같은 진화는, 딥러닝 알고리즘이 어떻게 다듬어졌고 최적화됐는지 이해하는 측면에서도 유용하다. 족보와 유사한 개념이다. 비냘스는 "멋진 것 중 하나는 매개변수의 진화를 시각화할 수 있다는 것이다. 무슨일이 일어나는지 실제로 당신이 이해할 수 있도록 검증하는데 좋은 방법"이라고 말했다.

딥마인드는 현재 라벨이 붙은 데이터를 갖고 학습을 시키는 이른바 지도학습 중심의 딜러닝에서 크게 도약하기 위해 강화학습 기술에 대담하게 베팅했다. 강화학습은 범용적으로 쓰기가 어렵다는 인식이 지배적인데, 딥마인드의 경우는 강화학습에서 AI의 미래를 보고 있는 것 같다.

딥마인드 창업자 데미스 하사비스는 딥러닝이 기술을 키우기 위해서는 다른 기술과 결합해야 하며, 그 핵심은 강화학습이 될 것이라는 입장이다. '로봇의 부상' 저자 마틴 포드가 전세계적으로 유명한 AI 전문가들과 AI에 대한 다양한 주제로 대담한 내용을 정리한 책 AI마인드에 따르면 하사비스 대표는 딥러닝의 다음 10년은 강화학습의 발전을 주목해야 한다고 강조한다.

“앞으로는 그럴거에요. 제 생각에는 그 기술 자체로 상당히 강력하지만 규모를 키우기 위해서는 다른 것들과 결합시켜야 합니다. 강화학습은 오래전부터 연구되어 왔지만 적용 범위를 확장할 수 있는 부분이 상당히 어렵기 때문에 아주 작은 쉬운 문제들을 푸는데만 사용되어 왔죠. 우리는 아타리 게임에서 딥러닝을 활용해 화면의 정보와 환경들을 처리했어요. 그러니 강화학습이 잘 적용되었고 10년전만 해도 불가능하다고 여겨졌던 많은 것들이 해결됐습니다. 

테크잇 뉴스레터를 전해드립니다!

오피니언 기반 테크 블로그 'TechIt'
테크 비즈니스를 보는 다양한 통찰들을 이메일로 간편하게 받아 볼 수 있습니다.

About the author

endgame
endgame

테크 블로거 / 공유할만한 글로벌 테크 소식들 틈틈히 전달하겠습니다

No more pages to load


TechIT

테크 비즈니스를 보는 다양한 통찰 '테크잇'

독자 여러분들께서 좋은 의견이나 문의 사항이 있으시면 아래 양식에 따라 문의 주시기 바랍니다.

Contact