• 인쇄
  • 전송
  • 보관
  • 기사목록

[퓨처 라이프: AI 음성비서] 아마존·구글 독주에 한국기업 도전장

  •  

cnbnews 제528호 윤지원⁄ 2017.03.27 11:24:58

▲아마존은 인공지능 음성비서 알렉사를 탑재한 스마트홈 제어 스피커 ‘에코’로 인공지능 음성비서 시장의 선두를 달리고 있다. (사진 = 아마존)


3월 20일 삼성전자가 새 플래그십 스마트폰 갤럭시S8에 인공지능(AI) 음성비서인 빅스비(Bixby)를 탑재한다고 밝히면서 AI 음성비서에 대한 관심이 더욱 높아지고 있다. 애플이 2011년 음성비서 시리(Siri)를 공개한 이후 2012년엔 구글 나우(Google Now)가, 2014년엔 MS 코타나(Cortana)와 아마존의 에코 스피커에 내장된 알렉사(Alexa) 등이 나왔다. 구글 나우는 이후 구글 어시스턴트(Google Assistant)로 업그레이드 됐고, 에코 알렉사와 유사한 스피커 형태의 구글 홈(Google Home)도 내놓았다. 

국내에서는 SK텔레콤과 KT 등 이동통신업체들이 에코나 구글 홈과 비슷한 기능을 하는 음성비서 내장 스피커 누구(NUGU)와 기가지니를 차례로 내놓았다. 또한, 네이버와 카카오도 AI 기술과 제품을 개발하기 위한 조직을 꾸리고 신제품 출시를 준비 중이다.


▲구글의 인공지능 음성비서 ‘구글 어시스턴트’가 탑재된 스마트홈 제어 스피커 ‘구글홈’. (사진 = 구글)


 왜 음성 비서인가?

1년 전인 2016년 3월, 이세돌 9단과 바둑대결을 펼쳤던 구글의 알파고는 한 판을 제외하고 모든 대국에서 승리함으로써 AI 기술이 어느 수준까지 발전해 있는지를 보여주었다. 전 세계가 AI에 대해 폭발적인 관심을 보이기 시작했고, 애플, 구글, 아마존 등 글로벌 IT 기업들은 AI 분야를 선점하기 위해 적극적인 투자를 아끼지 않고 있다. 

시장조사기관 IDC는 AI 시스템 시장에 관한 보고서에서 전 세계 인지 컴퓨팅 및 AI 시스템 시장이 2016년부터 2020년까지 5년간 연평균 55.1%의 급격한 성장률을 보일 것으로 전망했다. 이 보고서에 따르면 2020년의 AI 시장은 약 470억 달러(한화 약 56조 8700억 원)에 달할 전망이다.

글로벌 IT기업들이 향후 인공지능 분야의 핵심으로 꼽는 부문은 음성비서와 이미지를 분석하는 인지 분야다. 이들 기업들이 이미 상용화한 대표적인 AI 상품은 애플의 시리, 구글의 구글홈, 아마존의 알렉사, 마이크로소프트(MS)의 코타나 등인데, 우연히도 모두 음성을 통해 다양한 기능을 제어하는 플랫폼 역할을 하는 음성 비서 서비스다.

MS의 빌 게이츠는 2015년 레딧(reddit)이 주최한 일반 네티즌과의 공개 채팅에서 AI가 음성 비서의 형태로 먼저 구현되는 이유에 대해 밝힌 바 있다. 당시 빌 게이츠는 “지금과 같이 사용자가 각각의 앱을 실행시키고 최신 정보를 확인하는 것은 비효율적”이라며 “앞으로는 개인 비서가 정보를 종합해서 알려줄 것”이라고 전망했다. 구글의 에릭 슈미트 회장도 2014년 말 한 행사에서 “앞으로 5년 동안 모바일 기기와 관련된 중요한 변화는 개인 비서화”라고 주장하며 “사람들은 스마트한 비서를 개인적으로 하나씩 가지게 될 것”이라고 전망했다.

음성비서, 낯선 기술 아니야

마블의 SF 영화 ‘아이언맨’ 시리즈에서 토니 스타크(로버트 다우니 주니어 분)는 자비스(Javis)라는 AI 음성비서를 사용한다. 이 시리즈는 전 세계적으로 수억 달러를 벌어 들였고, 덕분에 IT 업계 종사자들이 아닌 일반 사용자도 음성 비서가 어떤 일을 하는지 익숙하게 알고 있다.

자비스의 능력은 실제 구현되는 기술보다 훨씬 높은 수준이긴 하지만, 일반 사용자들의 현실 세계도 영화와 닮아가고 있다. 단순히 모터나 전구로만 동작하던 세탁기, 냉장고, 조명 등의 가전제품도 훨씬 스마트하게 진화했고, 이런 다양한 기기들을 한 곳에서 제어하고, 각각의 데이터를 수집, 분석, 가공하는 허브(Hub) 서비스는 이미 오래 전부터 시도되어 왔다.

아파트 인터폰은 단순히 현관에 도착한 사람의 신원을 확인하는 역할을 넘어 전화, 집 안팎의 전자기기 제어, 보안의 기능을 통합한 지 오래 됐다. 여기에 와이파이, 4G 무선통신망 등을 활용하는 IoT 기술과 웨어러블 기기 등이 발달하면서 허브 서비스가 할 수 있는 일은 더욱 정교하고 다양해졌다. 음성 비서는 바로 이 허브 서비스와 목적과 기능이 동일하다.

차이점이라면 이런 서비스를 사용하는 방법이 단순하고 편리하게 변했다는 점이다. 버튼을 누르거나 터치를 통해 명령을 입력하기, 또는 모니터에 표시되는 데이터를 읽고 기억할 필요가 없다. 사용자는 말로 명령을 내리고 대답을 들으면 되고, 중요한 데이터는 음성비서가 대신 기억해준다.

한 IT 업계 관계자는 현재 음성비서 기술에서 가장 시급한 것은 사용자의 음성 명령을 얼마나 정확히 잘 인식하느냐의 문제를 해결하는 것이라고 지적했다.

전문가들은 현재 상용화된 음성비서들의 음성 인식 정확성이 영어 단어 기준으로 약 90% 수준에 그치는 것으로 보고 있다. 이 관계자는 시리와 구글홈은 영어를 약 95% 정도 알아듣는 것으로 보인다고 분석했다. 사람도 남의 말을 100% 알아듣지 못하는데 95% 정도면 거의 다 알아듣는 것 아닌가 싶었지만 그 5~10%가 사용자의 구매 결정을 좌우한다는 것이 이 관계자의 지적이었다.

2016년 5월 미국의 벤처 투자업체인 ‘클라이너 퍼킨스 코필드 앤드 바이어스(KPCB)’도 ‘인터넷 동향 2016’ 보고서를 통해 “인간과 기계 간 음성 상호작용에서의 의미·이해 정확성이 95% 정도라면 해당 서비스를 이용할 사람은 별로 없겠지만 99%가 된다면 사실상 모든 사람이 이용할 것”이라고 전망했다.

▲MS의 인공지능 음성비서 코타나는 음성인식 기술이 뛰어나지만 아직 MS-오피스 등 윈도우 기반의 업무용 소프트웨어들 외에 생태계를 넓히지 못해 경쟁 서비스에 비해 활용도가 낮은 편이다. (사진 = MS 코타나 작동화면)


 어떤 음성비서가 일을 잘하나?

삼성전자가 갤럭시S8에 탑재하는 음성비서 빅스비는 기존의 음성비서들과 경쟁해야 한다. 현재 글로벌 IT 기업들이 만든 음성비서 서비스 중에서는 애플의 시리, 구글 어시스턴트, 아마존 에코 알렉사, MS 코타나 등이 앞서가고 있다.

이 서비스들은 대부분 상대 회사의 기기에서는 사용할 수 없고, 써드 파티 앱과의 연동 기능에서도 큰 차이를 보였다. 시리는 아이폰과 아이패드 등 애플 기기에서만 사용이 가능하며, MS 코타나는 윈도10 폰, 아마존은 에코 등에서만 제대로 작동한다.

날씨, 일정, 스포츠 경기 결과, 방송 프로그램 편성표 안내, 대중교통 안내 등 일상적인 정보를 묻는 질문에 대해 약간의 속도 차이는 있지만 모든 음성비서들이 제대로 대답하는 편이다. 음악 재생 명령은 각각 자기 브랜드의 하드웨어와 연동할 경우 문제없이 작동한다.

그 밖의 기능에서는 각각의 서비스가 다른 특징들을 보이고 있다.

‘그’가 누군지 이해하는 구글 어시스턴트

음성비서에게 첫 번째 질문을 하고 대답을 들은 다음, 그 질문과 관련된 대명사를 이용해 다음 질문을 이어서 할 경우가 있다. 구글 어시스턴트는 이럴 때 대화의 맥락을 이해하는 능력에서 다른 음성비서들보다 뛰어나다.

예컨대 첫 질문으로 “‘2001 스페이스 오딧세이’의 감독이 누구지?”라고 물어볼 경우 모든 음성비서가 “스탠리 큐브릭”을 답으로 내놓는다. 그런 다음 이어서 “그의 생일은 언제지?”라는 질문을 물어볼 경우 알렉사는 질문을 이해하지 못하고, 시리는 검색엔진에 ‘그의 생일은 언제지’를 검색한 결과를 내놓는 반면 구글 어시스턴트와 MS 코타나는 ‘그’가 큐브릭 감독을 지칭한다는 걸 이해하고 “1928년 7월 26일, 미국 뉴욕 주 뉴욕 맨해튼에서 태어났다”는 답을 내놓는다.

다만 MS 코타나는 대부분의 질문에 대한 대답을 검색엔진 빙(Bing)으로만 검색해서 내놓기 때문에 다른 음성비서들보다 한계가 뚜렷하다.

또한, 구글 어시스턴트는 지메일, 캘린더, 유튜브, 유튜브 뮤직, 앱스토어, 안드로이드, 사진, 뉴스, 번역 등 구글이 서비스하는 방대한 영역에 걸쳐 활용할 수 있어 가장 유기적이고 일관된 사용자 경험을 제공한다. 따라서 대화의 맥락만 파악하는 것이 아니라 이런 서비스들에 포함된 각종 정보를 다각적으로 고려하고 종합하는 맥락 파악도 탁월하다. 특정 시간에 사용자의 약속 스케줄을 등록하면, 해당 장소까지의 교통 정보를 자동으로 표시한다.

스마트홈 환경에서 앞서가는 아마존 알렉사

알렉사는 아마존의 스피커형 스마트홈 제어 플랫폼인 에코에 설치된 음성비서다. 시장조사업체 포레스트 리서치에 따르면 에코 알렉사는 2014년에 출시되어 현재까지 600만 대 이상 판매되었다. 스마트폰과 비교하면 여전히 미미한 수준이지만 음성비서 시장에서는 가장 높은 점유율을 차지하고 있다.

알렉사의 음성 인식 능력은 경쟁 서비스인 시리, 구글 어시스턴트에 비해 조금 무딘 편이다. 스마트폰 생태계 안에서 날고 기던 시리나 구글 어시스턴트에 비해 대단하게 내세울만한 새로운 기능도 없었다. 처음에는 아마존의 인터넷쇼핑 생태계에서나 편리하게 사용되는 데 그쳤다. 하지만 지금은 ‘가장 선호하는 IoT 기기’로 꼽히고 있다. 트위터, 우버, 네스트 같은 각종 앱들과 연결되고 LG, GE, 포드 등이 알렉사와 연동되는 제품을 적극적으로 내놓고 있기 때문이다.

아마존은 2015년, 써드 파티 업체들에게 알렉사의 소프트웨어 개발자 키트(SDK)를 공개했다. 누구나 자기들이 개발하는 제품에 알렉사를 활용할 수 있게 만든 것이다. 지난 1월 라스베이거스에서 개최된 소비자가전박람회(CES) 2017에서 알렉사와 연동하는 제품들이 가전제품부터 자동차까지 14개나 선보였다. 스타벅스나 피자 배달 업체도 알렉사를 활용한 서비스를 내놓았다.

아마존은 2월 23일 현재 알렉사에서 활용 가능한 기능이 1만 개를 넘겼다고 밝혔다. 2015년 말에 135개 기능이었던 것과 비교하면 엄청난 진화다. 스마트 홈과 스마트 카 제어 기능에서 알렉사는 어느새 애플과 구글의 음성비서를 뛰어 넘었다. 시리는 일곱 살이 되도록 아직 아이폰에 묶여 있고 구글은 너무 늦게 써드 파티에 개방되어 활용도가 낮다. 가장 느릴 줄 알았던 알렉사는 다양한 IT 제품과의 연동을 통해 가장 쓸모 있는 음성비서임을 증명하고 있다.

▲애플은 2011년 가장 먼저 인공지능 음성비서 시리를 내놓았으며, 가장 뛰어난 음성 인식 성능과 검색 및 대화 기능을 갖췄지만 변화하는 사용자 요구에 맞춰 진화하지 못하고 제자리걸음을 걷고 있다. (사진 = 애플 홈페이지)


업무 자동화의 든든한 파트너 MS 코타나

MS 코타나의 음성인식 성능과 맥락 이해 능력은 뛰어난 편이지만 아직 경쟁 서비스에 비해 시장 점유율은 낮은 편이다. 하지만 MS 오피스와 같은 막강한 사무용 소프트웨어들과의 궁합이 뛰어나 장차 업무 자동화 분야에서 발전 가능성이 높다. 또한 MS는 코타나의 코드 자체를 개방하면서 자체 생태계를 확보하는 전략을 펴서 주목 받고 있다.

대답은 잘 하지만 제자리걸음인 애플 시리

2011년 아이폰 4S와 함께 공개되었으니 가장 오래된 음성비서다. 하지만 여전히 아이폰과 아이패드 같은 모바일 스마트기기에만 묶여 있는 편이고, 최근에야 IoT를 활용한 스마트홈 플랫폼 ‘홈키트’를 지원하는 제품을 열심히 추가하는 중이다.

확장성에서는 한계가 뚜렷하지만 질문에 대해서는 가장 똑 부러지게 대답하는 편이다. 가장 다양한 서비스를 활용해서 문제를 해결하기 때문이다.

시리는 일반 검색에 야후를 이용한다. 그리고 수학·과학 등 지식 기반 검색은 관련 검색엔진 중 최강이라고 하는 울프람 알파(Wolfram Alpha)를 이용한다. 그 밖에 다른 서비스는 대부분 애플의 앱을 이용한다.

예컨대 지구와 달 사이의 거리, 특정 영화의 감독 등을 묻는 등의 질문이 다소 복잡한 구조의 문장이라 해도, 답이 명확히 정해진 질문이라면 가장 잘 정리된 정답과 일목요연한 관련 정보 요약을 내놓는 편이다.

▲SK텔레콤의 인공지능 음성비서 스피커 ‘누구’는 아마존 에코 알렉사나 구글홈 같은 스마트홈 서비스 생태계를 구축하고자 하지만 경쟁사 제품들에 비해 뛰어난 킬러 콘텐츠가 없어 출시 후 반년 동안 6만 대 정도를 판매하는 데 그치고 있다. (사진 = SK텔레콤)


 국산 음성비서들의 현주소

삼성 빅스비

삼성전자는 지난해 10월, 시리의 개발에 참여했던 인력이 모여 설립한 AI 스타트업 ‘비브랩스(VIV Labs)’를 인수했다. 인수 비용은 약 2억 1500만 달러(약 2500억 원)로 알려졌다. 비브랩스는 삼성의 빅스비 개발에 전념했고, 3월 21일 공식 뉴스룸 사이트를 통해 음성비서 빅스비의 탄생을 공식 발표했다.

삼성이 강조하는 빅스비의 특징은 3가지로 요약된다.

첫째는 완전성(completeness)이다. 경쟁 업체의 음성비서들은 다른 앱을 사용하는 동안에는 쓸 수 없거나, 쓸 수 있는 음성 명령이 제한적이지만 빅스비는 앱을 사용하는 동안에 필요한 모든 동작을 완전하게 수행할 수 있다고 밝혔다.

둘째는 맥락 인식(context awareness) 능력이다. 빅스비는 앱을 사용하는 동안에도 언제든 불러서 사용할 수 있다. 그런 상황에서 새롭게 대화를 시작하는 것이 아니라 기존 작업의 진행 상황을 이해하고 그 맥락 안에서 부드럽게 동작한다고 설명하고 있다.

셋째는 인지적 관용(cognitive tolerance)이다. 이는 ‘딥러닝’ 기술을 적용한 것으로, 사용자의 음성 명령이 다소 부정확할 때에도 사용자와의 반복된 대화에서 학습된 내용을 바탕으로 전체 맥락 안에서 지시하는 명령을 알아서 파악한다는 것이다.

또한 삼성전자는 빅스비가 스마트폰 안에만 제한되는 것이 아니라 삼성에서 개발하는 제품들에도 공통으로 적용될 것이라고 밝혔다. 삼성전자만큼 다양한 제품군을 보유한 데다 대부분의 제품이 세계적인 수준의 기술력을 갖춘 기업은 아마도 없다. 빅스비를 활용한 IoT 생태계 구축에 있어 삼성전자는 유리한 위치에서 출발하는 셈이다. 또한, 삼성전자는 아마존 알렉사의 성공 사례를 참고해 빅스비의 기술을 개방해 써드 파티 앱까지 적극적으로 포용할 예정이다.

▲KT의 ‘기가지니’는 올레TV 셋톱박스 기능을 갖춘 고급 하만-카돈 스피커에 인공지능 음성비서를 탑재한 제품이다. (사진 = KT)


네이버의 ‘클로바’와 카카오의 ‘카카오브레인’

네이버와 카카오도 AI 관련 개발 전담팀을 꾸리고 적극적으로 음성인식 관련 기술 개발에 나선 상태다. 

네이버는 지난 2일 스페인 바르셀로나에서 열린 모바일 월드 콩그레스(MWC)에서 인공지능 기술 클로바를 소개하고 아시아를 아우르는 AI 생태계를 조성한다는 계획을 밝혔다. 클로바는 네이버와 일본에 설립된 자회사 라인주식회사가 합동으로 개발한 AI기술로, 음성인식은 물론 이미지 인식도 가능한 기술로 알려졌다.

네이버는 클로바가 탑재된 음성인식 스피커 ‘웨이브’를 올해 상반기 중으로 한국과 일본에서 동시에 출시할 예정이다. 또한 클로바는 네이버 포털과 라인 메신저 서비스에 적용될 예정이다. 네이버는 클로바의 AI 생태계 확장을 위해 LG전자, 소니, 다카라토미 등과 손잡는 등 발빠른 행보를 보이고 있다.

클로바는 국내 시장보다도 월간 활동 사용자가 2억 명이 넘는 라인 사용자들을 확보하고 있는 일본, 태국, 대만 등 아시아 시장을 주요 타깃으로 삼고 있다.

카카오도 창업자인 김범수 의장을 앞세워 AI 전문 자회사를 설립하고 카카오브레인이라는 타이틀을 달았다. 네이버가 이미 웨이브 출시를 눈앞에 두고 마케팅 역량을 펼치고 있는 단계인 데 비하면 카카오브레인은 아직 AI 중에서도 특히 어떤 분야를 집중 개발할지 미지수인 상황이다. 다만 네이버와 마찬가지로 메신저 플랫폼인 카카오톡에 AI를 접목시킬 가능성이 높은 만큼 챗봇이 먼저 개발될 것으로 전망되며, 음성인식 기술 역시 개발 계획을 갖고 있다.

임지훈 카카오 대표이사는 지난 2월 4분기 실적 발표 이후 진행된 기자회견에서 “음성 인식, 이미지 인식, 자연어 처리 등 AI 기술 개발을 꾸준히 진행하고 있다”며 “구체적인 사업 내용은 2분기에 공개하겠다”고 밝혔다. 한 업계 관계자는 카카오가 당장은 네이버의 뒤를 쫓아갈 수밖에 없는 입장이지만 개성 있는 ‘한 방’을 마련할 저력은 갖추고 있는 것으로 본다고 밝혔다.

SKT ‘누구’와 KT ‘기가지니’

이동통신 3사도 음성비서 제품 개발에 적극적이다. 현재 대부분의 음성비서들이 미국 기업들에 의해 만들어져 한국어 인식 능력에서는 국산 기술과 큰 차이가 없다. 이런 점에서 SKT와 KT는 IPTV 같은 기존 인프라와 결합하는 형식으로 알렉사나 구글홈 같은 스피커 형 음성비서를 각각 내놓았다.

하지만 알렉사의 경우 후발주자였음에도 불구하고 온라인 상거래에서 독점적인 지위를 점하고 있는 아마존과의 연계를 통해 폭발적인 유통 장악력을 과시할 수 있었지만, SKT와 KT는 글로벌 경쟁 제품들보다 뛰어난 기능을 발휘하지도 않는다는 평가를 받는 데다 차별화된 킬러 콘텐츠도 부족해 아직까지 경쟁 제품들에 쏠려 있는 시장의 관심을 돌려놓는 데 성공하지 못하고 있다.







관련태그
CNB  씨앤비  시앤비  CNB뉴스  씨앤비뉴스

배너
배너
배너

많이 읽은 기사

배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너
배너