Bookmark and Share
매일같이 이용하는 자동차와 TV, 세탁기, 휴대폰 등 인간이 만들어낸 수많은 기기들은 모두 사람의 손으로 조작해 사용합니다. 기기의 조작 방법은 점점 더 편하고 쉬워지고 있지만 손을 대지 않고 사용할 수 있는 것은 별로 많지 않죠.

음성 인식 스마트폰

만약 기계가 사람의 말을 알아듣고 시키는대로 움직일수 있다면? 더이상 기계를 조작하느라 신경쓸 필요가 없고 그 시간에 다른 일을 할 수 있습니다. 이처럼 기기들을 더 편하고 쉽게 사용할 수 있는 방법을 찾다가 고민끝에 생각해 낸 방법이 바로 음성인식 기술입니다. 

음성인식 기술은 오래전부터 많은 과학자들이 관심을 갖고 연구해온 분야입니다. 초기에는 숫자나 음절 단위를 인식하는데 그쳤지만 인식기술이 점점 발전하면서 특정 음성명령을 인식하게 되었고 차츰 단어와 문장까지 인식하는 수준으로 발전하게 되었죠. 최근에는 배경 잡음까지 구별하게 되었고 의미까지 파악해 사람과 대화까지 가능한 수준으로 발전하고 있는 중입니다.

전격제트작전, KITT

일반인들도 공상과학 영화나 드라마를 통해 오래전부터 접해왔기 때문에 음성인식 기술은 그리 생소한 분야가 아닙니다. 마이너리티 리포트나 전격제트작전의 KITT, 조금 더 거슬러 올라가면 스타워즈의 로봇 R2D2 등에도 음성인식 기술이 적용된 장면이 있어 많이 친숙해져 있는 기술이죠.

스마트폰과 태블릿에 사용되는 모바일 OS에도 이러한 음성인식 기술은 적용되어 있습니다. 대표적인 음성인식 서비스로는 애플의 시리(Siri), 안드로이드의 구글 나우(Google Now), 그리고 최근 소개된 MS 윈도폰의 코타나(Cortana)가 있죠.


시리 (Siri)

Apple Siri (애플 시리)

시리 (Siri)는 애플의 음성인식 비서 서비스로 음성으로 검색을 하고 명령을 내릴수 있습니다. 자연어 음성인식 서비스로 지역정보, 날씨, 교통상황 등 생활정보 검색과 일정을 체크해 음성으로 알려주고 관련 정보를 알려주는 등의 개인 비서 기능을 가지고 있죠. 음성으로 전화를 걸거나 메시지를 보내고, 알람을 설정하거나 회의 일정 등을 잡을수 있습니다. 

Apple Siri (애플 시리)

시리는 평소에 말하듯 자연스럽게 얘기하면 시리가 말하는 내용을 알아듣고 목소리로 답을 주는 특징을 가지고 있죠. 예를 들어 피곤하다고 말하면 잠을 자지 못했는지 묻거나 운전을 하지 말라고 얘기해 주는 등 어느정도는 의미를 파악해 그에 맞는 대답을 해줍니다.

Apple Siri (애플 시리) CarPlay 카플레이
 
시리는 아이폰과 아이패드의 운영체제인 iOS에서 사용할 수 있는데, 최근에는 카플레이(Carplay)라는 자동차용 서비스에도 확장되어 사용되고 있습니다. 글로벌 자동차 회사와 협업을 통해 차량 핸들에 시리를 활성화할 수 있는 Siri Eye Free 버튼을 장착해 사용하는 방식으로 되어 있죠. 운전중 손을 사용하기 힘든 상황에서 음성으로 차량 컨트롤을 하는 핸즈프리 시스템에도 시리가 이용되고 있습니다. 


구글 나우 (Google Now)
iOS의 강력한 라이벌인 안드로이드 역시 구글 나우(Google Now)라는 음성인식 기술이 있어 각종 정보 검색과 조작을 음성으로 할 수 있습니다. 구글나우는 기본적으로 구글의 다른 서비스와 아주 긴밀하게 결합되어 있어 매우 폭넓게 활용이 가능하죠.

구글 나우 (Google Now)

구글나우 역시 자연어 사용자 인터페이스를 이용하기 때문에 음성인식으로 각종 명령을 수행할수 있고 사용자의 질문을 알아듣고 원하는 내용을 찾아줍니다. 구글나우의 음성 검색을 이용하면 날씨나 주식정보, 뉴스 등을 편하게 확인할 수 있죠.

구글 나우 (Google Now)

구글나우는 시리와는 다르게 질문하거나 명령하지 않아도 GPS 정보를 수신해 현재 위치와 사용자의 검색 기록을 기반으로 해당 지역의 날씨, 교통 정보 및 기타 사용자에게 유용한 정보를 자동알림 형식으로 알려준다는 특징이 있습니다. 또한, 구글나우의 자동알림은 "NOW 카드"라는 카드 형식으로 맞춤제공되어 사용자가 카드를 선택하면 해당 정보를 확인할 수 있는데 시리보다 조금 더 능동적으로 음성 개인비서의 역할을 한다고 볼 수 있습니다.

구글 나우 (Google Now)

구글나우에서 제공하는 카드는 다양해 날씨와 교통 정보, 집까지 가는데 소요되는 시간, 주변의 영화 상영 정보, 일정 확인 등을 할 수 있습니다. 이밖에도 맞춤설정에 따라 항공편 정보, 주변 사진 촬영지, 배송 추적, 주식 정보, 스포츠 경기 결과, 재난 정보 등 다양한 정보를 요청하기도 전에 미리 제공해주어 쉽고 편하게 확인할 수 있죠.

구글나우는 음성인식을 위주로 하는 개인 비서 서비스를 제공하는 시리와는 다른 방식으로 보다 적극적인 정보 제공을 해줍니다. 또한, 사용빈도가 늘어날수록 누적된 데이터가 많아지고 그에 따라 정확성도 높아져 보다 신뢰도있고 특색있는 개인비서 서비스가 되지 않을까 생각되는군요.


MS 코타나 (MS Cortana)

마이크로소프트의 최신 모바일 OS인 윈도폰 8.1에도 음성인식 기술인 코타나(Cortana)가 적용되어 이제 3대 모바일 OS에서 모두 음성인식 기술을 사용할 수 있게 되었습니다. 그동안 마땅한 음성 인식 서비스가 없었던 윈도폰에도 드디어 경쟁력있는 무기가 추가된 것이죠.

MS 코타나 (MS Cortana)

코타나는 MS의 xBox 게임 시리즈 헤일로(Halo)에 나오는 여성 인공지능 캐릭터에서 이름을 따서 가져온 것으로 윈도폰의 검색 서비스인 빙에 기반한 서비스입니다. 코타나는 윈도폰 사용자가 저장한 모든 정보와 애플리케이션 관련 정보에 접근해 전화, 메시지, 일정, 알림, 노트, 알람, 음악, 위치, 검색 등 윈도폰의 기능을 음성으로 제어할 수 있고, 사용자의 인간관계를 관리해 주는 특징을 가지고 있죠.

MS 코타나 (MS Cortana)

코타나는 윈도폰의 돋보기 모양 검색 버튼을 누르면 작동하는데 둥그런 원 두개로 이루어진 코타나 아이콘이 등장합니다. 여기서 마이크 버튼을 터치하면 음성으로 원하는 정보를 요청할 수 있죠. 음성으로 물어본 정보는 빙 검색 결과를 그대로 보여주는 경우도 많아 아직은 시리처럼 질문에 직접 대답하는 수준까지 이르러면 조금 더 시간이 필요해 보입니다.

MS 코타나 (MS Cortana)

코타나는 자신만의 저장공간인 "코타나의 노트북"을 가지고 있는데 이곳에 빙 검색 결과나 포스퀘어 등에서 찾은 정보를 저장합니다. 이를 토대로 사용자의 개인정보, 자주 사용하는 기능, 자주 가는 위치정보, 연락처 정보, SNS 친구목록 등을 관리하죠. 이를 이용해 사용자의 동선과 행위를 파악할 수 있고 이메일을 스캔해 비행 스케줄이나 관련 정보를 확인해 사용자에게 미리 알려주는 기능을 가지고 있습니다. 기업에서 사용할 경우에는 통합커뮤니케이션(UC)에 연결된 회사 네트워크도 관리가 가능하다고 하네요.

코타나의 핵심 기능이 바로 "코타나의 노트북"인 셈인데, 이를 통해 사용자 정보를 코타나가 사용하는데 보안상 사용자가 정해 놓은 수준 이상으로는 코타나가 접근할 수 없고 사용자의 동의하에 개인정보를 코타나의 "노트북"에 저장한다고 하는군요. 또한, 사용자 정보는 수정하거나 지울수 있고 외부 인터넷으로는 정보가 새나가지 않는다고 합니다.

MS 코타나 (MS Cortana)

코타나는 노트북에 저장된 정보를 사용해 사용자의 질문에 대한 답변을 제공하거나 관심도를 파악해 제안을 하고 상황에 따라서는 경고를 하거나 일정을 미리 알려주기도 합니다. 또한, 사용자의 이름을 부르면서 친근하게 인사도 하고 시리처럼 가벼운 질문에 농담을 하고, 간단한 노래도 불러 분위기를 바꿔주는 등 실제 비서들이 하는 것과 같은 모습을 보여주기도 합니다. 

전체적으로 애플의 시리와 구글 나우의 음성인식 비서 기능을 잘 합쳐 놓은 모습을 보여 가장 진화된 형태의 "디지털 개인 비서"의 모습을 보여주고 있습니다. 물론 세부적인 기능은 조금 더 업그레이드가 필요한데 이는 조만간 해결될 수 있으리라 생각됩니다. 시리와 구글 나우의 음성 인식 및 검색 기능을 가져왔고 여기에 구글 나우처럼 사용자의 정보와 행동 양식을 분석해 사용자에게 적절한 정보를 제공해 주는 등 두가지 서비스의 장점을 두루 취했다고 할 수 있겠네요.

음성인식 비서 서비스 전망

음성 인식 서비스는 활용할 수 있는 분야가 매우 다양합니다. TV나 세탁기, 냉장고 등 가전 제품을 비롯, 물류 배달 사원의 모바일 단말기에 적용하면 매우 유용하게 사용할 수 있고, 입력 속도가 타이핑보다 빨라 속기사나 실시간 통역에서도 좋고, 원격 의료나 헬스케어, 교육 서비스에서에도 다양하게 활용이 가능하죠. 손을 자유롭게 사용할 수 없는 상황에서도 필요한 것이 음성 인식 기술인데, 운전중 목소리로 차량의 다른 부분을 조작한다던가, 목소리 개인 인증, 몸이 불편한 장애인을 돕는 일에도 음성 인식은 다양하게 활용될 수 있습니다.

시장조사기관 BCC리서치에 따르면 전 세계 음성인식(Speech Recognition) 시장은 2011년 470억 달러에서 2012년 530억 달러를 기록했다고 합니다. 또한, 향후 5년 동안 연평균 6.2%씩 성장해 2017년엔 1130억 달러에 달할 전망이라고 하는데, 한국과학기술정보연구원에 따르면 국내 시장도 2015년까지 6200억 원 규모가 될 것이라고 합니다.

음성인식 비서 서비스는 가장 직관적인 인터페이스로 스마트폰과 태블릿 등 스마트 기기 사용이 많아지면서 더욱 편리하게 사용할수 있는 방법의 하나로 개발되었죠. 별도로 사용법을 익히지 않아도 쉽게 사용이 가능한 것이 음성인식입니다. 음성인식 서비스는 아직 대중화되기에는 이른 편인데 사용자가 많아지면 관련 서비스도 많이 성장할 수 있습니다. 최근에는 웨어러블 디바이스와 IoT 분야에서도 여러가지로 적용되고 있어 음성인식 비서 서비스는 점점 더 큰 성장세를 보이지 않을까 생각되는군요.

이 포스팅은 삼성 SDI 블로그, SDI 이야기에 기고한 글입니다

댓글을 달아 주세요

  1.  수정/삭제  댓글쓰기

    비밀댓글입니다

    2014.05.14 15:39
  2. BlogIcon appdune  수정/삭제  댓글쓰기

    음성인식에서 시리는 구글에 상대 조차 안됨

    2014.07.05 12:42

카테고리

와이엇의 로그파일 (1548)
IT (910)
CES 2012 (17)
디지에코 (28)
삼성전자 (191)
마이크로소프트(Microsoft) (5)
팬택 (23)
HP (28)
Olympus (3)
SK텔레콤 (53)
LG전자 (21)
인텔 (4)
레노버 (8)
화웨이 (2)
퀄컴 (3)
Adobe (어도비) (3)
Acer (에이서) (4)
ASUS (2)
블랙베리 (3)
Sony (25)
모토로라 (3)
샤오미 (Xiaomi) (2)
기타 리뷰 (94)
기타 (32)
내 블로그 이야기 (21)
News (16)
English (24)
Wine (19)

달력

«   2020/07   »
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
TNM Media textcube get rss
Yes24
멋지게 나이 드는 법 46
도티 빌링턴 저/윤경미 역
예스24 | 애드온2
돈키호테
미겔 데 세르반테스 저
예스24 | 애드온2
와이엇's Blog is powered by Tistory. Designed by Qwer999. Supported by TNM Media.