Skip to main content

본문내용

종목정보

종목토론카테고리

게시판버튼

게시글 제목

스마트폰 음성인식 비교해보니...애교에 '깜짝'

작성자 정보

평민

게시글 정보

조회 3,368 2012/07/08 20:39

게시글 내용

064480

 

 

 

 

 

041020

 

 

 

 

 

 

108860

 

 

스마트 폰ㆍ스마트 TV 이어 ‘스마트 카(Car)’ 뜬다...자동차와 IT 융합 바람에 유비벨록스, 브리지텍 등 스마트카 기술 잇단 적용

2012-07-08 15:46

 

[헤럴드경제=강주남 기자] 스마트폰, 스마트TV 등 ‘스마트화’가 산업 전반에 걸쳐 트렌드로 자리 잡아가고 있는 가운데 자동차 산업도 스마트화되어 가는 흐름을 보이고 있다. 무엇보다 세계적인 경기침체를 계기로 IT업계는 자동차를, 자동차업계는 IT분야를 새로운 시장으로 삼고 있는 모습이다. 8일 김현승 우리 투자증권 연구원은 “애플이 지난 6월 공개한 차세대 모바일 운영체제 ‘iOS6’를 스마트카용 임베디드(내장) 소프트웨어로 본격적으로 활용하겠다는 구상을 밝힌 바 있다 ”며 “국내에서도 현대차와 삼성전자가 미국 MS와 기술 협력관계를 구축하는 등 전세계 유수의 IT기업과 자동차 업체들이 적극적인 움직임을 보이면서 스마트카에 대한 관심이 높아지고 있다”고 말했다.

여론 조사기관인 ABI Research에 따르면 전세계 스마트카 시장은 2011년 말 4,500만대 수준으로 추정되며, 2016년까지 연평균 35%의 성장세를 이어갈 것으로 전망되고 있다.

▶스마트 카 적용 분야는?=스마트카 관련 기술 분야는 ▷임베디드 솔루션 ▷음성인식 ▷미러링크 등이 대표적이다.

임베디드 솔루션은 일종의 스마트카 기능을 수행하는 플랫폼으로 스마트폰을 이용해 원격시동, 원격 문열림/잠김, 주차위치 확인, 목적지 전송 등을 제어하는 서비스를 의미한다. 국내외 스마트카 시장에서는 이미 이러한 솔루션의 상용화가 활발하게 진행되고 있다. GM이 올해 초 LTE 네트워크를 통해 제공되는 차량용 솔루션을 공개한데 이어, 포드가 MS와 합작해 운전자가 음성으로 다양한 기기들을 제어할 수 있는 시스템을 개발하여 ‘SYNC’라는 명칭으로 상용화했다. 국내에서도 현대/기아차가 최근 출시한 신차에 각각 ‘블루링크’,‘유보(UVO)’라는 이름의 서비스를 공개했다.

또한, 애플이 음성인식 기반의 스마트카용 운영체제를 구축하겠다는 방침에 따라 음성인식이 스마트카 시장확산으로 관심이 높아질 전망이다. 무엇보다 운전자가 눈을 돌리며 스마트카 기능을 작동하게 될 경우 사고의 위험이 있다는 점에서 음성인식 기능의 구현으로 안전운행을 할 수 있다는 것이 최대의 장점으로 부각될 것으로 예상된다.

미러링크는 스마트폰으로 스마트카를 제어하는 국제표준 기술로서 별도의 애플리케이션 개발없이 스마트폰의 다양한 자원을자동차에서도 활용할 수 있는 기능을 제공하는 솔루션을 의미한다. 지난 9월 국내 현대차, LG전자를 비롯해 세계 유수의 자동차 및 IT 업체들이 회원사로 구성된 컨소시엄인 카 커넥티비티 컨소시엄(CCC.The Car Connectivity Consortium)이 ‘미러링크’를 스마트폰의 스마트카 제어기능을 수행하게 하는 글로벌 표준 기술로 채택했다. 무엇보다 최근 글로벌 스마트폰 제조사들이 미러링크 기능을 탑재하여 출시하고 있어 미러링크 시장의 개화가 빠르게 진행될 것으로 기대된다.

관련 수혜주 주목= 유비벨록스는 현대와 기아차의 스마트카 서비스인 블루링크와 유보(UVO)에 솔루션을 제공하는 국내 유일의 업체다.회사측에 따르면 블루링크와 유보(UVO)에 제공하는 솔루션관련 매출 인식이 올해부터 본격화되면서 연간 100억원의 매출액을 기록할전망이다. 특히, 현대차가 동사의 지분 5%를 보유하고 있으며, 동사는 네비게이션 업체인 팅크웨어의 지분 22%를 보유하고 있는 등 3사가

상호간의 우호적인 관계를 형성하며 적극적으로 추진하고 있어 귀추가 주목되고 있다.

국내 최대의 음성인식 데이터베이스를 보유하고 있는 브리지텍은 시리의 음성인식엔진의 개발사인 미국 뉘앙스사와 음성인식 파트너십 계약을 체결했다. 특히, 브리지텍은 아이폰 4S의 음성인식기술 시리엔진과 관련해 국내에서 유일하게 검증받은 업체다.

이와 함께 MDS테크는 미러링크를 기반으로 한 ‘네오링크’를 선보였다. 현재 상용화를 위한 테스트가 진행 중에 있으며, 하반기부터 차량용 디스플레이를 제공하는 업체들을 대상으로 판매를 시작할 것으로 예상된다.

김 연구원은 “이 밖에도 유비벨록스의 자회사인 팅크웨어는 ‘스마트카’ 시장의 핵심 컨텐츠인 네비게이션 S/W와 H/W 부분에서 국내 최고 수준의 경쟁력을 갖춰 중장기적으로 국내 완성차 업체와의 협력관계를 구축해 나갈 예정”이라며 “또한, 현대모비스의 경우 지난 4월 자회사인 현대 오토론을 설립하여 전기전자 구조설계와 비메모리 반도체 등의 영역에 대한 독자기술을 확보해 자체적인 전자제어 플랫폼 표준 구축을 노리고 있으며, 삼성전자는 독자적인 차량용 소프트웨어 개발을 마치고 출시를 준비 중”이라고 전했다.

/namkang@heraldm.com

 

 삼성 vs 애플 ‘음성인식’ 독한 싸움

 




애플 8개월 걸린 시리 업그레이드 삼성은 6개월 이내로 단축 맞대응
갤럭시S3 국내외서 판매 돌풍
S보이스 활용정도 따라 승부 윤곽

애플이 개발자 컨퍼런스에서 시리(siri)의 기능을 대폭 강화시킨 iOS6를 발표, 음성인식을 둘러싼 애플과 삼성의 치열한 신경전이 예상된다. 애플이 아이폰5를 내놓기 전 업그레이드된 시리를 선보인 반면, 갤럭시S3를 먼저 공개한 삼성은 본격적으로 시리의 대항마격인 S보이스를 강화한다는 전략이다.

13일 삼성전자에 따르면 갤럭시S3가 이미 유럽과 미국ㆍ중국 시장에 출시됐고, 국내서도 출시 초읽기에 들어가면서 갤럭시S3에 최초 선보인 S보이스 업그레이드에 시동을 걸 계획이다. 사전처럼 수많은 단어를 미리 제품에 탑재하는 방식이 아니라 사용자가 사용하는 언어를 별도서버에 축적하는 음성인식 특성 상 갤럭시S3가 시장에 풀리면서 음성DB를 쌓을 수 있는 환경이 구축됐기 때문이다.




삼성전자는 특히 애플이 시리를 선보인 뒤 업그레이드판을 내놓기까지 걸린 시간을 단축하는 데 초점을 맞추고 있다. 지난해 10월 아이폰4S가 나오면서 최초 공개된 시리는 이번에 기능이 강화되기까지 8개월이 걸렸다. 이에 삼성전자는 이보다 시간을 줄여 이르면 연내 S보이스의 기능을 한 단계 올린 업그레이드판을 내놓을 계획이다.

연내 S보이스 업그레이드가 가능한 이유는 갤럭시S3가 국내외에서 돌풍을 예고하고 있기 때문. 이미 출시 전부터 해외에선 선주문이 1000만 대 가량 들어왔고, 국내 예약가입 첫날 시간 당 9000대(LTE모델) 꼴로 예약이 몰릴 정도로 반응이 뜨거운 상태다. 삼성전자 관계자는 "이 정도 분위기라면 갤럭시S3 사용자가 아이폰4S 이상으로 음성인식 기능을 사용할 수 있는 기반이 갖춰질 것으로 보인다"고 말했다.

컨설팅그룹 팍스어소시에이츠의 조사에 따르면 아이폰4S 사용자 중 87%가 시리를 한 달에 한 번 이상 이용하는 것으로 나타났다. 또 시리에 음성으로 요청하는 건수는 한 달에 약 10억 건으로 업계는 추정하고 있다. S보이스와 시리 둘다 울프람알파라는 동일한 검색엔진을 사용하고 있고 아이폰4S의 시리 사용빈도 수준이라면 S보이스도 시리 이상으로 기능을 향상시킬 수 있다는 것이다. 이미 1000만대 선주문이 들어온 가운데 한 사람이 하루에 세 번 이상만 S보이스를 이용해도 10억 건은 충분히 능가할 수 있기 때문이다.

S보이스는 사용자가 필요한 정보나 데이터를 음성으로 요구할 경우 단말기가 알아서 찾아주는 기능 중심으로 개선될 것으로 보인다. 현재 S보이스는 시리에 비해 음성으로 단말기 자체를 제어하는 성능은 뛰어난 반면 iOS6에서 공개된 시리 만큼 정보제공 능력은 떨어진다는 평가다. 애플은 iOS6에서 음성으로도 스포츠 경기 일정이나 스코어 영화 시간표, 극장 정보를 제공하는 기능을 추가했다. 반면 S보이스는 음악ㆍ전화 등 소리가 나는 상황에서도 음성으로 단말기를 제어할 수 있고 애플리케이션을 실행시키는 것에서 나아가 직접 조작까지 가능한 것이 장점으로 꼽힌다.

업계 한 관계자는 "삼성이 S보이스를 업그레이드하는 시기와 애플이 아이폰5를 내놓는 시기가 맞물린다면 1차적으로 음성인식 품질이 비교대상이 될 것"이라고 예상했다.

 

 

 

브리지텍 이상호 대표는 “음성인식 솔루션을 ARS에서 사람이 이용하는 응용소프트웨어, 스마트폰 어플리케이션 등에 대화형식의 사용자 인터페이스를 제공해 새로운 이용자 환경을 마련해 갈 것”이라고 밝혔다. 또한 “산업군별로 사용자의 이용패턴과 사용단어를 축적하고, 다이나믹한 서비스 시나리오를 구성, 재미있고 편리한 서비스를 제공해 회사의 성장동력으로 삼을 것”이라고 포부를 밝혔다

 

 

 

 

스마트폰 음성인식 비교해보니...애교에 '깜짝'

 

 


 

아이폰 시리, 갤럭시 S 보이스, 옵티머스 퀵 보이스, 베가 스마트 보이스 비교 평가

 

[아시아경제 권해영 기자]말만 하면 커튼이 젖혀지고 창문이 열린다. 입맛 뻥긋하니 오디오가 작동하며 음악이 흘러나오고 욕조에는 뜨거운 물이 받아진다. 집안의 모든 기기가 간단한 음성 명령만으로 작동하는 시대. 공상과학(SF) 영화에서나 나올 법한 꿈 같은 세상이 눈 앞에 성큼 다가왔다. 애플을 시작으로 스마트폰 제조사가 음성 인식 기능을 탑재하면서 정보기술(IT) 업계의 핫 이슈가 되고 있다. 갤럭시S3(S 보이스), 옵티머스 뷰(퀵 보이스), 베가레이서2(스마트 보이스), 아이폰4S(시리)에 탑재된 음성 인식 기능을 써봤다.
 
첫인상은 갤럭시가 가장 마음에 들었다. "넌 누구니"라고 질문을 던지자 갤럭시는 "당신의 든든한 비서, 삼성 갤럭시입니다"라고 대답했다. '비서 마인드'로 무장한 듯해 만족스러웠다. 아이폰은 "제가 누군지는 중요하지 않아요"라고 말해 주인을 무안케 했다. 옵티머스와 베가는 당황스러웠다. "답변하기 힘든 질문입니다" "죄송합니다. 하신 말씀을 이해하지 못했습니다"
 
될 성 부른 나무는 떡잎부터 알아본다던데. 옵티머스와 베가의 충성도가 낮으면 어쩌나 하는 불안한 마음을 안고 본격적인 테스트에 들어갔다. 옵티머스는 다른 스마트폰과는 달리 비서의 성별을 남성으로 설정할 수 있었다. 갤럭시와 베가, 아이폰은 남성 목소리 지원이 불가능해 여성 비서를 두기로 했다.

알람 설정 능력부터 테스트했다. "알람" "오전5시" "저장" 등의 단어를 차례로 발음했다. 모든 스마트폰이 오전 5시에 알람이 울리도록 설정했다. 너무 쉬웠던 건지 다들 테스트를 가볍게 통과했다.
 
다음으로는 문자메시지 전송 능력을 시험해봤다. 이번엔 문장으로 명령했다. "문자" "이혜선" "안녕" 대신 "이혜선한테 안녕이라고 문자 보내"라고 말했다. 아이폰을 빼고는 전부 주소록에 있는 '이혜성'에게 문자를 보냈다. 주인의 발음이 새는 건지 국산 스마트폰은 알아듣지를 못한 건지 문자메시지 보내기에 실패하고 말았다. 혹시나 하는 마음에 '이영은'에게 문자를 보내봤다. 모두 정확하게 전송했다. 역시 주인의 발음이 문제였다. 잠시나마 애꿎은 비서 탓만 한 것 같아 미안했다.
 
알람 설정, 문자메시지 전송 능력 외에도 전화 걸기, 사진 촬영, 애플리케이션 실행 등 기본적인 명령에 대한 수행 능력은 대동소이했다. 모두 무리 없이 돌아갔다.
 
저마다 특장점이 있다. 아이폰은 앱 실행 속도가 2초 정도로 다른 스마트폰보다 1초 가량 빨랐다. 성격이 급해 기다리는 것을 싫어하는 이들에게 안성맞춤이다.
 
갤럭시는 귀가 특히 밝다. 음악을 감상하면서 S보이스를 실행하고 "이전곡"이라는 단어를 말하니 음악 소리에도 주인의 음성을 알아듣고 이전곡을 들려 준다. "볼륨 높여"라고 말하니 음악 소리가 커진다. 음악을 감상하거나 전화가 결려 와 스마트폰에서 소리가 나고 있을 때도 사용자의 음성을 인식할 수 있다는 게 장점이다.
 
옵티머스는 재치가 넘쳤다. 첫인상은 그저 그랬지만 쓰면 쓸수록 '이 녀석 참 재미있네'라는 생각이 절로 들었다. "하이 갤럭시"라고 말하니 옵티머스는 "저 상처받았어요...채팅을 종료합니다"라고 받아쳤다. 이번엔 "아이폰"이라고 말했다. "아! 그 사과폰이요?"라고 되물었다. "눈이 더 컸으면 좋겠어"라고 말하니 "어머니가 해주지 못한 것 의사 선생님은 가능합니다"라며 주인을 놀렸다. 약간 화난 듯 "너 지금 어디야"라고 물었더니 "네모난 상자 안에서 알바하고 이써요"라는 답이 돌아온다. 사람과 얘기하는 건지 기계와 얘기하는 건지 헷갈릴 정도다. 반면 베가는 기본적인 기능을 실행하는 데는 문제가 없었지만 인식률이 떨어져 불편하다.
 
4개 스마트폰의 음성 인식 기능을 써보니 간단한 작업은 대부분 실행했다. 그러나 아직 첫걸음인만큼 한계도 분명했다. 가족, 친구 등 진짜 사람과 대화하듯 자연스럽게 발음하면 음성 인식률은 현저히 떨어졌다. 기계와 대화를 이어가려면 긴장한 상태를 유지하며 또박또박 발음해야 해 귀찮기도 했다. 공공장소에서는 주변 사람들의 시선이 의식돼 활용도도 낮을 것 같다. 음성 인식 기능이 SF영화 속 장면처럼 정말 자연스럽게 우리 생활에 녹아들기까지는 아직 시간이 걸릴 듯 싶다.
 
주인의 시중을 드느라 고생한 비서들에게 마지막으로 "사랑해"라는 말을 건넸다. 갤럭시는 "사랑한다는 말은 그리 간단히 뱉을 수 있는 말이 아니랍니다" 베가는 "죄송합니다" 아이폰은 "영(young)님께 도움을 드리는 것만이 저의 소임입니다"라고 답했다. 옵티머스는 애교가 넘쳤다. "제가 귀여우시다면 맛있는 거 사주세요!"

 

 

 

“우리~집”부터 ‘시리’까지…음성 인식 대중화 성공?


 

 

 

 

 

 

 

“우리~집”부터 ‘시리’까지…음성 인식 대중화 성공?
2012. 07. 06

 

컴퓨터를 좀 오래 썼다는 사람들이 술자리에서 으레 꺼내놓는 옛날이야기 중 하나가 천공 카드다. PC는 물론 키보드도 흔치 않던 시절에는 수치 계산을 위해 천공카드에 구멍을 뚫어 명령어를 입력했다. 프로그램 하나에 수 백 장은 예사고 수 천 장이 되는 일도 많았다. 카드 배열이라도 흐트러뜨렸다가는 그야말로 ‘피눈물’이 날 일이다.

이후 PC와 함께 키보드가 보급되면서 ‘키보드’하면 컴퓨터가 떠오를 만큼 상징적인 의미를 갖게 됐다. 지금은 몇 천원에 살 수 있는 마우스도 PC에 흔해진 것은 윈도우 95가 등장한 1995년 이후였다. 이후 꽤 오랫동안 키보드와 마우스가 입력의 중심을 차지했고 PDA(Personal Digital Assistants)와 스마트폰의 터치스크린 역시 키보드와 마우스의 역할을 따라하는 데 초점이 맞춰져 왔다.

하지만 최근 스마트폰 시장은 또 다른 입력 방식으로 전환을 맞고 있다. 음성 인식, 음성 입력이다.

 

음성 인식, 어떻게 활용할 것인가

 

휴대폰 음성 인식에 대한 시도는 꽤 오래 전부터 있어 왔다. 90년대 후반 “본부” 혹은 “우리집”으로 기억되는 휴대폰의 음성 인식 기술은 목소리를 익혀야 하고 명령할 수 있는 것들이 한정적인 데다가 잘 알아듣지도 못했다. 결정적으로 당시에는 말로 전화를 건다는 것 자체가 창피한 일이었다. 그저 휴대폰 시장의 마케팅 포인트 중 하나로 전락하고 말았다. 물론 인식율을 높이기 위해서는 엄청난 컴퓨팅 파워가 지원되어야 했지만 ‘돈’이 안되는 서비스에 막대한 투자를 단행할 사업자는 없었다.

하지만 그 사이에도 음성 인식, 음성 입력 기술은 발전을 거듭해 왔다. 스마트폰 시장이 커지면서 애플은 아이폰에 기초적인 음성 인식 기술을 넣었고 안드로이드 역시 검색창 등에 음성 입력 기능을 더했다.

본격적으로 불을 지핀 사건은 지난해 아이폰과 함께 등장한 시리(Siri)였다. ‘전화걸기’ ‘날씨’ 등 주문을 외우는 것 같은 명령어 대신 ‘회사에 전화 걸어줘’ ‘여자친구에게 오늘 저녁 약속이 있냐고 문자 메시지를 보내줘’처럼 스마트폰과 대화할 수 있게 된 것이다.

 

시리가 천지개벽할 만한 놀라운 기술일까? 기술도 기술이지만 이를 어떻게 활용할 지에 대한 애플의 아이디어가 시리를 깜짝 놀랄 상품으로 만들어낸 것이다. 음성 입력을 어떻게 쓸 지는 스마트폰 제조사가 결정할 일이라는 얘기다. 예를 들어 애플과 블랙베리는 모두 뉘앙스의 음성 인식 기술을 기반으로 한다. 하지만 두 제품의 결과물은 천지차이다. 시리의 서비스는 굳이 설명할 필요가 없을 정도지만 블랙베리의 음성 입력은 전화번호부 검색 정도에 머물고 있다. 어떤 칼을 갖고 있느냐도 중요하지만 그 칼을 어떻게 쓸 지도 중요하다는 얘기다.

 

음성 인식, 클라우드와 위치정보로 활짝

 

최근의 음성 인식 기술은 클라우드와 지역 정보를 결합해 우리가 그 동안 꿈꾸던 서비스를 이뤄내고 있다. 단순히 말을 글자로 받아 적는 수준을 넘어 이 정보를 분석해 유용한 정보로 만들어준다.

내가 한 이야기를 서버로 보내 내용을 분석하고 그에 맞는 정보를 보여주거나 명령어를 처리한다. 시리는 하나의 좋은 예지만 삼성이 갤럭시 S3에 넣은 S-보이스나 구글의 음성 검색도 비슷한 케이스다. 시리가 욕이나 비속어, 새로 나온 은어도 알아듣는 이유는 목소리 정보를 분석하는 클라우드 서비스에 지속적으로 새로운 언어가 학습되기 때문이다.

 

당연히 데이터가 쌓이면 쌓일수록 더 매끄러운 답을 내놓고 말도 더 잘 알아듣는다. 구글이 언어 번역 서비스에서 독보적인 위치에 올라설 수 있었던 것과 비슷하다. 어떤 문장을 어떻게 번역해야 하는지에 대해 이용자들이 제안하는 내용들을 그대로 데이터베이스에 담기 때문에 기존 번역 소프트웨어들이 갖고 있는 번역 방법과 데이터에 비할 바가 아니다.

단어 한 두 개가 아니라 문장 전체를 분석하기 때문에 정확도가 높다. 하지만 그만큼 많은 데이터가 필요하다. 마치 아이들이 말을 배우듯 많은 사람들과 이야기한 내용이 쌓이다 보면 점점 더 능숙하게 대화할 수 있게 된다. iOS5.1에 처음 포함된 일본어 시리의 경우 처음에는 영어에 비해 매끄럽지 못했다. 애플은 일본어 이용자들에게 아직 말이 서툴기 때문에 말을 잘 가르쳐달라는 애교 있는 메시지로 넘어가기도 했다.

마찬가지로 iOS6의 베타 버전에 새로 포함된 한국어 시리는 지금 우리말을 배우고 있는 중이다. 독도가 어느 나라 땅인지, 가장 좋은 스마트폰은 무엇인지, ‘일’이라는 말을 one으로 알아들을지, work인지, day인지 알 수 있게 데이터가 쌓여야 한다.

시리는 흔히 삼성 갤럭시 S3의 S-보이스와 비교된다. 갤럭시 S3에는 블링고의 음성 인식 기술이 들어간다. S-보이스가 시리보다 대화를 다채롭게 이끌어가지 못하는 사례들이 나오는 이유는 음성 인식 기술 자체에 차이가 있다기보다 음성을 분석해 주는 데이터가 아직 충분히 쌓이지 않았기 때문이다. 스마트폰을 제어하는 것에 대해서는 삼성이 노력해야 하는 부분이지만 음성 데이터베이스를 쌓는 일은 실제 제품을 쓰는 이용자들의 도움도 더해져야 할 것이다.

 

구글나우 “시리 나와!”

 

시리 하나로 음성 인식 하면 애플이 먼저 떠오르게 됐지만 구글도 음성 관련 기술에서 상당한 기술력을 갖고 있다. 앞서 이야기한 번역 서비스와 마찬가지로 구글은 꽤 오랫동안 음성 검색 서비스를 해 왔다. 안드로이드에도 소리를 보내 분석하는 방식으로 그간 받아쓰기 정도의 음성 입력 서비스가 이뤄졌지만 최근 발표한 젤리빈으로 음성 입력 기술에 응용을 가하기 시작했다.

 

안드로이드 4.1 젤리빈에는 인터넷을 거치지 않고 음성 인식을 쓸 수 있는 ‘오프라인 보이스 타이핑’ 기술이 들어간다. 음성 입력에 대한 데이터베이스를 운영체제에 심은 것으로 보이는데 온라인을 거치지 않고도 비슷한 수준의 받아쓰기가 된다는 것은 발표만으로도 대단한 일이다. 지난 구글 I/O에서는 영어가 우선적으로 처리되고 이후 다른 언어들이 추가될 계획이라고 하는데 적지 않은 용량을 차지하는 음성 데이터베이스를 어떻게 추가할 지는 지켜봐야 할 것 같다.

구글이 준비하는 또 하나의 음성 관련 서비스는 구글나우다. 시리에 맞서는 구글의 새 위치기반 서비스로 날씨를 묻거나 목적지까지 남은 시간 등을 알려주고 갈아타는 지하철이 몇 분 뒤에 도착하는지 알려주는 등 구글이 쌓아온 지역 정보가 음성 입력과 합쳐져 어떤 효과를 낳을지는 젤리빈이 정식으로 등장하는 이달 중순께 알 수 있을 듯하다.

한편, 음성 인식 관련 업계의 한 전문가는 “정말 음성 인식 서비스가 일상 생활 속에 자리잡을 수 있을 지 좀더 지켜봐야 합니다”라고 전했다. 음성이라는 특수성으로 인해 차나 집 같은 한정된 공간에서 적용될 뿐 광범위하게 적용될 것이라고 예단하기는 아직은 이르다는 설명이다. 또 한차례의 유행인 지 아니면 클라우드가 뒷받침해주는 ‘킬러’ 서비스로 확실히 자리를 잡을 지 주목되는 부분이다.

 

 

 

 

 `놀라운 포털`…음성검색 해보니 충격

 

 

"한국서 가장 높은 산은?" 하고 물으면 높이-사진까지 보여줘

 

입력: 2012-07-05 19:56

 

하반기 스마트폰 시장의 핵심 화두로 음성 인식이 떠오르면서 포털업계도 모바일 음성 검색 시대로 빠르게 진화하고 나섰다.

5일 관련업계 에 따르면 NHN 다음 커뮤니케이션, SK커뮤니케이션즈 등 주요 포털업체들을 중심으로 플랫폼 확장을 비롯해 소음 처리, 문장형 인식, 정답형 검색 등 모바일 음성 검색 업그레이드가 한창이다.

국내 포털업체들은 이미 모바일 애플리케이션(앱)을 통해 음성 검색을 지원하고 있지만 기존에는 단순히 키워드를 인식하는 수준이어서 사용률 이 높지 않았다. 하지만 최근 애플의 음성인식 기술인 `시리'에 이어 구글이 `젤리빈'에 음성 인식 기술을 추가하는 등 스마트폰의 핵심 기능으로 음성인식이 광범위하게 활용되면서 성능 개선 작업에 나선 것으로 풀이된다

삼성전자, LG전자, 팬택 등 스마트폰 제조사들도 음성 인식 기능을 속속 도입하고 있다.

우선, 모바일 사업을 강화하고 있는 다음이 하반기 모바일 음성 검색의 대대적인 업그레이드를 준비중이다. 다음 관계자는 "현재 내부적으로 플랫폼 확장, 소음처리, 문장형 인식 등 인식률을 높이는 작업을 진행 중"이라고 말했다. 다음은 지난 2010년 6월 한국전자통신연구원(ETRI)과 모바일 음성 검색 모듈을 공동 개발하고, 국내 처음으로 한국어 모바일 음성 검색 서비스를 시작했다.

NHN은 정답형 음성 검색을 준비중이다. 이는 구글의 젤리빈이 제공하는 음성 검색과 같은 방식으로, 질문에 대한 답변과 함께 관련 정보를 제공한다. 예를 들어 "한국에서 가장 높은 산은?"이라고 물으면 "백두산, 2750M"라는 대답과 함께 백두산 사진 을 보여주는 식이다. NHN 관계자는 "네이버 음성 검색은 지금도 글로벌 업체와 비교해 어깨를 견줄 수 있는 수준까지 인식률이 올라온 상황"이라며 "하지만 아직 대화형 질문 형태를 파악하고 인식하는 단계에는 이르지 못했으며, 현재 준비 단계에 있다"고 말했다.

SK컴즈는 스마트TV로 음성 인식을 확대했다. SK컴즈는 최근 삼성전자 스마트TV에 제공하는 싸이월드 사진첩 서비스에 음성 인식 기능을 적용했다. 이번에 추가된 기능은 2012년형 삼성 스마트TV 리모컨의 음성 인식 기능을 활용한 것으로, 사용자의 음성으로 싸이월드 사진첩을 조작할 수 있다. 

 

 

 

  갤S3 'S보이스', '시리'보다 똑똑한데 2012/07/01

삼성전자 의 전략 스마트폰 '갤럭시S3'가 지난 25일 출시됐다. 갤럭시S 시리즈의 3번째인 이번 제품은 하드웨어보다는 인간 중심의 소프트웨어를 강조했다.

삼성전자는 갤럭시S3를 '휴먼폰'이라고 소개한다. 인간을 보고, 듣고, 반응하는 기능부터 우리 생활에 필요했던 다양한 편의 기능을 집어넣었다는 것이 설명이다.

인간 중심의 기능 중 가장 대표적인 것은 '스마트 스테이'다. 이 기능은 전면 카메라로 사용자의 눈동자를 인식해, 사용자가 갤럭시S3를 바라보면 화면이 꺼지지 않는 기능이다. 화면을 장시간 바라보는 경우에 꺼진 화면을 다시 켤 필요 없어 꽤 편리하다.

'스마트 스테이' 외에 손꼽히는 특별한 기능은 'S보이스'이다. 애플의 시리와 유사한 기능으로 음성인식 명령 서비스다. 예컨대 '김**한테 빨리 오라고 문자 보내줘'라고 말하면 사용자가 직접 입력을 하지 않아도 문자가 전송된다. 또는 '6시에 깨워줘'라고 하면 6시에 알람이 울리도록 설정해준다. 기능 명령 외에도 날씨, 웹 검색 등도 가능하다.

 

 

오늘은 갤럭시S III의 S보이스 기능에 관해 알아보려고합니다.

 

S보이스 만가지곤 내용이 부족하지만,

아이폰에서 한국어 SIRI가 지원되기 떄문에 재미있는 비교가 되지 않을까 생각됩니다. 

똑같은 내용을 넣었을때 사용자가 원하는 직관적인 대답을 들을 수 있는 지도 궁금해지는군요!!
 
 
 
 
실행 및 질문형태 확인

S보이스는 아이콘 형태로 메뉴에 나타나있습니다. 실행 시킨뒤 어떤식의 질문을 해야될지 모를때는 
하단 우측의 '?'를 누르게되면 보는것과 같이 다양한 방식의 질문을 알아듣는군요,,,
 
 
 
 
직관적인 대답 얻기
 
문장 형식이 아닌 단어 형태의 언어는 직관성있게 알아듣는고 표현하는 모습을 보입니다.
 
Q) "오늘의 날씨" -> A) 현재위치의 날씨정보 파악
Q) "시간" -> A) 현재위치의 시간 확인
 
 
 
 
연개 질문에 대한 대답 얻기
Q) "알람설정" -> A) 몇시에 할까요?
Q) "오후 2시 30분" -> A) 알람내용 확인
 
 
Q) "메시지전송" -> A) 누구에게 메시지를 보낼까요?
Q) "XXX" -> A) 보낼 메시지는?
Q) "테스트 메시지입니다" -> A) 내용 표시->전송하시겠습니까?
Q) 보내기 -> A) 전송되었습니다.
 
기본적인 기능설정들은 제대로 똑똑하게 인지합니다. 
 
 
 
 
Q) "메모작성" -> A) 무엇을쓰고 싶으세요?
Q) "안녕하세요 테스트 입니다." -> A) 메모내용 확인 -> 저장/취소 여부 확인
Q) "저장" -> A) 저장확인
 
 
Q) "전화걸기" -> A) 누구에게 전화 하시겠어요?
Q) "XXX" -> A) XXX 에게 전화를 겁니다? -> 전화화면 전환
 
 
Q) "영상통화" -> A) 누구에게 전화 하시겠어요?
Q) "XXX" -> A) XXX 에게 영상전화 거는중.. -> 영상 전화 화면 전환
 
 
 
 
또한 "서울역 가는길"이란 질문을 하게되면 지도 앱이 실행됩니다.
저는 네이버지도를 대표 앱으로 설정해 놨는데요, 실제로 현위치로부터 가는길은 표현되지 않으며,
서울역의 위치만 지도로 표시해주는 모습을 보여줍니다. 향후 다양한 앱들과 연개되는 모습을 기대해봅니다.
 
 
 
헛소리 테스트 

 

요즘 S보이스 드립모음이란 사진이 엄청 많아서 저도한번 해봤습니다.ㅎㅎ
 
Q) "멍청아" -> A) 절 존중해 주셨으면 좋겠습니다.

Q) "멋진사람소개시캬줘요" -> A) 곧 좋은 인연을 만나실 겁니다.
Q) "여자친구 소개시켜줘" -> A) 어떤 스타일을 좋아하시는지 궁금하군요
Q) "남자친구 소개시켜줘" -> A) 우선 저부터좀...
Q) "남자냐 여자냐" -> A) 전 무엇이든 중립입니다.
 

남자친구 원하는걸 보니 S보이스는 여자였군요.. ㅋㅋㅋ 근데 중립이라니....
 
 
 


Q) "배고프다" -> A) 냉장고에 먹을만한게 있는지 살펴보시기 바랍니다.
Q) "오빠" -> A) 엄마를 말씀하시는건가요?
Q) "엄마" -> A) 많이 놀라셨나 봅니다.

Q) "아빠" -> A) 어떤 스타일을 좋아하시는지 궁금하군요

 
Q) "점심은 뭘먹지" -> A) 저는 아침을 먹지 않았답니다. Q) "카카오톡" -> A) 일치하는 앱이없다.
Q) "앵그리버드" -> A) 일치하는 앱이없다.
 
 

 
Q) "시리" -> A) 현대인에겐 필수적이죠
Q) "S보이스" -> A) 삼성 췝사이트 소개
Q) "사랑해" -> A) 사랑해주셔서 감사합니다.
Q) "사랑해" -> A) 일단 마음만 감사히 받겠습니다.

 
 
 

단어 인식률은 좋습니다.

또한 그단어가 무엇인지 확실하게 인지하고있지만,

단어를 사용자가 원하는 내용으로 표현되지않는다는 생각을 해봅니다.
 
 
 

가령 "엄마" 같은 경우 감탄사로 인지하고 많이 놀랐냐고 물어봅니다.ㅋㅋㅋ

보통 "엄마"라는 단어를 말하는 목적은 엄마에게 문자나 전화를 하기위해서 아닌까요? ㅎㅎ

 

반면 SIRI의 경우..,

 

 
SIRI사용시 불편한점은 계속 물어본다는 겁니다.
(이게 맞냐?, 취소하냐?, 못들었다 다시말해라!, 이 단어가 맞냐? 등등)
또한 띄어쓰기를 파악하지못해 에러메시지를 간혹 보여주고 있는데요 "메모작성"은 못알아 듣지만 "메모_작성"으로 띄어서 말할 경우 메모앱을 통해 인식할 준비를 합니다.

결국 보이스 실행은 사용자 중심의 직관적 인지와 표현 인듯합니다.
 
SIRI가 베타버전임을 감안하고도 사용자의사를 표현하는 능력은 SIRI승! 
단어를 알아듣고 의사와는 상관없이 다양한 표현을 해주는 능력은 S보이스승!

 

 

 

 

 

 

 

애플, 음성인식 기술 시리(Siri)로 혁신을 시작하다

애플 아이폰4S가 공개된 이후 실망감과 기대감이 교차했다. 디자인과 하드웨어 스펙이 변화하지 않았고, 음성인식 기술인 시리(Siri)가 공개됐기 때문이다. 기존의 아이폰4에서 크게 진보되지 않은 아이폰4S를 두고 혁신과 퇴보라는 논쟁까지 벌어지고 있다. 지금까지 애플이 IT시장을 주도할 수 있었던 키워드는 혁신이었다. 하지만 스티브 잡스의 은퇴 이후 불안감이 조성되고, 예정됐던 아이폰4S의 발표, 그리고 스티브 잡스의 죽음으로 애플의 미래는 밝지 않다는 분석까지 나오고 있다.

혁신적인 아이폰5를 기대했던 우리들은 아이폰4S가 공개되면서 실망감에 정말 중요한 부분을 간과하고 있다. 바로 아이폰4S에 적용된 애플 음성인식 기능 시리(Siri)의 단면만보고 평가 절하하면서 시리(Siri)의 발전 가능성을 놓치고 있는 것. 아직 베타서비스에 머물고 있지만 아이폰의 모든 기능을 음성 제어(동작/작동)할 수 있게 되면서 수동적인 음성인식 기능에서 벗어나 능동적인 음성인식 기능으로 거듭났다는 점에서 주목해야 한다.

 

구글 안드로이드 운영체제에도 채택된 바 있는 음성인식 기능은 음성(Voice) 입력을 텍스트(Txt)로 변환해 그 결과를 구글 검색 결과로 보여주는 서비스에 머물고 있는 반면, 애플 음성인식 기술인 시리(Siri)는 대화체에 반응할 수 있는 음성인식 기술이다. 이는 음성인식 기술이 진일보했다는 점에서 의미가 있다.

예를 들면 이런 것이다. 오늘의 날씨가 궁금해서 아이폰이 켜진 상태에서 "오늘 날씨가 어때?"라고 물으면 아이폰이 날씨를 검색하고 이를 음성으로 알려주는 것이다. 또 사용자 주변의 위치기반인식 기술을 활용해 "50m 주위의 음식점 정보를 찾아줘"라고 말하면, 주변의 정보를 수집해 사용자에게 알려줄 수도 있다. 그리고 "30분 후에 약속이 있으니 알람을 알려줘"라고 하면 30분 뒤에 알람이 울리는 것처럼 비서의 역할도 할 수 있다는 것처럼 다양한 용도로 활용할 수 있게 됐다는 부분에 주목해야 한다.

스마트폰용 음성 인식 애플리케이션은 2000여개를 벌써 돌파했고, 국내에서도 고객서비스 센터에 음성인식 기술을 활용한 메뉴 서비스를 제공하고 있다. 또한, 러시아 국영은행 스베르뱅크는 지난 6월 거짓말 탐지기가 탑재된 ATM을 선보이며, 음성인식 기술을 기반으로 새로운 형태의 서비스가 등장할 수 있다는 것을 보여 주었다. 더군다나 음성 인식률이 개선되면서 외국어 발음 교정에도 적용될 수 있는 기술까지 접목되면서 교육분야까지 확대되는 추세를 보이고 있다. 이처럼 기술적 완성도가 높아진 음성인식 기능을 통해 새로운 트랜드가 형성될 것임을 예고하고 있다.

즉, 개발자의 상상력에 따라 애플 음성인식 기술인 시리(Siri)는 창조적인 새로운 서비스로 변화할 수 있다는 것이다. 아이튠즈를 통해 새로운 애플리케이션들이 대거 등장하면서 애플의 중흥기를 여는 데 크게 이바지한 것처럼 음성인식 기술인 시리(Siri)가 애플의 전성기를 계속 이어갈 것이다. 아직까지 애플 음성인식 기술인 시리(Siri)는 한국어를 지원하지 않아 아쉬움을 남기고 있지만 애플 음성인식 기술로 인해 발전할 미래가 벌써부터 기대된다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 




 



 

 

 


 

게시글 찬성/반대

  • 4추천
  • 0반대
내 아이디와 비밀번호가 유출되었다? 자세히보기 →

운영배심원의견

운영배심원 의견?
운영배심원의견이란
운영배심원 의견이란?
게시판 활동 내용에 따라 매월 새롭게 선정되는
운영배심원(10인 이하)이 의견을 행사할 수 있습니다.

운영배심원 4인이 글 내리기에 의견을 행사하게 되면
해당 글의 추천수와 반대수를 비교하여 반대수가
추천수를 넘어서는 경우에는 해당 글이 블라인드 처리
됩니다.

댓글목록

댓글 작성하기

댓글쓰기 0 / 1000

게시판버튼

광고영역