본문 바로가기

Voice UI50

Mobile Trends Made Simple 제대로 된 미래예측은 너무나 뻔해 보이기 마련이고, 사실 현업에 대해서 조금 알아가다 보면 그 예측을 들었을 때의 반응도 대충 판에 박히기 마련이다. 휴대폰의 미래에 대해서 "전화+인터넷"이라고 하고 있는 아래 David Pogue (꽤 '인기있는' NY Times의 컬럼리스트)의 강연 동영상이 올라왔다. 늘 그렇듯이 사례는 많고 웃기기는 하지만 논리도 방향도 부족한 내용. 그래도 최소한 그 큰 방향이 틀리지는 않은 듯 하고, 무엇보다 예전에 언급했던 휴대폰 연동 음성 서비스들과 얼마전에 올린 Google Voice의 전신이라고 할 수 있는 Google Grand Central에 대해서 언급이 되길래 스크랩해 두기로 했다. 현업에서 (그 쪽의 현업에서) 멀어지다보니 아무래도 부정적인 이야기를 적게 듣게 .. 2009. 3. 30.
Game + Voice UI + Robot 뭐 이렇게 내 관심사에 딱 맞는 물건이 나온다냐. -_-a;; 이 게임 - Bot Colony - 은 로봇 에이전트를 통해서 게임을 하면서, 그 로봇과 "제한없는 자연어 대화"가 가능하다고 한다. ... 솔직히 100% 믿지는 않지만, 가능한 대화내용보다 대화DB를 벗어날 때의 오류상황에 대해서 더욱 공을 들였다면 뭐 아주 허풍은 아닐 수 있겠다. 특히 요새 게임이야 DVD(4GB가 넘는)를 여러장 사용하기도 할 정도로 용량이 크니까, 음성인식 엔진도 상당한 수준의 것을 사용할 수 있지 않을까나. 출력은 합성음보다는 녹음된 게 품질도 용량도 나을테고. 아직 웹사이트에는 이 게임에서 음성대화가 어떤 조작/대화 기능을 제공하고 그게 게임내용과는 어떻게 연결되는지를 알려주지 않는다. YouTube에 올려놓은 .. 2009. 3. 25.
Google Voice 얼마 전에 Google Voice라는, 무시무시한 이름(개인적인 느낌 ;ㅁ; )의 서비스가 소리소문없이 서비스를 개시했다. 뭐 사실 그동안에도 Google 411같은 전화망 대응 서비스도 있었고 iPhone 어플로 음성검색 기능을 넣기도 했지만, 우주정복을 꿈꾸는 구글의 Google Voice라는 서비스라니!!! z(T^T)s 이 서비스는 전화 사용자를 온라인과 연결시켜 주는 걸 목표로 하는 것 같은데, 사실은 우리나라에서는 벌써 각 통신사 웹사이트(및 고객센터나 연결된 700 서비스 등등)를 통해서 가능했던 벨소리 기능, 문자 관리 기능, 스팸 차단 기능, 114(411) 문의 기능 등등을 웹사이트에 통합해 놓은 것이다. 요컨대 우리나라 전화망의 사업구조라면 꽤 짭짤한 대목이기 때문에, 구글에게 내어줄.. 2009. 3. 20.
iPod Shuffle with VOICEover 애플에서 새로운 (이제 3세대인 건가) 아이팟 셔플을 발표했다. 아이폰 3세대(3G말고 -_-;;; )가 나오네 맥미니 새 버전이 나오네 여느때처럼 루머와 새소식이 많은 가운데, iPod Shuffle 군은 소리소문없이 기습출시한 격이다. 이번 셔플은 저번 셔플에 있던 상하좌우+가운데의 5버튼 조작도 없고, 그냥 밋밋한 금속조각처럼 보인다. 게다가, 웹사이트에 가보면 있는 저 문장. VoiceOver... 설마, 내가 전에 아이팟에서의 음성인식에 대해서 언급했던 것이 셔플에서 구현된 건가! 용감하게도 화면을 아예 없애고 음성으로만? ㅎㄷㄷ ... 그럴리가 있나. ㅡ_ㅡa;; 웹페이지에 나와있는 내용을 보면, 이 기능은 기본적으로 전에 소개했던 iPod용의 VoiceOver 기능을 iPod nano가 아닌.. 2009. 3. 11.
Voice but NOT Speech: Microsoft Recite MWC 행사 덕택에 짧게라도 생각을 정리할만한 글꺼리가 자꾸 생긴다. 긴 글 때문에 복잡해진 머리를 식힐 겸 또 정리해 보자. Voice UI 디자인에 대해서 고민하면서, 내 멋대로 다음과 같은 표를 그려본 적이 있다. (이게 정확히 맞는지 모르겠지만, 뭐 기억하기엔 이렇다.) 지금도 크게 다르지 않지만, Voice UI와 관련된 다른 비슷한 개념들 간에 영역을 좀 정해보자는 의도였다. Scope Auditory UI Speech UI Sound UI Voice UI Target Language Paralanguage Audio Verbal Non-verbal (아놔. 오랫동안 HTML에서 손을 뗐더니 표 하나 그리는데 이게 왠 뻘짓이냐. ㄷㄷ) 위 표를 들고 다니면서 자주 언급했던 부분은 '언어 lan.. 2009. 3. 1.
Speech Recognition on Android 미국 T-Mobile에서 출시한 G1폰에, 온라인 업데이트를 통해서 음성인식 기능이 포함된다고 한다. 이 소식은 포털에만 올라와 있고 T-Mobile 공식 웹사이트에서는 찾아볼 수가 없는데, 그래서 구체적으로 어떤 종류의 음성명령이 가능한 건지는 알아볼 수가 없다. 일전에 나왔던 아이폰에서의 구글 음성인식 - 음성검색, 주소록검색, 주소검색 정도 - 이 그대로 안드로이드 버전으로 포팅되었을 가능성이 가장 높겠지만. 안드로이드는 초기부터 음성인식에 대한 준비는 다 되어있는 듯한 루머(?)가 많이 돌았는데, 만일 OS 수준에서 음성인식을 제대로 지원해준다면 이상적인 VUI를 실현할 가능성은 별도의 어플을 구매해야 하는 아이폰보다 훨씬 높다고 생각한다. 무엇보다 어플이기 때문에 접근할 수 없는 기반기능까지도 .. 2009. 2. 5.
Is VUI Born Evil? 도시바에서 새로 나오는 프로젝터에서, 메뉴를 읽어주는 기능을 넣는다고 한다. 좀 생뚱맞기는 하지만, 가끔 화면이 나오지 않는 순간이 있다거나 메뉴가 상하좌우 뒤바뀌어 있는 경우에는 조금 유용할지도 모르겠다. "전구 좀 갈라니까!" 라는 오류메시지도 화면에 출력하는 것보다 주목을 끌 수 있을지도. 그런데 이 제품의 Voice UI 기능 탑재를 전하는 포털의 자세는 정말 악마의 재래를 전하는 듯 하다. 아직 음성이 어떤 순간에 어떤 어조로 쓰일지가 전혀 알려지지 않은 상황인데, 음성이 들어간다는 것만으로도 MS Office Assistant였던 Clippy와 비교당하고 있는 거다. 게다가 사실 Clippy는 음성UI가 아니다! 화면을 가리고 서서 당당히(?) 대화를 요구한 게 무엇보다 거슬리는 점이었던 건데.. 2008. 11. 22.
Google Voice Search on iPhone 일전에 소개했던 Google의 음성검색 서비스인 Google 411이, 오늘부터 iPhone 어플로 배포된다고 한다. 전에 봤던 소개 동영상을 떠올리며 원래 기사를 읽어보면 사실 기능을 아이폰에 넣었다는 게 요지인 것 같은데, 그렇다고 하더라도 위치인식이 가능한 기계에 지도검색을 주요골자로 한 음성인식을 넣었다는 것만으로 그 잠재력은 매우 커보인다. "꽃배달"이라고 하면 이 근방의 꽃집들을 지도에 찍어서 보여줄테고, Google 411의 원래 서비스대로라면 바로 VoIP를 통한 전화연결도 가능할 거다. 아직 AppStore에서는 이 어플이 검색되지 않고 있지만, 일단 등록되면 바로 설치해볼 생각이다. 이미 발표된 Google Mobile App이라는 어플도 Gmail, Calendar, Docs 등으로의.. 2008. 11. 15.
And the Winner is.... (Free HTI Apps on iPhone/Android) 사실 시리즈물도 아니고 컨테스트는 더욱 더 아니었는데, 본의 아니게 대상이 등장해서 제목을 그렇게 해 봤다. 뜬금없이 등장한 Free HTI Apps의 내맘대로 대상작은, 바로 "Shazam"이라는 이름의 어플리케이션 되겠다. 이름이 이렇다보니 처음에 눈에 띄지 않은 것도 당연하달까. 이 어플의 주요 기능은 바로 듣고 있는 음악을 iPhone에 들려주면(이걸 음악을 tag 한다고 표현하고 있다), 그걸 인식해서 가수/앨범/장르 등 기본적인 정보를 알려주는 것이다. 음악이 충분히 클 경우 인식률은 놀랄 정도로 높았지만, 역시 미국 노래 외에는 충분히 인식하지 못하는 것 같았다. 이 어플의 가장 훌륭한 점은, 아이폰이 바로 iTunes Music Store와 연결되어 있다는 거다. 즉 언제 어디서나 들리는 .. 2008. 10. 23.
Yet More Speech Apps on iPhone 며칠 전에 iPhone에서 구동되는 무료 HTI 어플들을 정리했는데, 한메일에 들어갔다가 한 블로거가 음성인식 어플을 소개해 놓은 동영상을 퍼다놓은 걸 보게됐다. 역시 놓친 게 있었던 듯. ㅎㅎ 이미 김은 새버렸으니 굳이 주절주절 적을 기운은 없고, 유투브에 들어가 보니 이 회사(AppStore에는 Excuse Me Services라고 되어 있고, 프로그램 첫 화면에는 Dial Directions 라고 되어 있다. 어느 쪽이냐 -_-; )에서 올린 동영상이 몇개나 있다. 현재는 Say Who라는 음성 다이얼링 서비스만 AppStore에 올라와 있는데, Say Where도 곧 올라올 듯. 유투브 동영상들 중 각각의 어플에 대한 동영상 설명은 다음과 같다. Say Who (주소록 음성 검색 및 "번호인식").. 2008. 10. 22.
Voice UI and Economic Crisis? 모든 게 불안한 세상이다. 모든 경제 체제가 무너지는가 싶을 정도로 한동안은 주식시장이 폭락하고 환율이 요동을 치더니, 한동안은 또 언제 그랬나 싶게 잠잠하기도 하다. 얼마 전에는 GM을 비롯한 제조업의 상징 같은 회사들의 주가가 20~30%나 곤두박질 치던데, 사실은 IT 업계도 위험해서 이미 곳곳에서 인원감축 소식이 들려오고 있다. 이럴 때 눈에 띄는 것이 아무래도 이런 위기에 초연한 듯한 행보를 보이는 회사일 것이다. 그런 의미에서 얼마전, 이런 경제상황에서 음성 입출력 기술 시장을 대부분 석권하고 있는 Nuance 사가 Philips의 음성인식 자회사를 합병한 것은 참 신기한 일이다. 많은 회사가 사업을 줄이고, 지분을 팔아서라도 정부의 지원을 받아 부도를 막고 있는 상황에서 말이다. 전에 필립스.. 2008. 10. 15.
iPod Accessibility and Voice UI - a Home-made Rumor 얼마전 Apple이 iPod nano의 4세대 모델과 touch의 2세대 모델, iTunes 8 등을 발표했다. 황당한 부고기사까지 나돌았던 스티브 잡스는 그 기사를 농담꺼리로 삼으며 재치있게 발표를 시작했지만, 지난 일년간 부쩍 노쇠해진 모습은 여전히 안타깝다. 이번에 발표된 제품군들은 비록 몇건의 사전누설 '루머'로 좀 김이 빠지긴 했지만, 애플의 엔지니어링 철학이라고 생각되는 "we are selling software, in a beautiful box"에 그야말로 부합되는 내용이었다고 생각한다. 유출된 내용들은 대부분 그 껍데기의 모양이 어떻다는 것에 대해서 였지만, 발표 내용은 주로 새로운 기능에 대한 것이었고, 그에 대해서는 여전히 놀라운 새로운 경험 일색이었으니까 말이다. 그런데, 며칠 늦.. 2008. 9. 16.
반응형