본문 바로가기

Voice UI50

Speech Recognition Comes to the Mac NY Times의 David Pogue가 이번에는 맥용 음성인식기 - 정확하게는 dictator - 를 소개했다. 기본적으로 말하는 대로 받아적고, 음성으로 프로그램 명령을 할 수 있는 등 일반적인 음성인식 보조 어플리케이션과 다를 건 없지만, 훌륭한 선례를 만들어가고 있는 PC용 어플리케이션인 Nuance사의 Dragon NaturallySpeaking 9과 비교하면 몇가지 좋은 Voice UI feature가 빠져 있다. (그나저나 이 PC용 음성인식기는 회사를 합병하고 부서를 팔아넘기고 하는 와중에도 절대 이름을 줄이거나 바꾸지 않고 고집스럽게 지켜서, 참 어려운 이름으로도 1등을 하고 있다. -_-;; ) 다른 기사에서 소개한 바에 따르면 이 회사에서도 앞으로는 Nuance사의 엔진을 licens.. 2008. 1. 31.
Persona or Personal... That's the Question GUI 위주의 UI를 하다가 Voice UI를 접하게 되면, 가장 친숙하게 다가오는 게 바로 persona라는 개념이다. VUI의 다른 측면들은 대부분 음성대화에 대한 분석과 조합에 대한 것이고, 입출력 기술의 제약조건과 그에 따르는 생소한 설계 지침이나 tip들은 아무래도 시각적인 것이 없어서 거리감이 느껴지게 마련이다. 그에 비해서 이 persona라는 것은 그 구축 방법에서부터 어떤 사람의 모습을 상정하기 때문에 뭔가 사진이라도 하나 띄워놓을 수 있고, 기존의 UI 디자인에서도 Persona 구축을 통한 사용자 상(像)의 공감대 형성이 하나의 방법론으로서 인기가 있기 때문에 언뜻 "아, 이건 아는 거야!" 라고 접근할 수 있는 거다. (상품기획이나 UI.. 혹은 다른 종류의 디자인을 위한 Perso.. 2008. 1. 18.
With Voice or Not, Mobile Apps Sucks. 도시 한복판에서 저녁먹을 곳을 찾는 사람들이 있다. 가장 좋은 시나리오는 뭘까? (1) PDA의 LBS 서비스로 근처의 식당을 지도에 표시한다. (2) 휴대폰을 꺼내 음성인식 서비스로 식당을 찾는다. (3) 그냥 지나가는 사람들한테 물어본다. 뭐 보기를 보면 답이 보이긴 하겠지만, 이걸 실제로 경험한 글이 VUI Blog에 올라왔다. 서비스를 만드는 입장에서 이런 경험을 당한다는 것은 참 재미있는 동시에 좌절스러운 일이 될 거다. ㅋㅋ 링크: No wonder mobile apps take so long to get adopted 2008. 1. 7.
Matchmaking User Interfaces (with Right Apps) UI 라는 분야를 배운 이후에, 많은 "____UI" 라는 용어들을 만났다. "제품UI", "S/W UI"(이게 특별했던 시절이 있었다. 진짜루), "Web UI", "Mobile UI", "Voice UI", "Gesture UI", ... 심지어 "Robot UI", "VR UI"까지. 대부분의 용어들은 유행처럼 왔다가 사라졌고, 바로 그 다음 용어로 대치되어 학교의 교과과정과 구직목표를 바꿔댔으며, 항상 트렌드니 대세라는 말을 가까이 하고 다녔다. 하지만 가만히 생각해보면, 그 각각의 UI들이 의미를 가졌던 것은 그나마 맞는 application을 만나서 였던 것 같다. 가까이 "Web UI"라는 용어는 page view나 다른 객관적인 가치기준으로 측정가능한 방법을 찾다보니 대부분 J. Niels.. 2007. 12. 3.
음성인식기술 홍보 동영상 (Nuance) 자주 체크하는 VUI 블로그(내가 알기론 유일하지만, 그나마 다른 주제도 조금씩 다루고 있는)에 YouTube 동영상이 올라왔길래, 기왕 들어간 김에 몇가지 관련 동영상을 찾아봤다. 동영상은 모바일 기기에서 메시지를 작성하기 위한 dictation을 T9 방식이나 작은 QWERTY 자판과 비교한 내용과, 운전하면서 음성으로 정보를 찾고 확인하는 방식이 기존 GUI 방식과 비교해서 얼마나 더 안전한가..에 대한 공개 비교실험이다. 특별할 것도 없고, 조금은 조작된 느낌이니 숫자도 믿을 수 없다. 하지만 역시 영어 음성인식기의 성능개선은 이제 충분히 상용화할 수 있는 수준에 왔구나..하는 생각은 든다. 내가 영어를 잘 하거나 한국어 시장이 넓었다면 Voice UI와 나와의 관계가 조금은 달라졌을까. ㅡ_ㅡ;.. 2007. 11. 30.
Voice UI는 착실하게 발전하는 중... ... 내가 노는 동안에도 말이지. ㅡ_ㅡ;;; 새 회사에서 과연 Voice UI를 어떻게 연관시킬 수 있을까... 혹은, 이 회사에서 Voice UI가 필요할까...를 고민(만) 하면서 딩가딩가 웹서핑을 즐기다가, 지난 10일자 NY Times의 Pogue 동영상을 봤다. 2:20 부터 시작되는 음성인식 데모를 보면 multiple start-word, domain-specific dictation 등의 개념이 포함되어 훌륭하게 작동하는 (것처럼 보이는) 음성인식 일정관리 시스템을 볼 수 있다. 흠... 달랑 100불짜리 휴대용 기기에서 동작하는 거의 자유로운 음성인식 시스템이라니, 이 추세대로라면 몇년 후에는 다양한 Voice UI Application을 자주 만나볼 수 있을 것 같은데, 혹시 제대로.. 2007. 11. 12.
빌 게이츠가 음성인식기술에 관심있단다. ... (역시) 누군들. ㅡ_ㅡ;;; 어쨋든 잊을만하면 한번씩 natural interaction 얘기를 꺼내는 사람 중 하난데, 아무래도 파급력도 파급력이지만 '실제로' OS과 필수 application 수준에 음성인식기를 꾸준히 넣고 있는지라 무시할 수 없어 꼼꼼히 읽게 되는 것 같다. 늘 인터뷰 기사엔 정보가 없지만... 어쨋든 이건 그냥 스크랩. 이다. 2007. 10. 22.
Voice UI의 Keystone 기계를 '조작'하지 않고, 손짓이나 음성만으로 뭔가를 시킬 수 있다는 것은 분명히 매력적이다. 이건 아마 앞으로도 변하지 않을 것이다. 그런데 Voice UI를 제대로 적용한 제품을 만들기는 왜 이렇게 힘든 걸까? Virtual Assistant에 대한 글을 하나 읽으면서, 인용되어 있는 촌티 풀풀 나는 Apple의 미래 시나리오 동영상(아래)을 보면서, Voice Ui에 중요한 것은 혹시 Voice가 아닌 게 아닌 걸까..라는 생각이 들었다. (동영상 내용은 중요하지 않으니 따분하면 - 실제로 그렇다 - 넘어가자) 음성입력(인식)과 음성출력(합성)이라는 두가지 기술로 뭔가를 만든다고 하자. 확률적인 오류를 항상 내포한 이 불안불안한 기술들로 뭔가 견고한 구조를 만드는 것은,마치 약간씩 찌그러진 돌로 만.. 2007. 10. 20.
골전도 스피커... 죽을듯말듯... 팬텍에서 일본 KDDI의 au 라인으로, 골전도 휴대폰을 출시한다고 한다. 이 골전도 스피커를 적용한 전화기들은 때로는 외주 소음에 강인하다는 핑계로(건설현장에서 좋다나), 때로는 청력상실에 대한 대안으로(노화 및 사고로 청력을 잃은 경우, 청세포가 살아있다면 도움이 된다고) 자주 등장한다. 그동안 눈에 띄였던 몇가지 대표적인 모델을 정리하다가 발견한 사실 한가지. ▲ Sanyo에서 2003년 출시한 TS41 ☞ 만일 웰빙이니 삶의 질이니 하는 가치가 정말 근미래의 전세계적인 화두가 된다면, 일본이 지난 수년간 기울이고 있는 이런 노력들이 산업에 미칠 영향은 정말 어마어마할 것 같다. 이 시장도 좁고 돈도 안 되고 요즘같은 냉정한 시대에는 회사 이미지 제고효과도 없을 것 같은 일들을 꾸준히 하는 그 고지.. 2007. 10. 20.
iPhone에서 음성인식 구현! 많은 해커들 덕택에 (AT&T는 크래커라고 주장하겠지만) iPhone의 많은 기능이 오픈되는가 싶더니, 어느새 음성인식 어플리케이션이 구현되어 공개되어 버렸다. -_- 그것도 단순히 음성인식기술의 데모가 아니라, 제대로 iPhone의 기능과 맞물린 application이 바로 만들어진 걸 보면서 참 뭐하고 사나...싶은 생각이 든다. ▼ 아이폰에서 음성으로 음악 검색 (iPod 연동) ▼ 아이폰에서 음성으로 장소 검색 (구글맵 연동) VoiceSignal 이라는, 음성인식엔진의 embedded 버전에 강점을 가지고 있는 회사에서 만들어 올린 모양이다. 삼성 폰의 음성인식기(와 Voice UI)가 이 회사에서 만든 거다. 의외로 제대로 하는 놈들이잖아 이거. =_= 그나저나, 회사에서 이렇게 공식적으로 크.. 2007. 8. 29.
모바일 기기에서 다시 Voice UI가 주목받을 수 있을까? 다시..? 흠, 어쨋든. 터치스크린이 모바일 기기의 대세로, 다시 휴대폰의 총아로 떠오르는 이 마당에 한물 간 음성인식을 들고 나온 기사가 있다. "미래 휴대폰 변화의 주역은 '목소리'"라나. 출처: 아이뉴스24 http://www.inews24.com/php/news_view.php?g_menu=020300&g_serial=274474 일단 고마운 일이지만... 역시 새로운 이슈도 새로운 해법도 나오지 않은 것 같다. 본문 중에는 30% 실제 인식률을 이야기하고, 최근 일을 하다가 뭔가 비슷한 숫자를 듣기는 했지만, 여전히'랩' 인식률은 아래 표와 같이 보고되는 모양이다. 연구기관 시스템 특징 DB 단어 규모 인식률 IBM Tangora 고립단어인식 영어 2만 95% NEC 고립단어인식 일본어 1천80.. 2007. 7. 31.
지능형 로봇과 대화하려면 로봇액센트 배워야 - IUI 밀고 당기기 오늘 전자신문 기사. 이건 뭐... 황당한 기사가 떴다. 나름 음성인식팀과 같이 일한 경험이 있는 사람으로서 일단 심정적으로 이해는 가지만, 그래도 이러면 안 되는 거 아닌가? 음성인식이 드디어 막다른 골목에 다다른 건가 싶기도 하고. “로봇과 대화하려면 로봇식 액센트부터 배워야 한다.” 지능형 로봇제품에 대한 소비자 불만의 상당부분을 차지하는 음성인식 문제의 절반은 고객의 발음문제 때문인 것으로 나타났다. 가령 가정용 로봇에게 “뉴스”라고 지시를 내릴 때 또박또박 발음하지 않아서 “날씨”라고 인식하는 오작동 문제를 마치 로봇자체의 기능상 결함처럼 사용자들이 오해한 경우가 많았다는 것. 정통부가 지난해 URC로봇 시범사업의 소비자 불만을 분석한 결과 연구실에서 테스트할 때는 90%대의 높은 음성인식률을 .. 2007. 7. 11.
반응형