본문 바로가기

Conversation Works

New Shiny Button, Only for Voice UI 휴대폰용 음성 사용자 인터페이스를 해보겠노라고 동분서주할 때다. 아직 휴대폰에 터치스크린을 붙인다는 생각은 "대표적인 실패사례"로 꼽히고 있었고, "그게 단가가 얼만지 아느냐"며 이미 십여개 붙어있는 버튼에 하나를 더 추가하는 것도 위아래로 줄줄이 윤허를 받자와야 하던 무렵. 당시 나에게 소원이 하나 있다면 음성인식 전용의 버튼을 하나 넣는 거 였다. (1) EPD Techniques 음성인식의 적확율을 좌우하는 것 중 가장 큰 것이 음성명령의 맨앞과 맨뒤를 찾아내는 작업, 즉 EPD(End-Point Dectection)이다. 아무리 좋은 음성인식 엔진도 앞뒤로 요상한 음운이 들어가 버리면 엉뚱한 결과를 낼 수밖에 없기 때문이다. (1-1) Pause Detection EPD를 기술적으로 해결하는 대표.. 더보기
Voice Search in Korean 지지난 주에 다음 커뮤니케이션에서 아이폰용 Daum 앱에 음성검색 기능을 포함시켰다기에 이게 웬일이냐..하고 있는데, 지난 주에는 구글 코리아에서도 모바일 음성검색의 한국어 버전이 안드로이드 앱으로 (아이폰용도 업데이트할 예정) 발표되고, NHN에서도 올해 안에 음성검색 모바일앱을 내놓겠다고 한다. 누가 먼저 시작했는지는 모르겠지만, 이 일련의 음성검색 발표 러쉬에는 업계의 경쟁심리가 작용했을 것이다. 그렇지만 다음도 일찌감치 음성인식 앱을 준비하고 있음을 홍보한 적이 있고, 구글 음성검색이야 진작에 출시되어 있었던 만큼 준비들은 오래전부터 해왔을 테고, 그래선지 음성인식의 적확률에 대해서도 다음의 앱이나 구글의 앱이나 기대 이상이라는 반응이다. 특히 안드로이드 OS는 초창기부터 음성인식을 위한 고려가 .. 더보기
Siri - Virtual Personal Assistant 이 프로젝트가 드디어 iPhone App으로 출시가 되었다. 무료. 여기에 대해서 뭐라뭐라 글을 쓰기엔, 내가 요새 좀 지쳤다. 아니 굳이 그렇지 않더라도, 십년도 더 된 일이니 이제 와서 키보드를 두드리기가 민망하다고 하는 게 올바른 고백이겠다. :$ 그러니 그냥 동영상이나 하나 더 올리고 마무리. 보란듯이 잘 됐으면 좋겠다. 현실적으로 문제가 없지 않겠지만, 그래도 이젠 슬슬 꿈꾼 보람이 있어야 하지 않을까. 나도 한 우물 열심히 파면서 살아야 하는데, 어느새 여기까지 와 버린 건가... ;d 더보기
Instinct vs. iPhone - Ad Compaign 1년 전쯤 삼성 휴대폰 인스팅트(Instinct)가 미국에 Sprint 망으로 출시되면서, iPhone(당시 2G)과의 비교광고를 대대적으로 했던 모양이다. 스프린트에서 올린 동영상들을 뒤늦게 발견했는데, 비교광고에 익숙하지 않아서 그런지, 광고의 뉘앙스 ("쟤네는 이거 안 되요~ 메롱메롱") 때문인지, 그다지 잘 만든 광고 캠페인이라는 생각은 안 든다. (사실은 그냥 애플 빠심이 발동 ;ㅁ; ) 흥미로운 것은 모두 5편의 동영상 중에 Voice UI가 두 편이나 나온다. 우선 첫번째는 음성명령 기능. 음성으로 전화를 거는 모습을 보여주면서, iPhone은 없지롱..이라고 하고 있다. 삼성 휴대폰에 통화 관련된 음성인식 기능이 들어간 건 꽤 역사가 오래 됐고, 해외에서 출시되는 휴대폰에는 거의 대부분 포.. 더보기
Emotional AI 처음 회사생활을 시작해서 건드렸던 게 MS Agent 2.0 엔진을 이용한 대화형 에이전트를 만드는 거 였다. Visual Basic Script와 JavaScript를 혼합해서 인터넷 익스플로러와 넷스케이프에 연동하고 다른 프로그램에 연동하고 해 가면서, 주어진 과제 - 실제로는 완전하게 동작하지 않는 "사람과 대화하는 컴퓨터"를 그럴 듯 하는 게 구현하는 것 - 를 어떻게든 해보려고 노력했다. 그때는 그렇게 10년동안 연구하면 그 '그럴 듯한' 시스템이 실제로 만들어질 줄 알았지만, 10년이 지난 지금도 그 시스템을 만들려면 비슷한 수준의 인공지능과, 비슷한 수준의 구라를 조합해야 할 게다. 당시 사용했던 MS Agent 모델 James 어쨋든 당시에는 거의 이론적인 수준으로만 존재했던 대화모델을 어.. 더보기
Microsoft Office 2010: The Movie 얼마전에 올라온 것 같은 이 MS Office 2010 홍보 동영상을 이제서야 보게 됐다. 비교적 열성과 전문성이 보이는 홈페이지 내용에 비해서, 이 동영상은 마치 고등학생들이 만든 프로젝트 영상 같달까... 어중간한 프로의식에 일단 흉내는 냈지만 도통 공감이 가지 않는 재치있는(?) 내용들이 거슬린다. 게다가 실제로 의미있는 장면이나 대사는 없고, 그냥 헐리웃 영화 예고편에 대해서 순수하게 풍자하고자 만든 영상이라면 오히려 수긍이 가겠다. ... 사실대로 말하자면, 내 입장에서는 내용이 아주 없지도 않았다. 비록 실패했지만, 개인적으로 대화형 Human Interface Agent를 적용한 Social UI의 의미있는 시도로 기억하고 있는 Clippy가 주인공(?)의 죽어버린 친구로 나온다. 여기에 따.. 더보기
Voice but NOT Speech: Microsoft Recite MWC 행사 덕택에 짧게라도 생각을 정리할만한 글꺼리가 자꾸 생긴다. 긴 글 때문에 복잡해진 머리를 식힐 겸 또 정리해 보자. Voice UI 디자인에 대해서 고민하면서, 내 멋대로 다음과 같은 표를 그려본 적이 있다. (이게 정확히 맞는지 모르겠지만, 뭐 기억하기엔 이렇다.) 지금도 크게 다르지 않지만, Voice UI와 관련된 다른 비슷한 개념들 간에 영역을 좀 정해보자는 의도였다. Scope Auditory UI Speech UI Sound UI Voice UI Target Language Paralanguage Audio Verbal Non-verbal (아놔. 오랫동안 HTML에서 손을 뗐더니 표 하나 그리는데 이게 왠 뻘짓이냐. ㄷㄷ) 위 표를 들고 다니면서 자주 언급했던 부분은 '언어 lan.. 더보기
Yet More Speech Apps on iPhone 며칠 전에 iPhone에서 구동되는 무료 HTI 어플들을 정리했는데, 한메일에 들어갔다가 한 블로거가 음성인식 어플을 소개해 놓은 동영상을 퍼다놓은 걸 보게됐다. 역시 놓친 게 있었던 듯. ㅎㅎ 이미 김은 새버렸으니 굳이 주절주절 적을 기운은 없고, 유투브에 들어가 보니 이 회사(AppStore에는 Excuse Me Services라고 되어 있고, 프로그램 첫 화면에는 Dial Directions 라고 되어 있다. 어느 쪽이냐 -_-; )에서 올린 동영상이 몇개나 있다. 현재는 Say Who라는 음성 다이얼링 서비스만 AppStore에 올라와 있는데, Say Where도 곧 올라올 듯. 유투브 동영상들 중 각각의 어플에 대한 동영상 설명은 다음과 같다. Say Who (주소록 음성 검색 및 "번호인식").. 더보기