본문 바로가기

HCI

Voice UI는 착실하게 발전하는 중... ... 내가 노는 동안에도 말이지. ㅡ_ㅡ;;; 새 회사에서 과연 Voice UI를 어떻게 연관시킬 수 있을까... 혹은, 이 회사에서 Voice UI가 필요할까...를 고민(만) 하면서 딩가딩가 웹서핑을 즐기다가, 지난 10일자 NY Times의 Pogue 동영상을 봤다. 2:20 부터 시작되는 음성인식 데모를 보면 multiple start-word, domain-specific dictation 등의 개념이 포함되어 훌륭하게 작동하는 (것처럼 보이는) 음성인식 일정관리 시스템을 볼 수 있다. 흠... 달랑 100불짜리 휴대용 기기에서 동작하는 거의 자유로운 음성인식 시스템이라니, 이 추세대로라면 몇년 후에는 다양한 Voice UI Application을 자주 만나볼 수 있을 것 같은데, 혹시 제대로.. 더보기
Universal Avatar in Virtual World~s. 어느새 여기까지 와 있었나... 여러 가상세계 상에서 avatar를 공유하기 위한 - 즉, 하나의 아바타로 여러 월드를 돌아다닐 수 있도록 하기 위한 - 연구가 진행 중이란다. 사실 연구라기보다는 '협약'에 가깝겠으나... 여하튼 가상세계라는 것이 웹사이트만큼 많아지고, 캐릭터라는 것이 ID만큼 많아지는 세상이 진짜 올지도 모르겠다. 이건 한동안 유행했(다가 실패했)던 통합인식 ID와 흡사한 흐름이잖어... 사실 virtual world에서 캐릭터를 만들 때의 심정은 ID를 만들 때의 심정과 조금 달라서, 여러가지 캐릭터를 만들어 여러가지 인생(?)을 즐기고 싶은 게 당연하다. (ID도 조금은 그런 느낌이 있나? 그 차이는 역시 '각자 자아가 있는 커뮤니케이션'을 목적으로 하느냐 '대체적인 자아를 통한 .. 더보기
<UI Breakthrough> by Don Norman 이 할아버지의 행보가 나는 불안불안하기만 하다. 심리학자로서 나름대로 경력을 쌓다가 난데없이 일상의 물건들에 대한 소고를 정리해서 책으로 내면서 (the psychology of everyday things) 딱이 이론이 없던 UI 업계에 영웅으로 등장하더니, 그 후로도 잇달아 UI 업계를 효용성(things that make us smart)에서 기술(invisible computer)로, 다시 감성(emotional design)으로 뒤흔드는 저서를 연달아 발표했다. 그 와중에 심리학계에서는 다른 사람의 연구를 껍데기만 인용해서 민중을 현혹시키는 이단아로 불리고 있었고... 심리학자에서 UI 컨설턴트로의 변화에서 예측할 수 있었어야 하겠지만, 최근 KAIST에서 있었던 이 할아버지의 발언 - "사용하.. 더보기
UI 분야에 대한 궁극적인 질문? 영화 더보기
물리적인 조작장치를 넘어서기 UI의 역사는 버튼과 레버와 밸브에서 시작되었다고 해도 과언이 아니다. 기껏해야 빤히 보이는 작대기 하나 바퀴 한두쌍이 대부분 도구의 모습이었던 인류에게 맨손으로는 통제할 수 없는 무언가의 힘 - 증기, 가스, 기름, 전기 - 을 버튼과 레버와 밸브로 조작할 수 있게 한 게 화근이었으니까. 이런 걸 조작은 해야 쓰것는데 직접 어쩔 수 없으니 중간에 '조작장치'를 넣었고, 그게 이전처럼 빤히 보이는 방식이 아닌지라 슬슬 인생들이 피곤해진 거다. 그 이후 나왔던 다양한 (결국은 비슷한 원리지만) 조작장치들 중에서 특히 전기적인 흐름을 잇거나 차단하는 버튼 - 스위치가 좀더 올바른 표현이겠지만, 이 글도 사용자 중심으로 쓰여졌다..고 치자. 응? - 은 가장 최근의 휴대폰에서조차 수십개나 정렬해서 그 위용와 .. 더보기
아이폰을 생각하면 술이 땡기는 이유 iPhone의 UI는 훌륭하다. 멀티터치를 모바일 기기로 바로 적용하다니 기발하다. 역사와 전통의 GUI는 관록에서 우러나는 아우라가 뭔가를 보여준다. 순간순간 '훗~ 이건 어때?' 하는 듯한 화면 효과들은 감탄을 자아낸다. 하지만, 내가 iPhone을 직접 보고 느낀 것은 그런 감탄이 아니라, "이런 거라면 우리는 절대로 만들 수 없어!" 라는 좌절에 가까왔다. 그냥 훌륭한 작업에 대해서 경의를 표하기 위한 은유적인 표현이 아니라, 정말 우리는 못 만든다. iPhone을 해킹해서 이미지들을 가지고 와서 '똑같이 만들어 주세요'라며 들어와도 못 만든다. 왜냐구? 지겹지만 iPhone 동영상 하나 보자. 그냥 물 흐르듯 지나가는 동영상이지만, UI 설계를 해본 사람이라면 왠지 모를 위화감이 느껴질 것이다... 더보기
얼굴인식 디카가 대세..? -_ㅜ 3~4년 전쯤. IUI 관련 강연자료를 만들다가 'scalable artificial intelligence'라는 개념을 접한 적이 있다. 인공지능이라는 것이 꼭 영화에 나오는 그것처럼 인간과 같은 수준의 인지능력을 갖춰야 하는 게 아니라, 주어진 기능에 맞는 만큼만 똑똑하면 그것으로 충분히 상품성 있는 인공지능이 될 수 있다는 거 였다. 이를테면, 카메라의 경우 노출수준을 알려주던 아날로그 게이지(뷰 파인더 안에 보이던 가느다란 빨간 막대기를 기억하시는가)도 훌륭하게 그 역할을 했던 인공지능이고, 자동초점(auto-focus)과 자동노출(auto-expose)는 그보다 훨씬 훌륭한 인공지능이었고, 이제 얼굴인식(face detection) 기능이 그 뒤를 이을 성공한 인공지능으로 자리잡아 가고 있다.... 더보기
모바일 기기에서 다시 Voice UI가 주목받을 수 있을까? 다시..? 흠, 어쨋든. 터치스크린이 모바일 기기의 대세로, 다시 휴대폰의 총아로 떠오르는 이 마당에 한물 간 음성인식을 들고 나온 기사가 있다. "미래 휴대폰 변화의 주역은 '목소리'"라나. 출처: 아이뉴스24 http://www.inews24.com/php/news_view.php?g_menu=020300&g_serial=274474 일단 고마운 일이지만... 역시 새로운 이슈도 새로운 해법도 나오지 않은 것 같다. 본문 중에는 30% 실제 인식률을 이야기하고, 최근 일을 하다가 뭔가 비슷한 숫자를 듣기는 했지만, 여전히'랩' 인식률은 아래 표와 같이 보고되는 모양이다. 연구기관 시스템 특징 DB 단어 규모 인식률 IBM Tangora 고립단어인식 영어 2만 95% NEC 고립단어인식 일본어 1천80.. 더보기
제스처로 TV 조작하기 공개적인 글에서 말할 순 없지만... 한때 이 동작인식을 이용한 가전 조작이라는 이슈에 크게 빠졌던 적이 있었다. 근데 최근에 또 어느 한 연구자가 이걸 publish해서 관심을 받는 모양이다. 한번 정리해 두자면; 위의 그림이 비교적 널리 공개된 '동작원리' 상상도이다. 이렇게만 되면 좋겠지만... 사용자가 웃통이라도 벗고 조작한다 싶으면 카메라를 이용한 동작인식 시스템으로서는 그야말로 disastrous 할 것이다. 나름대로 7가지 동작만을 대상으로 하는 것으로 제한하고 있기는 하지만, 여전히 Vision 기반의 동작인식의 최대 취약점인 '어디를 인식해야 할지 아는 것이 가장 어렵다'는 점에 대해서는 특별히 대안이 없어 보인다. 아직은. 참고로 아래는 이 사람들의 실제 프로토타입 모습. ... 아직 .. 더보기
지능형 로봇과 대화하려면 로봇액센트 배워야 - IUI 밀고 당기기 오늘 전자신문 기사. 이건 뭐... 황당한 기사가 떴다. 나름 음성인식팀과 같이 일한 경험이 있는 사람으로서 일단 심정적으로 이해는 가지만, 그래도 이러면 안 되는 거 아닌가? 음성인식이 드디어 막다른 골목에 다다른 건가 싶기도 하고. “로봇과 대화하려면 로봇식 액센트부터 배워야 한다.” 지능형 로봇제품에 대한 소비자 불만의 상당부분을 차지하는 음성인식 문제의 절반은 고객의 발음문제 때문인 것으로 나타났다. 가령 가정용 로봇에게 “뉴스”라고 지시를 내릴 때 또박또박 발음하지 않아서 “날씨”라고 인식하는 오작동 문제를 마치 로봇자체의 기능상 결함처럼 사용자들이 오해한 경우가 많았다는 것. 정통부가 지난해 URC로봇 시범사업의 소비자 불만을 분석한 결과 연구실에서 테스트할 때는 90%대의 높은 음성인식률을 .. 더보기