기계를 '조작'하지 않고, 손짓이나 음성만으로 뭔가를 시킬 수 있다는 것은 분명히 매력적이다. 이건 아마 앞으로도 변하지 않을 것이다. 그런데 Voice UI를 제대로 적용한 제품을 만들기는 왜 이렇게 힘든 걸까?
Virtual Assistant에 대한 글을 하나 읽으면서, 인용되어 있는 촌티 풀풀 나는 Apple의 미래 시나리오 동영상(아래)을 보면서, Voice Ui에 중요한 것은 혹시 Voice가 아닌 게 아닌 걸까..라는 생각이 들었다.
음성입력(인식)과 음성출력(합성)이라는 두가지 기술로 뭔가를 만든다고 하자. 확률적인 오류를 항상 내포한 이 불안불안한 기술들로 뭔가 견고한 구조를 만드는 것은,마치 약간씩 찌그러진 돌로 만들어지는 아치를 짓는 것과 같다. 하나하나의 돌은 구조물에 사용되기엔 뭔가 불안하지만, 그 순서와 강약을 조절하고, 특정한 방향에 맞게 잘 정렬해서 모은 다음에, 결정적으로 아치의 꼭대기에 keystone을 꼽으면 하나의 훌륭한 - 안정적인 - 구조물이 되는 것이다.
앞에서 링크한 기사에서는 Ray Kurzweil의 다음 인터뷰 기사를 인용하며 'Intelligence of Software'를 논하고 있는데, 어쩌면 virtual assistant 뿐만 아니라 voice ui 의 keystone도 결국은 기계의 지능이라는 AI 본연의 질문으로 회귀하는지 모르겠다.
쓸모있는 지능을 갖지 못하면, Voice UI 라는 분야 자체만으로는 큰 의미를 갖지 못한다는 것은 사실 쓸만한 기능이 없으면 UI 잘 해봐야 별 소용이 없다는 것과 비슷한 맥락으로 보인다. 구닥다리 시녀론 - "디자인은 마케팅의 시녀인가?"였던가 - 을 끄집어 내는 건 의미없어 보이고, 그냥 아직도 한참 기다려야 하겠구나.. 싶을 뿐이다.
물론, 이 와중에도 누군가는 주어진 조건과 기능과 환경에서 그럴듯한 Voice UI를 만들어내서 내 뒤통수를 치겠지만 말이지. ㅡ_ㅡ+