Quick Fix for Voice UI

2008.03.27 01:54
한동안 Software UI 업계 - 요즘 식으로 말하자면 GUI 업계가 되겠지만 - 에 강림했다가 '상식'이 된 후에 버려진 많은 UI Design Guideline 들이 있다. 아직도 인터넷을 뒤져보면 많은 사례들이 있기도 하고... 특히 Yale Univ.의 Web Style Guide와 같이 나름 독자적인 전문 분야에서 꾸준히 편집과 갱신을 거듭하던, 줏대있는 사례도 있었다. 예전에는 이런 거 모아다가 비교해가면서 나만의 (절대적인 그러나 상대적인) UI 금과옥조를 만들기도 하고, 무슨 원칙이 무슨 원칙과 어떤 경우에 상충되는지를 분석하고 떠들어대곤 했는데 요즘도 그러는지 모르겠다.

Voice UI 같은 경우에도, 이제 그런 사례가 적다고 말할 수는 없게 됐다. Voice UI 관련 서적들이 1년에 한두권씩은 책장에 추가되고, 대동소이한 것 같으면서도 처음의 "음성인식 기술이란~" 으로 시작되던 것이 "사용자는~" 이라고 시작하게 된 것도 내 입장에서는 괄목할만한 성장이다. (그렇다고 기술 측면을 무시하자는 건 아니지만. 사실 오히려 강조하는 편이다, 나는 -_- )

이번에 VUI Design Blog에 올라온 "21 Quick Fixes to Improve Your Voice Application"라는 글은 비교적 상세한 설계지침 design guideline 이라고 할 수 있는데, 저자의 말과 같이 website를 위한 지침에서 눈에 띄는대로 따온 것이기 때문에 잘 균형잡힌 항목들은 아닐지 모르지만, 이제까지 나온 것 중에서 비교적 사용자 중심적이고 실무적인 관점의 내용인 것 같아서 옮겨본다.


< 음성입출력 서비스 품질을 향상시키는 빠른 방법 >
출처: 21 Quick Fixes to Improve Your Voice Application

Copywriting 프롬프트 작성하기

1. Tell callers why they should perform a task.
    사용자들에게 서비스를 사용하고자 하는 동기를 부여하라.
    : 일단 필요하면, 쓰게 되어 있다. 사용자 입장의 가치와 니즈를
      충족시켜 준다는 것을 분명히 하라.
     (※역자주: 사실 이건, 예전 Web UI 가이드라인에서의 "#1. Content,
      Content, Content"를 연상시키는 슬픈? 항목이다)

2. Make the most highly trafficked menus easier to listen to.
   가장 자주 쓰이는 메뉴가 귀에 잘 들리도록 하라.
 
    : 메뉴가 너무 길면 당연히 못 듣는다. 그러니 메뉴 개수를 줄이던가,
      단계별로 그루핑하던가, 그냥 중간중간 쉬던가 해서 잘 들리도록 해라.
     (※역자주: 또한 메뉴의 순서에 손을 대는 것에 대해서, GUI 메뉴와의
      차이점에 주목할 필요가 있다)

3. Make choices meaningful.
   선택할 항목은 사용자가 쉽게 알 수 있는 단어를 사용하라.
 
    : GUI에서도 있는 labeling 이야기.
    (※역자주: 단지 GUI는 철자, VUI는 발음의 유사성에도 유의해야 한다)

4. Stay consistent.
    일관성을 유지하라.
    : 프롬프트와 용어사용에 있어서. (※역자주: 제발 좀. -_-;; )

5. Stay simple.
    간결하게 만들어라.
 
    : 어느 단계에서의 프로세스가 좀 많다고 해서, 그걸 꼭 복잡하게 만들라는
      법은 없다. (※역자주: simple vs brief. complex vs complicated.)

6. Avoid making hollow promises.
    널리 받아들여진 UI는 적용하라.
   
: 미국은 IVR 시스템에서 0번을 누르면 안내원이 나오는 게 일반적인가
      보다. 뭐 그런 거. (※역자주: 우리는 주민번호 누르고 *? #?)

7. Be concise.
    짧고 간단하게 만들어라.
    : ‘Nuff said. 란다. (※역자주: simple하고 뭐가 다르지?)

8. Go with what works.
    실제로 기대한 기능을 하는지 알아봐라.
 
   : 모르겠으면 사용자에게 물어봐라. 그게 사용성의 근원이기도 하다.
    (※역자주: 뭐 틀린 얘긴 아니다)


Usability 사용편의성

9. Make navigation consistent.
    네비게이션을 일관되게 만들어라.
    : 사용자가 말하는 것을 듣고, 그들 생각대로의 대화흐름을 만들어라.
    (※역자주: 그러니 FGI와 mental model이 여전히 중요하다는 거다.
     이 분야에서의 FGI 형식은 좀더 interview에 가깝긴 하겠지만.)

10. Never ask for more information than you need.
    필요한 정보만 물어봐라.
    : (사용자 입장에서) 쓸데없는 거 물어보느라 시간 뺏지 마라. 그냥 은행
     문여는 시간 좀 물어보려는데 주민번호를 왜 물어보냐?
    (※역자주: 미국에서도 사회보장번호 끝의 4자리를 물어보나보다.)

11. Add a search box.
    검색 기능을 넣어라.
    : 아 물론 VUI의 경우에는, "아무거나 말씀하세요" 같은 방식의 대화가
      가능한 순간을 넣어 사용자가 뭐가 필요한지 들을 수 있도록 하라.
    (※역자주: 엔지니어와의 한판승부가 벌어질만한 기획서의 대목이다)

12. Use plenty of contrast.
    다양한 변화를 줘라.
    : 목소리 톤이 단조로우면 서비스 쓰기 짜증난다. 운율과 강세를 적절히
      활용하도록 해라. 요컨대 TTS보다는 의욕있는 성우를 쓰는 게 좋다.
    (※역자주: TTS 지못미...)

13. Test it on real users.
    실제 사용자들을 대상으로 테스트하라.
 
    : 혹은, 그렇게 하는 것을 서비스 프로세스에 넣어 법제화시키란다.
    (※역자주: 그렇게 해서라도 지켜지기만 한다면야...)


Accessibility 접근성

14. Modify color.
    제공되는 음성의 특성을 잘 조절하라.
   
: 음성이나 음역, 즉 persona의 종류와 대사의 성격을 사용자의 나이 등을
      고려하여 선택하라.
    (※역자주: 슬슬 억지로 껴맞추기 시작하는 듯. 어쨋든 중요한 이야기
     임에는 틀림이 없다. 예전에도 말했듯이.)

15. Identify the language.
    사용자가 원하는 언어를 선택할 수 있게 해라.
    : “For Spanish, press 2…” 같은 식으로 선택권을 줘라.
    (※역자주: "For Korean, press 24..." )

16. Supplement navigational aids.
    네비게이션에 도움이 될 장치를 제공하라.
    : 효과음(earcon) 등을 잘 써라.
    (※역자주: 배경음도 경우에 따라선 매우, 매우 유용하다)

17. Define shortcuts.
    빠른 선택 방법을 제공하라.
    : 음성명령을 한꺼번에 말한다든가 하는 숨겨진 단축명령을 제공하라.
    (※역자주: 하지만 그걸 주문마냥 외우게 할 생각일랑 하지 마라)


Design 디자인 혹은 설계

18. Place important information “above the fold”.
    중요한 정보는 눈에.. 아니 귀에 띄이는 곳에 배치하라.
    : 중요한 정보를 경우에 따라서는 앞에 (예: 이체하기 전에 잔고 말해주기)
      혹은 뒤에 (예: "마감일은 5월 15일입니다") 두어라.
    (※역자주: GUI가 닥치고 좌상단인 것과 반대일 수 있다는 게 재미있다)

19. Reduce choices.
    선택할 항목 개수를 줄여라.
 
  : 항목이 많으면, 조금만 먼저 말하고 "다른 거?" 라는 링크를 주는 게
     좋을지 모른다.
    (※역자주: 난 잘 모르겠는데 -_-;; 어쨋든 VUI 에서의 이 문제는 magic
      number와 아무 상관이 없다는 게 재미있다. 개인적인 실험에 따르면
      VUI 사용자는 bubble sorting 밖에 못한다.)

20. Nix banners.
    관심 없는 광고나 법적고지문 읽지 마라.
    : 가능한 한 그러지 마라.
    (※역자주: 이게 가능하면 귀찮게 왜 넣었겠니. -_-;; )

21. Stay consistent.
    일관성을 유지하라.    
    : UI는 물론이고 persona와 사용자 profile을 포함한 UX 전반에 걸쳐
      일관적일 수 있도록 하라.
    (※역자주: 데쟈뷰? ㅎㅎ )


일단 목차는 매우 이상하게 구성되어 있고, 전혀 앞뒤나 논리는 없지만, 그래도 드물게도 무척 실무적이고 user-centric한 내용이라서 한번 번역해 봤다. (이걸 번역이라고 부를 수 있다면 말이지만;;;)

... 내가 만든 Voice UI Design Guideline은 먼지라도 벗었으려나... -_ㅜ;;; 자세한 이야기를 못 하고 남의 것이나 딴지 걸고 있으려니 이것도 참 답답한 노릇이다. 7개월 후에는 쓸 수 있겠지 뭐. ㅋㅋㅋ

신고
Posted by Stan1ey

GUI 위주의 UI를 하다가 Voice UI를 접하게 되면, 가장 친숙하게 다가오는 게 바로 persona라는 개념이다. VUI의 다른 측면들은 대부분 음성대화에 대한 분석과 조합에 대한 것이고, 입출력 기술의 제약조건과 그에 따르는 생소한 설계 지침이나 tip들은 아무래도 시각적인 것이 없어서 거리감이 느껴지게 마련이다.

그에 비해서 이 persona라는 것은 그 구축 방법에서부터 어떤 사람의 모습을 상정하기 때문에 뭔가 사진이라도 하나 띄워놓을 수 있고, 기존의 UI 디자인에서도 Persona 구축을 통한 사용자 상(像)의 공감대 형성이 하나의 방법론으로서 인기가 있기 때문에 언뜻 "아, 이건 아는 거야!" 라고 접근할 수 있는 거다. (상품기획이나 UI.. 혹은 다른 종류의 디자인을 위한 Persona 방법론은 Alan Cooper에 의해 주창되었지만, 그 내용에 대한 상세한 설명은 <The Persona Lifecycle>이라는 책에 더 잘 기술되어 있다.)

하지만 일반적인 UI 디자인에서 말하는 persona가 잠재적인 사용자의 대표상을 뜻하는 것과 완전히 반대로, VUI 디자인에서의 persona는 시스템의 '목소리'를 내는 시스템의 대표상을 뜻한다. VUI 식으로 말해서 persona 디자인은, 설계자가 서비스에 부여하고 싶은 사회적인 이미지 - 종종 선입견을 포함한 - 혹은 사용자들의 사용 맥락에 적합한 분위기 등을 고려해서 이루어진다. 동시에 사용자가 해당 서비스에 대해서 가지고 있는 이미지, 즉 mental model과의 차이를 되도록 줄이거나, 적절한 소개를 거쳐 보다 시스템 설계의 의도에 맞는 것으로 유도하는 것도 중요한 설계 요소의 하나이다. (VUI 디자인에서의 Persona에 대해서는 VUI에 대한 최초의 균형 잡힌 책인 <Voice User Interface Design>을 참조할 것)

Example of VUI Persona

Example of VUI Persona: by Michael Cohen (SpeechTEK, 2004)


재미있는 것은, 위 문단에서 "persona"라는 단어를 그냥 "UI"라고 바꾸면, 기존의 UI 디자인의 개념과 여러가지 측면이 중첩된다는 거다. 아마도 그런 이유 때문에 - 일단 기존 UI와 VUI에서 단어의 정의가 다르다는 걸 이해하고 나면 - VUI의 persona가 접근하기 쉬운 것이라고 생각한다. Persona 구축이 VUI에서 중요하기는 하지만, 전체적으로 볼 때 그것은 VUI에 대한 모호한 컨셉을 잡는 것에 불과하고 이를 구체화하는 실질적인 설계 작업은 여전히 뛰어넘어야 할 장벽이 있는 것은 유념해 둘 만하다.

참고로...
사용자 삽입 이미지
UI, 아니, HTI 업계에 처음으로 "persona"라는 단어를 소개한 것도 사실은 공감대 형성도구로서의 방법론으로서가 아니라, conver-sational agent 의 실험적 사례로서였다. 얼마전에 불평을 늘어놓았던 Microsoft Agent의 기원이 된 "Persona Project"가 그 주인공인데, 그건 뭐 담에 또 기가 뻗치면 한번 정리해봐야 겠다. 어쨌든 이제까지 UI/HTI에 세 번에 걸쳐 불어왔던 persona 개념은 그때 그때 다르긴 했지만, 그 각각의 개념들이 UI 디자인에 미친 영향은 이래저래 적지 않았던 것 같다.



오케이. 그럼 이제 본론으로 들어가자. (또냐!!!)

휴대폰에 들어간 음성 기능은 주로 음성인식에 대한 것이어서, 사용자에게는 '어디 있는지도 모르지만, 찾아도 눌릴지 안 눌릴지 모르는 버튼의 대용품' 정도로 다가왔다. VUI라든가 기계와의 대화라든가 하는 거창한 비전이 아닌 단순한(?) 음성입력 기능이었던 것이다. 그에 비해서 네비게이션은 구태의연한 버튼과 터치스크린 입력을 사용했지만, 음성합성(가장 기본적인 수준의) 중심으로 정보를 제공하기 때문에 사용자에게는 '끊임없이 말을 거는', 좀더 VUI의 모습에 가까운 모습으로 각인되어 왔다. 내 말을 알아듣는 기계보다, 뭔가 자신의 말을 하는 기계가 더 기특하고 인간다워 보이는 것일까.

우리나라의 네비게이션은 여기에 여러가지 목소리(남성/여성/아기/... 그리고 몇 명의 인기 연예인들)를 포함시키는 방식으로 VUI의 'persona'를 다양하게 반영시켰다. 대부분의 너무 개성이 강한 목소리에 쉽게 질리긴 했지만, 사람들은 각자 나름의 방식으로 그 변화무쌍한 수다쟁이를 좋아하고 있다.

앞에서 VUI 디자인에 있어서 persona를 구축하는 게 중요하다고 말했던 것과는 반대의 이야기다. 물론 "튜닝의 끝은 순정이다"는 말처럼 결국 많은 사용자들이 기본 음성을 사용하는 걸 보면, 그 기본 음성의 persona 만큼은 중요하다고 말할 수도 있겠다. 이랬다가 저랬다가... 정말 persona를 잘 구축하는 게 VUI에 있어서 중요할까? 아니면 그냥 여러가지 persona (=목소리)를 제공해서 선택하게 하는 게 좋은 방향일까?


유럽의 신생 업체에서, 기존 네비게이션에 자신의 (혹은 친구/가족/연인의) 목소리를 녹음해서 넣을 수 있는 서비스를 시작했다고 한다. 별도의 회사에서 이런 서비스를 한다는 사업 모델에 대해선 다소 의구심이 들지만, 뭐 어쨋든 흥미로운 시도인 것은 사실이다. 특히 자신의 목소리를 웹에서 녹음해서 누군가의 네비게이션으로 선물할 수 있다는 건데, 그런 친구나 가족의 목소리가 연예인의 목소리보다 더 듣기가 좋거나... 최소한 쉽게 질리지는 않을런지 모르겠다. 미국에서 본 네비게이션에도 2~3가지 목소리가 제공되고 있었지만 연예인 목소리 같은 건 없었는데, (헐리웃 스타의 몸값을 생각해보면 뭐 ㅡ_ㅡ;; ) 또 이런 식의 customization 방법을 제공하는 것도 나름 재미있다 싶다.

VUI 블로그에서는 이 서비스를 소개하면서, "Forget about Persona!"라고까지 하고 있다. 한편 일리있는 일갈이기는 하지만, 처음 말했듯이 persona가 GUI의 시각적 컨셉과 같은 위치에 있다면, 이 말은 곧 UI를 설계하는 데 있어서 상위의 개념적인 방향을 잡는 것은 오히려 사용자에게 맡기고, 사용자가 원하는 그 컨셉이 제대로 움직이도록 체계를 잡는 것만 남는다는 소리가 된다. 좀 억지스럽긴 하지만.

오랫동안 슬금슬금 바뀌고 있는 디자이너의 역할과 더불어서, 이런 서비스가 개시되었다는 것, 그리고 VUI에 열정을 가진 사람이 그 방향타를 놓는 거에 거부감을 가질 수 없게 되었다는 것이 VUI 뿐만 아니라 디지털 서비스 모든 분야에 걸친 일반적 의미의 UI 전체 흐름과도 무관하지 않은 것 같아 주절주절 적어 보았다.

신고
Posted by Stan1ey

BLOG main image
by Stan1ey

카테고리

분류 전체보기 (347)
HTI in General (45)
User eXperience (11)
Voice UI (50)
Vision UI (14)
Gesture UI (25)
Tangible UI (28)
Robot UI (14)
Public UI (9)
Virtuality & Fun (56)
Visual Language (15)
sCRAP (70)

글 보관함



www.flickr.com
This is a Flickr badge showing public photos and videos from Stan1ey. Make your own badge here.