몇년 전부터 MS와 Ford가 꾸준히 개발하고 있는 차량 운전자용 음성인식 시스템, SYNC의 시승기(?)이다. 리뷰의 내용은 음성인식의 인식성능에 초점을 맞추고 있어서 일반 영어발음과 한국식, 일본식 영어발음 -_- 도 인식이 된다는 것을 매우 긍정적으로 표현하고 있다. 그외에는 SYNC를 통해서 다른 사람과 전화를 한다든가, 다른 기능들을 나열하고 있는데, 솔직히 뭘 할 수 있는가에 대한 것은 내겐 좀 질린 이야기다. 그냥 스크랩하는 기분으로 최근에 올라온 동영상을 링크.
Voice UI 좀 하려고 했었던 -_- 입장에서 보면, 이 동영상에서 보여주는 VUI는 일반적인 VUI Design Guideline을 잘 따랐으나, 일부 부족한 부분이 있다. 동영상 중의 VUI 대화 사례를 보면 다음 몇가지 "좋은 설계"를 확인할 수 있다.
1. 시작할 때, 메뉴 상의 현재 위치를 알림(orientation)
- "Main Menu"
2. 사용자 발화를 반복해서 확인(echoing)
- "Audio System"
3. 인식정확률이 낮으면 재확인
- 사용자: "사토라이또 라지오!"
- 시스템: "Satellite Radio: is that correct?"
4. Sound Prompt의 일관된 사용
- (Ding!)
5. Navigation과 Function의 부드러운 연결
- 시스템: "USB. Please say your command."
- "Main Menu"
2. 사용자 발화를 반복해서 확인(echoing)
- "Audio System"
3. 인식정확률이 낮으면 재확인
- 사용자: "사토라이또 라지오!"
- 시스템: "Satellite Radio: is that correct?"
4. Sound Prompt의 일관된 사용
- (Ding!)
5. Navigation과 Function의 부드러운 연결
- 시스템: "USB. Please say your command."
하지만, 다음 몇가지 "나쁜 설계"는 조금 아쉽다. 뭔가 사정이 있었는지는 모르겠지만, 조금 더 수정했더라면 더 낫지 않았을까.
1. Navigation이 depth를 갖는다.
- "Main Menu" >> "Audio System" >> "User Device"
= 음성인식의 가장 큰 장점 (겸 단점) 중 하나가 depth 무시하고
바로 해당 기능으로 들어갈 수 있다는 것인데, 왜 주된 사용방식으로
3단계 씩이나 되는 위계구조를 넣었는지 모르겠다. 이제 기껏해야
수십개의 기능 명령을 가지고 인식률이 떨어질 고민을 하거나 그러는
시대는 지났을 텐데...
2. Echoing 원칙이 무시되는 경우가 있다.
- 사용자: "User Device"
- 시스템: "USB"
= 이러면 안 되지~! 이를테면 "User Device, is, USB" 라고 해야
사용자가 안 놀라고 계속 사용할 수 있을 거 아니냐고.
3. Sound Prompt와 Confirmation Earcon이 조금 유사하다.
- Sound Prompt: (Ding!)
- Confirmation Earcon: (Drring~)
= 뭐 충분한 비교실험을 거쳤겠지만, 그래도 소음이 많은 상황에서 너무
비슷한 음향을 사용한 거 아닐까?
4. Sound Prompt의 끄트머리가 살짝 길다.
= 저러다가 사용자 발화가 sound prompt 끄트머리를 밟을 수 있겠다.
- "Main Menu" >> "Audio System" >> "User Device"
= 음성인식의 가장 큰 장점 (겸 단점) 중 하나가 depth 무시하고
바로 해당 기능으로 들어갈 수 있다는 것인데, 왜 주된 사용방식으로
3단계 씩이나 되는 위계구조를 넣었는지 모르겠다. 이제 기껏해야
수십개의 기능 명령을 가지고 인식률이 떨어질 고민을 하거나 그러는
시대는 지났을 텐데...
2. Echoing 원칙이 무시되는 경우가 있다.
- 사용자: "User Device"
- 시스템: "USB"
= 이러면 안 되지~! 이를테면 "User Device, is, USB" 라고 해야
사용자가 안 놀라고 계속 사용할 수 있을 거 아니냐고.
3. Sound Prompt와 Confirmation Earcon이 조금 유사하다.
- Sound Prompt: (Ding!)
- Confirmation Earcon: (Drring~)
= 뭐 충분한 비교실험을 거쳤겠지만, 그래도 소음이 많은 상황에서 너무
비슷한 음향을 사용한 거 아닐까?
4. Sound Prompt의 끄트머리가 살짝 길다.
= 저러다가 사용자 발화가 sound prompt 끄트머리를 밟을 수 있겠다.
그냥... 요새 Voice UI를 물어오는 전화를 받고 있는데다가, 마침 동호회 게시판에 또 이런 게 뜨길래 한번 보면서 이것저것 되새김질 해 봤다. 이제 슬슬...ㅎㅎ
☞ 동호회 게시판 링크
☞ 원래 글 링크
리뷰의 말미에, "IT 강국인 우리나라에서 왜 이런 시스템을 개발해 내지 못했는가?" 라며 우리나라 기업의 창의성과 철학에 대한 아쉬움을 매우 강하게 내비치고 있는데, 참 이제 뭐라 할말도 없고 그냥 편안~하다.
반응형