Apple Shuffle 3G with VoiceOver
애플에서 새로운 (이제 3세대인 건가) 아이팟 셔플을 발표했다. 아이폰 3세대(3G말고 -_-;;; )가 나오네 맥미니 새 버전이 나오네 여느때처럼 루머와 새소식이 많은 가운데, iPod Shuffle 군은 소리소문없이 기습출시한 격이다. 이번 셔플은 저번 셔플에 있던 상하좌우+가운데의 5버튼 조작도 없고, 그냥 밋밋한 금속조각처럼 보인다. 게다가, 웹사이트에 가보면 있는 저 문장. VoiceOver... 설마, 내가 전에 아이팟에서의 음성인식에 대해서 언급했던 것이 셔플에서 구현된 건가! 용감하게도 화면을 아예 없애고 음성으로만? ㅎㄷㄷ

... 그럴리가 있나. ㅡ_ㅡa;;

웹페이지에 나와있는 내용을 보면, 이 기능은 기본적으로 전에 소개했던 iPod용의 VoiceOver 기능을 iPod nano가 아닌 shuffle에 적용한 것이다. 조작버튼이 모두 사라졌다고는 하지만, 사실 이어폰(역시 전에 언급했던 모델이다)에 달려있는 3개의 버튼들을 눌러서 음량(상단/하단)과 재생조작(중단 1~3번 누르기)을 지원하므로 기존의 shuffle과 기능적으로 큰 차이는 없는 셈이다.

하지만, 이번에 적용된 VoiceOver는 휴대용 기기에 맞게 조금 더 향상된 버전으로, Voice UI (라고 할 수도 있는 부분)가 적용되어 있어서 눈길을 끈다. 다음 동영상을 보면 편이 가장 빠른 설명이 되겠다.



요컨대 추가된 부분은 기존에 읽어주던 "노래 제목", "아티스트"를 재생버튼을 길게 누르면(long push라고 했던 조작방식이다 ㅎ) 읽어주는 것으로 바꾸고, 멘트가 끝날 때까지 버튼을 누르고 있으면 "재생목록", 그러니까 폴더를 읽어주다가 다시 버튼을 누르면 그 폴더의 음악을 재생해 주는 기능이 추가된 것이다. 기존의 셔플이 수백곡의 노래를 그냥 뒤로 뒤로 넘기면서 듣는 것이었던 것에 비해서, 최소한 몇가지로 분류해 놓은 재생목록 중 하나를 선택해서 들을 수 있는 선택권이 주어진 것이다. 그럼에도 그 목록에 있는 음악을 순서대로 들을지 임의의 순서로 들을지는 본체(..무지 작지만)에 붙어있는 스위치를 사용해야 하지만.

기대했던 음성인식이 아닌 것은 아쉽지만, 그래도 음성매체의 특징 - 일단 말하고 알아듣는 데에 시간이 걸린다 - 을 나름대로 활용해서 언제 버튼을 누르고 떼느냐를 가지고 추가적인 기능을 구현했고, 그 방식도 설명만큼 복잡해 보이지는 않는다는 점은 좋은 VUI 사례라고 생각한다.

Apple Shuffle 3G with VoiceOverApple Shuffle 3G with VoiceOver (Double Press)
Apple Shuffle 3G with VoiceOverApple Shuffle 3G with VoiceOver (Long Push)

사실 저 이어폰에는 마이크가 달려있어서, 전에도 말했지만 아이팟 나노에서는 음성녹음에 활용하고 있었다. 혹시나, 추후에 펌웨어 업그레이드를 통해서 음성인식을 지원하지는 않을까? 흠... 가능성이 없진 않겠지만, 임의의 곡명/가수명/재생목록명을 인식하는 음성인식기라면 VoiceOver의 특징 - PC에서 전처리를 다 해서 DB를 만들어 넣어준다 - 을 감안하더라도 할 일이 많아 보인다. 만일 그런 준비를 하고 있다면 1년쯤 후에, 모든 Mac를 포함한 모든 제품군에 동시에 우르르 깜짝 적용하게 되지 않을까. 일단 지금은, 웹사이트 한 구석에 "이어폰에 달린 마이크는 아이팟 셔플에서 지원하지 않습니다"라고 섭섭하게도 분명하게 나와있다.

그렇게 되면 VUI를 좀 제대로 적용한 사례가 나와준다면 더 바랄 게 없겠고. (솔직히 MS Windows 기반으로 나와있는 음성인식 제품들은 기술데모용인지 상용인지 구분이 안 된다... -_-a;;;)



조금 딴 소리지만, 저 위의 동영상의 관련 동영상을 보면 벌써 패러디 동영상이 여럿 올라오고 있다. 혹시나 음성 입출력의 약점을 꼬집었나 해서 걱정스레 들여다보니, 동영상 중간에 나오는 Mac OS와 Windows의 음성차이를 데모하는 장면에 이런저런 장난을 쳐놓은 것이다. 사실 자세히 알아보면 Windows 버전의 iTunes에 사용된 음성합성DB는 바로 이전버전의 Mac OS 버전에 사용된 것과 같기 때문에 목소리가 좋은 것은 가장 최신의 Mac OS에만 해당하는데, Apple vs MS라는 구도가 나타나자마자 사람들은 또 그쪽으로 열광적인 반응을 보이고 있나보다.
신고
Posted by Stan1ey
얼마전 Apple이 iPod nano의 4세대 모델과 touch의 2세대 모델, iTunes 8 등을 발표했다. 황당한 부고기사까지 나돌았던 스티브 잡스는 그 기사를 농담꺼리로 삼으며 재치있게 발표를 시작했지만, 지난 일년간 부쩍 노쇠해진 모습은 여전히 안타깝다.

이번에 발표된 제품군들은 비록 몇건의 사전누설 '루머'로 좀 김이 빠지긴 했지만, 애플의 엔지니어링 철학이라고 생각되는 "we are selling software, in a beautiful box"에 그야말로 부합되는 내용이었다고 생각한다. 유출된 내용들은 대부분 그 껍데기의 모양이 어떻다는 것에 대해서 였지만, 발표 내용은 주로 새로운 기능에 대한 것이었고, 그에 대해서는 여전히 놀라운 새로운 경험 일색이었으니까 말이다.



그런데, 며칠 늦게서야 키노트 연설 발표를 모두 들을 수 있는 시간이 생겨서 한번 쭉~ 틀어보던 중에 조금 석연치 않은 부분이 눈에 띄었다. iTunes 8에서 앞으로 HD 방송을 볼 수 있다는 이야기를 하고 나서다.

New Features in iTunes 8, including Accessibility

iTunes의 새로운 4가지 특징들을 소개하면서, 앞서 소개한 HD 컨텐트 외에 접근성 Accessibility 이 개선되었으며, 새로운 브라우징 방식이 도입되었고, "Genius"라는 새로운 음악추천 기능이 포함되었음을 소개하고 있다. 그리고 나서 잡스는 접근성에 대해서 간단히 몇마디 언급한 다음, "그럼 다른 2개의 기능에 대해서 자세히 봅시다" 라고 하고 훌쩍 넘어가 버린다. 왜 (최소한 나에게는 괜시리) 중요한 접근성만 그냥 얼렁뚱땅 넘어가는 건데, 잡스옹! ㅡ_ㅡ;;;

흠... 뭔가 미심쩍다. 애플이 이제까지 Mac OS X에서 장애인을 위한 접근성 옵션을 위해서 그렇게 노력한 걸 생각하면 그냥 그렇게 어물쩍 넘어갈 것 같지 않은데, 게다가 발표 뒷부분으로 가면 iPod 제품이 환경에 미치는 영향에 대해서도 그렇게 강조하고 있으면서 말이다. 그래서 웹사이트를 뒤져서 관련 정보를 좀 알아봤다.

Website on the New Features of iTunes 8
우선, Mac OS X에는 MS Windows XP/Vista와 마찬가지로 음성합성 엔진이 내장되어 있다. 기본적으로는 영어 뿐이지만, 그래도 시각장애를 가지고 있는 사람이라면 이 기능을 이용해서 OS의 다양한 기능들을 이용하거나, 웹사이트를 읽어주는 screen reader 소프트웨어로 인터넷을 돌아다닐 수 있는 것이다. iTunes에서는 8 버전부터 내장된 iTunes Music Store(ITMS)와 음악 리스트에서도 screen reader를 지원한다고 한다. iTunes의 기본 기능들 자체는 이미 Mac OS X의 "VoiceOver" 기능으로 지원하고 있었겠지만, 사실 그것만으로는 음악 컨텐트 관리 프로그램으로서의 의미가 없었던 셈이다. 그런데 이번에 실질적인 컨텐트 수준에서도 음성을 지원함으로써 '다른 누구보다도 청각적 니즈가 절실한' 시각장애인들에게 iTunes와 iPod의 편리함이 '접근 가능하게'  됐다.

그런데, 사실은 웹사이트를 더 뒤적이다 보니, 이외에도 더 추가된, 심지어 발표에서는 언급조차 되지 않은 기능이 iPod의 접근성을 향상시키고 있었다. iPod를 사용할 때 메뉴나 곡명 등을 음성으로 읽어주는 "spoken menu" 기능이 이번부터 새로 옵션으로 들어간 것이다. 메뉴나 다른 정보를 음성으로 읽어주는 MP3 Player가 기존에 없었던 것은 아니지만 내장형 embedded 음성합성기를 이용했거나, 녹음된 메뉴이름(만)을 지원했거나, 혹은 그냥 번들로 제공되는 PC용 음성합성기가 MP3 파일을 만들어 줘서 그걸 플레이어에 다운로드 받을 수 있다는 정도였다. (앞의 사례들은 기억이 확실치 않다...) 그에 비해서, 이번에 애플에서 지원하는 방식은 조금 특이한 구성을 가지고 있다.

Spoken Menu - New Feature on iTunes 8 and iPod nano
이 기능은 새로운 4세대 iPod nano를 iTunes 8에 연결시켰을 때 사용할 수 있으며, 왼쪽 그림과 같이 연결화면에서 아래의 4번째 옵션(고해상도 이미지가 없다... 그만큼 관심들이 없는 듯 -_ㅜ )을 보면 "Enable spoken menus for accessibility"라는 항목을 체크할 수 있고, 이를 체크함으로써 iPod에 들어있는 메뉴와 곡명에 해당하는 음성파일을 PC에서 합성(이때 MS Windows에서도 Mac OS X에서도 기본 제공되는 음성합성엔진 형식을 사용하게 된다!)해서 iPod에 다운로드하게 되는 것이다. 이에 따라서 iPod의 용량이 다소 줄어들게 되고 (각 곡명이나 아티스트에 대한 것일테니 그다지 크진 않겠다) 음성합성과 추가된 음성파일의 다운로드를 위해서 Sync 시간은 좀더 늘어나게 된다.

이렇게 iPod + iTunes라는 시스템을 이용해서, 그것도 시스템 기본사양인 음성인식엔진을 활용함으로써 합성음의 품질도 보장할 수 있는 방식으로 제공된다는 것은 Voice UI 입장에서 무척 고무적인 일이다. 비록 많이 향상되었다고 하지만 음성합성을 위한 DB의 용량이 곧 합성음의 품질에 영향을 미치는 것을 생각해 보면 (많이 주관적인 기준이 되겠지만, '듣기 좋은 소리'로 그럭저럭 용납되기 위해서는 압축과 최적화를 거친다고 해도 1GB 이상이 필요하다고 보면 된다) embedded 버전의 음성합성은 아무래도 DB 용량과 이를 관리하기 위한 CPU의 효율성에 있어서 한계가 있다. 하지만 PC에 설치되어 있는 비교적 고사양의 음성합성기를 사용함으로써 (이것마저 충분히 듣기좋은 소리인지는 잘 모르겠고, 무엇보다 고유명사와 은어가 난무하는 음악의 곡명 등에 최적화되기는 불가능하지만;; ) 좋은 음성을 서비스할 수 있게 된 것이다.

애플은 왜 이런 접근성에서의 큰 향상을 이루어 놓고서는, 그렇게 대충 발표하고 넘어간 것일까? iPod touch나 classic에는 못 넣고 nano에만 넣은 게 미안해서? 발표를 듣는 사람들이 대부분 눈이 잘 보이는 일반적인 프로그래머들이어서? 아니 아무리 그래도 이 정도 노력을 기울였다면 "주머니에 넣고도 조작할 수 있습니다!" 라는 핑계를 대서라도 대서특필 했어야지! ㅡ_ㅡ=3 응?



가만 ... 그러고보니, 한가지가 더 마음에 걸리기 시작한다. 이번에 함께 발표된 iPod의 기능 중 하나로 'Voice Recorder'를 넣었다. 사실 뭐 대단할 것도 없는 기능이고, 기존에도 마이크와 함께 파는 3rd party software를 사면 사용할 수 있었던 기능이다. 물론 기존의 iPod에는 마이크가 없었기 때문에, 이번에 함께 발표된 이어폰 2종류는 볼륨조절, 재생, 멈춤, 앞뒤이동 기능이 달린 컨트롤러 뒷면에 마이크가 포함되어 있는 채로 출시되었다.

Headphone with microphone ... for nano?Voice Recorder on Mic-less iPod nano 4G

애플이 마이크라는 하드웨어 단가상승을 감수하고 넣은 게 기껏 음성을 녹음할 수 있는 기능이라고? 그 이어폰을 '우연히' 음성입력이 별 필요없고 분명히 니즈도 크지 않은 iPod nano와 함께 발표했다고? 그나마 음성인식기능은 기본 탑재되어 있고 마이크 달린 이어폰은 돈 주고 사야 돼? 애플이 이렇게 생뚱맞은 기능이 추가되는 그런 기획을 하는 회사였던가?

그럴리가 없다... 뭔가 있어... -_-+ ☜ 애플빠돌이 ㅋㅋ

물론 간단히 생각할 수 있는 것은, 헤드폰과 iPhone과의 관련성이다. 이번 발표는 주로 iPod 위주였고, 따라서 iPhone의 핸즈프리 hands-free set 로도 사용할 수 있다고 굳이 언급하지 않았을 뿐이라고 생각할 수 있겠다. 물론 사실 그도 그렇겠고 나름대로 기대되는 조합이지만, 왜 하필 nano와 함께 발표하게 된 걸까?



순전히 나의 개인적인 기대일수도 있지만, 어쩌면 조만간 iPod nano는 주머니 속에 넣은 채로, 음성인식을 통해서 조작되게 되지 않을까 싶다. 혹시나 싶어서 특허를 뒤져보니 음성인식과 음악감상을 연결시킨 것은 사실 찾아볼 수 없었다. (단지 위의 음성메뉴 기능은 2003년에 출원했다가 아직 등록이 안 되고 있다;; ) 그냥 죽은 VUI XX 만지기가 될지도 모르겠지만, 그래도 이번에 발표된 내용에 숨어있는 이야기를 조합해 보면, 다음 애플의 주요 발표에 과연 어떤 것이 들어갈지, 혹은 최소한 App Store를 통해서 출시될 제품들이 이 마이크를 이용해서 어떤 짓을 할지가 무척이나 기대된다. 특히 일전에 iPhone에 음성인식기를 넣은 사람들, 모든 iPod에 적용되는 표준화된 마이크를 보고 얼마나 눈을 반짝이고 있을지는 익히 상상이 된달까. ㅎㅎ


... ㅠ_ㅠ (註: 피눈물)
신고
Posted by Stan1ey

BLOG main image
by Stan1ey

카테고리

분류 전체보기 (347)
HTI in General (45)
User eXperience (11)
Voice UI (50)
Vision UI (14)
Gesture UI (25)
Tangible UI (28)
Robot UI (14)
Public UI (9)
Virtuality & Fun (56)
Visual Language (15)
sCRAP (70)

글 보관함



www.flickr.com
This is a Flickr badge showing public photos and videos from Stan1ey. Make your own badge here.