본문 바로가기
Voice UI

iPod Accessibility and Voice UI - a Home-made Rumor

by Stan1ey 2008. 9. 16.
얼마전 Apple이 iPod nano의 4세대 모델과 touch의 2세대 모델, iTunes 8 등을 발표했다. 황당한 부고기사까지 나돌았던 스티브 잡스는 그 기사를 농담꺼리로 삼으며 재치있게 발표를 시작했지만, 지난 일년간 부쩍 노쇠해진 모습은 여전히 안타깝다.

이번에 발표된 제품군들은 비록 몇건의 사전누설 '루머'로 좀 김이 빠지긴 했지만, 애플의 엔지니어링 철학이라고 생각되는 "we are selling software, in a beautiful box"에 그야말로 부합되는 내용이었다고 생각한다. 유출된 내용들은 대부분 그 껍데기의 모양이 어떻다는 것에 대해서 였지만, 발표 내용은 주로 새로운 기능에 대한 것이었고, 그에 대해서는 여전히 놀라운 새로운 경험 일색이었으니까 말이다.



그런데, 며칠 늦게서야 키노트 연설 발표를 모두 들을 수 있는 시간이 생겨서 한번 쭉~ 틀어보던 중에 조금 석연치 않은 부분이 눈에 띄었다. iTunes 8에서 앞으로 HD 방송을 볼 수 있다는 이야기를 하고 나서다.

New Features in iTunes 8, including Accessibility

iTunes의 새로운 4가지 특징들을 소개하면서, 앞서 소개한 HD 컨텐트 외에 접근성 Accessibility 이 개선되었으며, 새로운 브라우징 방식이 도입되었고, "Genius"라는 새로운 음악추천 기능이 포함되었음을 소개하고 있다. 그리고 나서 잡스는 접근성에 대해서 간단히 몇마디 언급한 다음, "그럼 다른 2개의 기능에 대해서 자세히 봅시다" 라고 하고 훌쩍 넘어가 버린다. 왜 (최소한 나에게는 괜시리) 중요한 접근성만 그냥 얼렁뚱땅 넘어가는 건데, 잡스옹! ㅡ_ㅡ;;;

흠... 뭔가 미심쩍다. 애플이 이제까지 Mac OS X에서 장애인을 위한 접근성 옵션을 위해서 그렇게 노력한 걸 생각하면 그냥 그렇게 어물쩍 넘어갈 것 같지 않은데, 게다가 발표 뒷부분으로 가면 iPod 제품이 환경에 미치는 영향에 대해서도 그렇게 강조하고 있으면서 말이다. 그래서 웹사이트를 뒤져서 관련 정보를 좀 알아봤다.

Website on the New Features of iTunes 8
우선, Mac OS X에는 MS Windows XP/Vista와 마찬가지로 음성합성 엔진이 내장되어 있다. 기본적으로는 영어 뿐이지만, 그래도 시각장애를 가지고 있는 사람이라면 이 기능을 이용해서 OS의 다양한 기능들을 이용하거나, 웹사이트를 읽어주는 screen reader 소프트웨어로 인터넷을 돌아다닐 수 있는 것이다. iTunes에서는 8 버전부터 내장된 iTunes Music Store(ITMS)와 음악 리스트에서도 screen reader를 지원한다고 한다. iTunes의 기본 기능들 자체는 이미 Mac OS X의 "VoiceOver" 기능으로 지원하고 있었겠지만, 사실 그것만으로는 음악 컨텐트 관리 프로그램으로서의 의미가 없었던 셈이다. 그런데 이번에 실질적인 컨텐트 수준에서도 음성을 지원함으로써 '다른 누구보다도 청각적 니즈가 절실한' 시각장애인들에게 iTunes와 iPod의 편리함이 '접근 가능하게'  됐다.

그런데, 사실은 웹사이트를 더 뒤적이다 보니, 이외에도 더 추가된, 심지어 발표에서는 언급조차 되지 않은 기능이 iPod의 접근성을 향상시키고 있었다. iPod를 사용할 때 메뉴나 곡명 등을 음성으로 읽어주는 "spoken menu" 기능이 이번부터 새로 옵션으로 들어간 것이다. 메뉴나 다른 정보를 음성으로 읽어주는 MP3 Player가 기존에 없었던 것은 아니지만 내장형 embedded 음성합성기를 이용했거나, 녹음된 메뉴이름(만)을 지원했거나, 혹은 그냥 번들로 제공되는 PC용 음성합성기가 MP3 파일을 만들어 줘서 그걸 플레이어에 다운로드 받을 수 있다는 정도였다. (앞의 사례들은 기억이 확실치 않다...) 그에 비해서, 이번에 애플에서 지원하는 방식은 조금 특이한 구성을 가지고 있다.

Spoken Menu - New Feature on iTunes 8 and iPod nano
이 기능은 새로운 4세대 iPod nano를 iTunes 8에 연결시켰을 때 사용할 수 있으며, 왼쪽 그림과 같이 연결화면에서 아래의 4번째 옵션(고해상도 이미지가 없다... 그만큼 관심들이 없는 듯 -_ㅜ )을 보면 "Enable spoken menus for accessibility"라는 항목을 체크할 수 있고, 이를 체크함으로써 iPod에 들어있는 메뉴와 곡명에 해당하는 음성파일을 PC에서 합성(이때 MS Windows에서도 Mac OS X에서도 기본 제공되는 음성합성엔진 형식을 사용하게 된다!)해서 iPod에 다운로드하게 되는 것이다. 이에 따라서 iPod의 용량이 다소 줄어들게 되고 (각 곡명이나 아티스트에 대한 것일테니 그다지 크진 않겠다) 음성합성과 추가된 음성파일의 다운로드를 위해서 Sync 시간은 좀더 늘어나게 된다.

이렇게 iPod + iTunes라는 시스템을 이용해서, 그것도 시스템 기본사양인 음성인식엔진을 활용함으로써 합성음의 품질도 보장할 수 있는 방식으로 제공된다는 것은 Voice UI 입장에서 무척 고무적인 일이다. 비록 많이 향상되었다고 하지만 음성합성을 위한 DB의 용량이 곧 합성음의 품질에 영향을 미치는 것을 생각해 보면 (많이 주관적인 기준이 되겠지만, '듣기 좋은 소리'로 그럭저럭 용납되기 위해서는 압축과 최적화를 거친다고 해도 1GB 이상이 필요하다고 보면 된다) embedded 버전의 음성합성은 아무래도 DB 용량과 이를 관리하기 위한 CPU의 효율성에 있어서 한계가 있다. 하지만 PC에 설치되어 있는 비교적 고사양의 음성합성기를 사용함으로써 (이것마저 충분히 듣기좋은 소리인지는 잘 모르겠고, 무엇보다 고유명사와 은어가 난무하는 음악의 곡명 등에 최적화되기는 불가능하지만;; ) 좋은 음성을 서비스할 수 있게 된 것이다.

애플은 왜 이런 접근성에서의 큰 향상을 이루어 놓고서는, 그렇게 대충 발표하고 넘어간 것일까? iPod touch나 classic에는 못 넣고 nano에만 넣은 게 미안해서? 발표를 듣는 사람들이 대부분 눈이 잘 보이는 일반적인 프로그래머들이어서? 아니 아무리 그래도 이 정도 노력을 기울였다면 "주머니에 넣고도 조작할 수 있습니다!" 라는 핑계를 대서라도 대서특필 했어야지! ㅡ_ㅡ=3 응?



가만 ... 그러고보니, 한가지가 더 마음에 걸리기 시작한다. 이번에 함께 발표된 iPod의 기능 중 하나로 'Voice Recorder'를 넣었다. 사실 뭐 대단할 것도 없는 기능이고, 기존에도 마이크와 함께 파는 3rd party software를 사면 사용할 수 있었던 기능이다. 물론 기존의 iPod에는 마이크가 없었기 때문에, 이번에 함께 발표된 이어폰 2종류는 볼륨조절, 재생, 멈춤, 앞뒤이동 기능이 달린 컨트롤러 뒷면에 마이크가 포함되어 있는 채로 출시되었다.

Headphone with microphone ... for nano? Voice Recorder on Mic-less iPod nano 4G

애플이 마이크라는 하드웨어 단가상승을 감수하고 넣은 게 기껏 음성을 녹음할 수 있는 기능이라고? 그 이어폰을 '우연히' 음성입력이 별 필요없고 분명히 니즈도 크지 않은 iPod nano와 함께 발표했다고? 그나마 음성인식기능은 기본 탑재되어 있고 마이크 달린 이어폰은 돈 주고 사야 돼? 애플이 이렇게 생뚱맞은 기능이 추가되는 그런 기획을 하는 회사였던가?

그럴리가 없다... 뭔가 있어... -_-+ ☜ 애플빠돌이 ㅋㅋ

물론 간단히 생각할 수 있는 것은, 헤드폰과 iPhone과의 관련성이다. 이번 발표는 주로 iPod 위주였고, 따라서 iPhone의 핸즈프리 hands-free set 로도 사용할 수 있다고 굳이 언급하지 않았을 뿐이라고 생각할 수 있겠다. 물론 사실 그도 그렇겠고 나름대로 기대되는 조합이지만, 왜 하필 nano와 함께 발표하게 된 걸까?



순전히 나의 개인적인 기대일수도 있지만, 어쩌면 조만간 iPod nano는 주머니 속에 넣은 채로, 음성인식을 통해서 조작되게 되지 않을까 싶다. 혹시나 싶어서 특허를 뒤져보니 음성인식과 음악감상을 연결시킨 것은 사실 찾아볼 수 없었다. (단지 위의 음성메뉴 기능은 2003년에 출원했다가 아직 등록이 안 되고 있다;; ) 그냥 죽은 VUI XX 만지기가 될지도 모르겠지만, 그래도 이번에 발표된 내용에 숨어있는 이야기를 조합해 보면, 다음 애플의 주요 발표에 과연 어떤 것이 들어갈지, 혹은 최소한 App Store를 통해서 출시될 제품들이 이 마이크를 이용해서 어떤 짓을 할지가 무척이나 기대된다. 특히 일전에 iPhone에 음성인식기를 넣은 사람들, 모든 iPod에 적용되는 표준화된 마이크를 보고 얼마나 눈을 반짝이고 있을지는 익히 상상이 된달까. ㅎㅎ


... ㅠ_ㅠ (註: 피눈물)
반응형