아이폰 앱으로 트위터를 들여다보다가, 한켠의 광고가 눈길을 끌었다.

Hate Speling? - from Google Voice Search

많은 단점에도 불구하고 Voice UI의 장점으로 이야기할 수 있는게 몇가지 있는데, 거기에 철자를 몰라도 된다는 점도 추가해야 할 듯. 요새 인터넷에 올라오는 글들을 보면 우리말도 철자가 변용이 점점 다양해지는 것 같은데, 어쩌면 그게 음성인식 UI를 채용해야 하는 당위성을 좀더 높여주지는 않을까.

... 안 될꺼야 아마. -.-



어쨋든, 그냥 스크랩이나 해두려고 굳이 캡춰해서 애니메이션으로 만들어 봤다. :P

신고
Posted by Stan1ey

결국 스티브 잡스 없이 진행된 WWDC 기조연설에서, iPhone의 다음 하드웨어 플랫폼인 iPhone 3G-S가 발표됐다.

iPhone 3GS
대체로 이미 iPhone OS 3.0가 등록된 개발자들에게 배포되면서 공개 및 유출되었던 내용과, 거기에서 일전의 블로그 글에서 예상했던 내용에서 크게 벗어나지는 않은 것 같다.

특히 관심을 갖고 있던 자동초점, 전자나침반, 음성조작 기능에 대한 대목과, 발표 직후의 리뷰들을 종합해 보면 다음과 같다.


(1) Auto-Focus Camera
iPhone 3GS - Autofocus Camera
발표에서 가장 박수를 받은 부분은 화면에서 특정 부분을 터치하면 그 부분에 초점이 잡히는 기능이었지만, 사실 이 기능은 이미 2005년에 Sony DSC N1에서 이미 구현되어 당시 카메라에 터치스크린을 넣어볼까 하던 사람들을 안타깝게(?) 했던 내용이므로 통과. 내가 기대했던 액체렌즈 부분은 아직도 그 적용 여부가 파악이 안 되는데, 그 정도 기술을 썼다면 분명 거대하게 떠들었을 법 한데 전혀 언급이 없다. 하지만 또 소프트웨어만으로 초점을 맞춘다는 건 이해하기 힘들고, 게다가 동영상에서 초점을 맞추는 장면을 보면 연속적으로 움직이고 있으니 뭔가 광학적 모듈이 들어갔다는 생각에는 변함이 없다. 뭐 1~2주 후에 판매가 되면 누군가 바로 -_- 뜯어볼테고, 그때는 분명하게 알 수 있을 거다.


(2) Magnetometer
iPhone 3GS - Digital Compass
이전에 우려했던 내용이 맞아떨어진 모양이다. 발표 중에는 언급되지 않았지만, 그 직후에 직접 사용해본 사람이 올린 기사에 의하면 나침반 기능을 사용하기 전에 아이폰을 붙잡고 손목을 8자 모양으로 돌려서 초기화해야 한다고 한다. 손목을 8자로 돌리라니 모 회사의 "수평으로 잡고 상하좌우로 한바퀴씩 돌리세요"보다 훨씬 애플다운 UI라는 생각은 들지만, 여전히 장소를 옮길 때마다 (자기환경도 변하므로) 초기화는 필요할테니 홍보되고 있는 내용보다는 불편한 기능인 셈이다.

(다음 날 추가) 관련된 내용이 애플 웹사이트에도 올라왔다. "처음 사용할 때 이 calibration 동작을 수행하고, 그 이후에도 종종 해야 합니다. 다시 calibration을 할 필요가 있을 때마다 알려드립니다. ... 또한 자성을 가진 물체로부터 멀리 떨어지라는 안내가 나올 수도 있습니다." ... 흠, 사실 센서신호의 변동폭을 보면 다시 초기화를 해야 할지 안 해도 될지를, 초기화 데이터의 상대적인 차이를 보면 지자기에 의한 건지 지나치게 강력한 다른 자석에 의한 영향인지를 알 수 있겠구나. 과연 애플, 늘 한번 더 생각한 티를 내주신단 말이지. 하나 배웠다. 확실히 HTI는 먼저 해보는 놈을 따를 재간이 없는 듯.

(다시 일주일 뒤 추가) 관련 스크린샷이 올라온 걸 발견. 휴가에서 돌아오자마자 이것부터 업로드하고 있다. -_-a;; 어떻게 돌리느냐에 따라서 감도가 달라질텐데, 그에 대한 상세한 설명은 없다. 왠지 스샷으로만 보기엔 이 '초기화' 동작을 수시로... 심지어 경우에 따라선 제대로 북쪽을 보려면 자리를 옮겨가면서 몇번이나 하고 있어야 할 것 같은 느낌이다. 조금 일렀던 거 아닐까... 어쩌면 센서를 두 개 사용하거나 그냥 여러 방향으로 초기화체조 -_- 를 함으로써, 국지적인 자기장을 제외하는 기술 같은게 나올 수도 있겠다.

Initializing Compass on iPhone 3G S



(3) Voice Control

iPhone 3GS - Voice Control
그렇게 바라던 Voice Control은 역시 음성인식을 이용한 조작이고, 예상한 대로 이어폰 버튼(or 홈 버튼)을 길게 누르는 것으로 시작하고 있다. 실망스러운 것은 그 기능이 전화걸기와 음악재생에 머무르고 있어서 결국 기존에 다른 VUI 어플리케이션에서 제시했던 것 이상의 모습은 보여주지 못한다는 거다. 아니 구글의 자연어 검색을 생각하면 오히려 그 이하의 단순적용이라고도 할 수 있겠다. "Play more songs like this." 같은 멋져보이는 음성명령도 소개하고 있지만, 자연어 인식이라든가 하는 게 아니라 그냥 몇가지 문장을 추가해 둔 것 같다. 모처럼 OS 수준에서 접근한 것치고는 조금 실망이랄까.

VUI 관점에서 iPhone 3G-S의 음성입력(Voice Control) 및 음성출력(VoiceOver)을 보자면, 오래 누르기를 통해서 음성모드로 들어가는 점이나 음성명령을 반복(echoing)함으로써 자연스럽게 명령이 제대로 입력되었는지 확인하고 취소할 시간 여유를 주는 점 등은 가장 전형적인 방법이라고 할 수 있다. 오히려 사용 가능한 음성명령을 재미없는 "명령어 예시 목록" 같은 것으로 나타내지 않고 둥둥 떠다니는 키워드들로 표현한 것이 신선한 정도였다. 반면에 음성인식 중에는 분명히 오류가 발생할 수 있을텐데, 그런 경우를 대비해서 인식결과의 대안을 제시하지 않는다는 부분은 조금 불안한 대목이다. 개인적으로 관심이 가는 것은 역시 VUI의 설계에 대한 부분으로, 무려 32개 언어로 만들어진 유도문(prompt)이 어떻게 각 언어의 특징에 맞게 쓰여졌을까 하는 부분이다. 특히 우리 말로 "Dial 010-2345-6789"같은 내용을 작성하라고 하면 아무래도 자연스럽게 되지 않았기 때문이다. 어떤 식으로 나오든 앞으로는 그게 각 언어의 기능별 조작명령의 표준이 될텐데...

개인적으로 기대는 많이 했지만, 결국 일반적인 음성명령의 적용에 그쳐서 솔직히 실망이다. 물론 이 정도 파급력을 가진 기기의 가장 주요한 기능에 음성UI가 들어간 거고, 무엇보다 다른 어플리케이션으로의 파급력까지 생각한다면 아직 실망은 이르겠지만서도.



결국 한국에 아이폰이 출시되느냐 하는 점은 아쉽게 됐지만, 그래도 재미있어 보이는 기능들이 몇가지나 들어갔으니 몇달간 아이폰을 둘러싼 소식이 끊이지 않을 예정이다. 거기에나 기대해 보자. *_*

신고
Posted by Stan1ey
제대로 된 미래예측은 너무나 뻔해 보이기 마련이고, 사실 현업에 대해서 조금 알아가다 보면 그 예측을 들었을 때의 반응도 대충 판에 박히기 마련이다. 휴대폰의 미래에 대해서 "전화+인터넷"이라고 하고 있는 아래 David Pogue (꽤 '인기있는' NY Times의 컬럼리스트)의 강연 동영상이 올라왔다. 늘 그렇듯이 사례는 많고 웃기기는 하지만 논리도 방향도 부족한 내용. 그래도 최소한 그 큰 방향이 틀리지는 않은 듯 하고, 무엇보다 예전에 언급했던 휴대폰 연동 음성 서비스들과 얼마전에 올린 Google Voice의 전신이라고 할 수 있는 Google Grand Central에 대해서 언급이 되길래 스크랩해 두기로 했다.



현업에서 (그 쪽의 현업에서) 멀어지다보니 아무래도 부정적인 이야기를 적게 듣게 되고, 그래선지 오히려 Voice UI에 대한 확신이 점점 더 강해지는 것 같다. 특히 영어권에서는 착착 진도가 나가고 있으니까, 우리말은 인식엔진만 터져주면 어플리케이션 쪽은 금방 따라잡게 되지 않을까? 문제는 우리말에 맞는 VUI 설계기준을 확립하고, 영어에 맞춰진 컨텐트를 우리말에 맞춰 바꿔서 사용자 대중들이 그 방식에 익숙해질 때까지 추진할 방법이 있느냐는 거겠다. 굿럭! :)
신고
Posted by Stan1ey

Google Voice

2009.03.20 22:25
Google Voice

얼마 전에 Google Voice라는, 무시무시한 이름(개인적인 느낌 ;ㅁ; )의 서비스가 소리소문없이 서비스를 개시했다. 뭐 사실 그동안에도 Google 411같은 전화망 대응 서비스도 있었고 iPhone 어플로 음성검색 기능을 넣기도 했지만, 우주정복을 꿈꾸는 구글의 Google Voice라는 서비스라니!!! z(T^T)s

이 서비스는 전화 사용자를 온라인과 연결시켜 주는 걸 목표로 하는 것 같은데, 사실은 우리나라에서는 벌써 각 통신사 웹사이트(및 고객센터나 연결된 700 서비스 등등)를 통해서 가능했던 벨소리 기능, 문자 관리 기능, 스팸 차단 기능, 114(411) 문의 기능 등등을 웹사이트에 통합해 놓은 것이다. 요컨대 우리나라 전화망의 사업구조라면 꽤 짭짤한 대목이기 때문에, 구글에게 내어줄 일이 없는 채널을 차지하겠다는 거다.

아직은 일부 휴대폰(안드로이드 폰과 몇 모델이 더 있는 듯?)에 대해서만 가능하다고 하는데, 이게 앞으로 얼마나 더 파급이 될런지는 잘 모르겠다. 아무래도 개인적인 내용들이다보니 다른 구글 검색과 연동되기도 어려워 보이고...

Google Voice: Features

그럼에도 불구하고 이 서비스에서 눈에 띄는 부분은, 음성사서함에 녹음된 내용을 웹에서 조회할 수 있게 해주면서 무려 음성인식 transcript 를 제공한다는 거다! 10년전쯤에 음성기술을 웹에 연결시키면서 "음성게시판"이라는 것을 구현하는 팀과 일해본 적이 있는데, 음성게시판의 황당한 점은 웹에 게시물 목록이 나오지만 게시시간과 게시자 외에는 도대체 그 내용을 짐작할 수 있는 방법이 없다는 거였다. 녹음시간은 지나치게 짧아서 다 똑같았고, 휴대폰으로부터 위치정보를 받는 것도 현실적으로 어려운 일이었고, 파형으로 짐작하게 하자는 것도 당시 구현했던 용도에는 맞지 않았고...

그 당시+우리말 인식 수준으로는 "음성인식해서 보여주면 안 될까요?"라는 건 단박에 "기술적으로 불가능"하다고 판정받는 아이디어였건만, 어느 새 이 정도까지 가능해진 모양이다. 그때나 지금이나 음성인식이 완벽한 건 아니지만, 그래도 최대한 열심히 해서 오류가 있더라도 보여준다면, 어느 정도 사용성 향상은 기대할 수 있을 듯 하다. ... 물론 그 다음부터 나올 사용자들의 "잘못 인식하네" 반응을 생각하면 조심스러울 수 밖에 없겠지만.

이제 우리말 음성게시판도 구글한테 기대할 수 밖에 없는 건가... -_-a
신고
Posted by Stan1ey

BLOG main image
by Stan1ey

카테고리

분류 전체보기 (347)
HTI in General (45)
User eXperience (11)
Voice UI (50)
Vision UI (14)
Gesture UI (25)
Tangible UI (28)
Robot UI (14)
Public UI (9)
Virtuality & Fun (56)
Visual Language (15)
sCRAP (70)

글 보관함



www.flickr.com
This is a Flickr badge showing public photos and videos from Stan1ey. Make your own badge here.