[자그만치 3주를 넘도록 이 글 하나를 껴안고 끙끙대고 있습니다만, 이건 아무래도 초안 수준을 벗어날 수가 없네요... 일단 올리기는 하지만, 두고두고 고쳐봐야 하겠습니다. 따라서 이 글을 읽으시는 분도 이 블로그 밖에서의 인용이나 트랙백, 코멘트 등은 삼가해주시기 바랍니다.]



3. HTI에서 풀어야 할 문제들

단순하던 복잡하던 간에, 이러한 패턴인식 기술 - 혹은 인공지능이 적용된 입력 기술 - 이 UI에 적용되면 이제까지와는 전혀 다른 문제들이 생긴다. 대표적으로(=생각나는대로) 인식률의 문제, 의인화의 문제, 도덕성의 문제를 언급해보자.

(1) 인식률의 문제

UI를 설계 개발해야 하는 입장에서, 가장 신경쓰이는 것은 바로 "인식률"의 문제이다. 모든 종류의 패턴인식 기술은 임의의 대상에 대해서 얻어진 상당히 방대한 이진 자료를 바탕으로 그 유사성을 비교하는 몇가지 기법을 사용한다. 임의의 대상, 특히 사용자나 환경을 대상으로 수집된 자료는 결코 동일할 수 없으므로, 기준이 되는 상태인지 아닌지를 판단하는 것은 유사도가 어느 정도 임계치 threshold 이상의 값이냐 아니냐에 의할 수 밖에 없다.

이 임계치는 단순하게는 그 기술을 연구하는 연구실에서 설정되고, 많은 변수를 고려한 체계적인 현장 실험을 통해서 설정되기도 하는데, 어느 경우든 실제 상황에서의 모든 변이를 고려하여 실수없이(=사용자 의도에 맞춰) 동작하도록 하는 것은 실제로 불가능하다.

물론 의도된 동작을 방해할 수 있는 변이들에 대해서 제품에 [주의사항]이라는 표시 아래에 큰 글자로 나열하고, 이를 벗어나는 상황에 대해서는 책임을 회피하는 수도 있겠다. 하지만 인식률을 저하시키는 이런 변이들은 실제 상황에서는 대부분 피할 수 없는 환경요소이거나, 기능을 사용하는 것을 거의 불가능하게 만드는 제약사항이거나, 심지어 사용자가 인간으로서 도저히 받아들일 수 없는 것인 경우도 있다.

[○] UI 기술의 넘어서기 힘든 제약사항 ___

이러한 인식률의 문제는 물론 기술의 발전에 의해 점차 해결될 것이다. 하지만 유용한 UI 기술을 남들보다 한발 앞서 적용한 사례들을 보면 기술의 인식률 한계나 그 원인을 충분히 이해하고 이를 보완할 수 있는 UI를 설계함으로써 이를 보완해왔음을 볼 수 있다.

이를테면, 음성인식 기술의 비교적 낮은 인식률은 대부분 입력되는 음성의 범위를 잘 잡지 못하는, 즉 발화의 시작과 끝을 인식하는 EPD (end-point detection) 모듈의 오류 때문에 발생한다. EPD 모듈의 오류를 줄이기 위해서 도입되는 대표적인 방법이 바로 PTT (push-to-talk) 방식으로, 사용자가 음성명령을 원할 때에 스스로 버튼을 누름으로써 EPD 모듈을 보완할 수 있는 것이다.

(2) 의인화의 문제

의인화 anthropomorphizing 는 다소 적절하지 못한 표현일지도 모르겠다. Clifford와 Byron의 <The Media Equation: How people treat computers, television, and new media like real people and places 미디어 방정식> 이후, 상호작용을 제공하는 모든 종류의 기기를 대하는  인간의 묘한 사회적 반응에 관한 많은 연구결과가 있다. 이는 단순한 TV 수상기에서부터 로봇 강아지에 이르기까지 다양한 제품을 대상으로 하고 있는데, 그 상호작용 방법이 보다 정밀하고 섬세하며, 동작 원리가 명확하지 않을수록 대상이 되는 기기를 사회적인 개체로 대하는 정도는 점점 더 커진다고 보고하고 있다.

분명 우리는 소파 옆에 놓여있던 돌돌 말린 꼬리를 가진 아날로그 전화기보다, 주머니 속에서 꺼낼 수 있는 휴대폰에 좀더 애착을 느낄 수 있다. 이는 기능의 많고 적음에 의한 상호작용의 양에 의한 현상은 아니다. 이를테면 일반적으로 아날로그 TV보다는 아날로그 라디오에 좀더 애착을 갖게 된다고 말할 수 있는데, 이는 라디오에서 주파수를 맞추는 과정이 TV의 그것보다 다소 섬세한 조작을 필요로 하기 때문이다. 라디오의 주파수 맞추기는 좀처럼 말을 듣지 않는 기기와의 씨름으로 변질되기도 하는데, 이러한 과정을 통해 우리는 그 기기의 성격을 알아가고, 겉모습으로 알 수 없었던 무언가를 파악했다는 즐거움이 그 기기에 대한 애착을 더해가는 게 아닐까. 이를테면 "아, 그 라디오는 90.1 부터는 오른쪽으로 조금 더 돌려야 소리가 잘 나와요"라고 말하면서 으쓱한 느낌이 드는 것 같이 말이다.

많은 학생들을 길러낸 나이 지긋한 선생님들도 지나고보면 유독 말썽을 많이 부리는 학생이 좀더 오래 기억에 남는다고 하시는 걸 보면, 명확하지 않은 측면을 가지고 있어서 상대방(?; 사용자)로 하여금 고민하게 하거나 약간은 고생스럽게 하는 편이 제품으로서 애착을 갖게 하는 방법일 수도 있겠다. 어떤 전문적인 작업을 위한 소프트웨어 productivity application 에 충분히 능숙해진 사용자는 자신에게 필요한 단축키를 조합하고 이를 순차적으로 막힘없이 사용하는 것에 대한 기쁨을 잘 알고 있는데, 이는 그 단축키와 효과적인 조합을 찾아내면서 겪었던 고생들이 좀더 애착을 갖게 하는 것 같다. 이를테면 같은 작업을 좀더 효율적으로 할 수 있는 방법(예를 들어, 포토샵에서 파일을 열 때에는 Alt-F + O 나 Ctrl-O 로 접근할 수도 있지만 작업바탕을 더블클릭하는 것이 다음의 browsing 작업을 고려할 때 보다 유리하다)을 제시해도 '난 이게 편해'라며 자신이 발견한 자신의 방법을 버리려고 하지 않는다.

그러나, 이러한 애착은 제품을 사회적 개체로 대하게 됨으로써 생기는 긍정적인 현상이며, 동전의 양면과 같이 부정적인 현상 또한 충분히 관찰된다.

 

한때 상당한 인기(?)를 끌었던 위의 영상은 소위 'Computer Rage'의 대표적인 사례로 꼽힌다. 유명한 그룹인 <Rage Against The Machine>과 무슨 연관인지는 명확하지 않지만... 산업혁명 이후 기계가 '인간을 대신해서' 육체노동의 일자리를 차지하는 것에 대한 반항을 생각해보면, 오늘날 컴퓨터가 '인간을 대신해서' 지식노동의 일자리를 차지하는 것에 대한 저항심도 충분히 이해할 수 있지 않을까?
 
앞서 언급한 <미디어 방정식>과 저자들의 여러 논문에 의하면, '자연스러운 natural 사용자 인터페이스'라는 표어 하에 개발/적용된 많은 UI 기술들은 의인화와 애착을 기존의 컴퓨터에 비해 크게 향상시키는 효과가 있으나, 그로 인한 반대 급부로 기계에 대한 과도한 기대치로 인해 수행이 실패했을 때에는 실망이 그만큼 커지는 현상을 보인다고 한다.

이러한 현상은 1970년 일본의 로봇공학자 모리 마사히로가 주창한 不氣味の谷 (uncanny valley)와도 일맥상통하는데, 과도하게 강요된 의인화는 어느 선을 넘으면 오히려 불쾌함과 혐오감을 준다는 관찰결과를 보고하고 있다.


Uncanny Valley

Uncanny Valley



맨 아래는 좀비고, 바로 옆이 시체와 의수다 -_-;;; 자세한 이야기는 아래 글들을 참고하시고... 하고 넘어가고 ㅡ_ㅡ;;;

(참고) Uncanny Valley
- 정리한 글 ☞ http://blog.naver.com/jihanj/120025724098
- 다소 주관적인, 하지만 관점이 있는 글 ☞ http://hasaho.net/bbs/view.php?id=mun_opinion&page=1&sn1=&divpage=1&sn=off&ss=on&sc=on&select_arrange=headnum&desc=asc&no=4

그러나, 이 매력적인 이름을 가진 모델을 찬양하지 않기로 하고, 기술의 발전에 대해서 일반 대중(=시장)이 갖는 기대치를 표현한 가트너 그룹의 Hype Curve 모델을 적용한다면 어떨까? 인간은 원래 뭔가가 새로 나오면 거부감을 느끼고, 시간이 흘러 그런게 대세가 되면 또 언제 그랬냐는 듯이 적응하는 생물이다. 적어도 이 지구상에서는 가장 상위의 적자생존 능력을 증명한 종족이니까.

Hype Curve

가트너 그룹의 Hype Curve Model

그렇다면, 위 1970년의 이상한 골짜기 uncanny valley 역시 로봇 기술과 그 '익숙함'이 기대에 비해 많이 부족했던 시절, 그러니까 hype curve 식으로 말하자면 환멸의 골 trough of disillusionment (위 그림에 오타가 있다 -_-; )을 지나고 있는 게 아닐까? 비교적 쉬운 의인화 기술 - 사진기 (영혼을 뺏는 장치), TV (상자 안에 들어있는 사람들) 등등등 - 에 비해서, 실제로 '인간을 만드는' 의인화 기술인 로봇 같은 것은 좀더 오랫동안 저 골짜기에 빠져 있는 거라고 생각한다.

따라서, 의인화의 문제는 영원히 골에 빠져서 빼도박도 못하고 헤어나오지 못하는 것이 아니라, 언젠가는 세상을 계몽시켜 상용화를 위한 타협점을 찾게 될 것이다. 문제는 누가 먼저 그렇게 하느냐는 건데, 과거의 기술들이 hype curve를 빠져나오는 모습을 보면 기술의 발전보다는 그 기술을 어디에, 어떻게 쓸 것인가에 대한 답을 찾음으로써 가능했다는 것을 볼 수 있다.

HTI 분야는 기술을 어떻게 쓰느냐에 대해 책임이 있다. 그럼으로써 그 기술 자체를 그 이상한 골짜기에서 빠져나와 고원 plateau 을 달리게 할 수 있을 것이다. 이를테면 음성합성이 불완전하고 거슬리며, 무엇보다 기계에서 사람 목소리가 나오는 것에 대해서 불만을 갖는 사람들도, 자동차 내비게이션의 안내 음성에 대해서는 충분히 받아들이고 유용하게 생각하는 것이 그 사례가 될 것이다.

(상대적으로 관심이 많은 의인화 문제를 다루다 보니 말이 길어졌다 -_- 대충 넘어간 하나하나의 세부 이슈에 대해서도 한번 정리할 기회가.. 있으려나;;)

(3) 도덕성의 문제

일반적으로 다소 의외로 받아들여지는 것이 HTI의 이 도덕성[윤리]의 문제이다. 하지만 인간이 발견해온 다른 많은 기술들이 그랬던 것처럼, 기계장치가 (인공)지능적인 입출력 기술을 포함하게 되면서 생기는 능력은 종종 사람들로 하여금 거부감을 갖게 만든다. 지능적인 입출력 기술에 대해서 사람들이 표하는 불편한 감정은 보통 두가지 측면에서 드러나는데, 센서에 의해 드러나는 임의적인 입력에 대한 것과 기계의 판단에 의한 임의적인 출력에 대한 것이다.

HTI의 설계 대상이 되는 것에는 사용자가 분명한 의도를 갖고 직접 입력하는 명확한 explicit 입력 외에도, 사용자의 행위를 간접적으로 판단하기 위한 암시적인 implicit 입력까지도 포함된다. 이러한 암시적 입력은 주로 센서를 통해서 이루어지며, 입력의 내용이나 범위는 물론 입력 여부 자체까지도 (별도의 피드백 설계를 하지 않는 한) 사용자에게 인지되지 않는다. 대부분의 사용자들은 기계가 자신이 직접 지시하지 않은 사항에 대해서 어떤 기능을 수행할 경우 불편한 감정을 갖게 된다.

우리 주변에서 흔하게 볼 수 있는 자동문은 센서에 의한 임의적 입력을 가진 가장 단순한 사례이다. 평소와 같이 자동문을 향해 다가갔는 데 문이 열리지 않아 당황하거나, 심지어 문에 부딪힌 적이 있는가? 나는 문을 통과할 생각이 아니었는데, 그 앞을 지났다는 이유로 자동문이 열리는 바람에 놀라거나, 어쩌면 미안한 생각이 든 적은 없는가? 자동문이 열려있도록 문 사이에 서 있다가, 문이 닫히는 바람에 놀란 적이 있는가?

자동문은 초창기에는 발판에 장치된 압력센서(스위치), 초음파를 이용한 거리 센서, 레이저를 이용한 광 센서 등 다양한 방법들이 사용되었으나, 최근에는 적외선을 이용한 움직임 감지 센서가 주로 사용되고 있다. 지극히 단순한 동작 - 사람이 다가가면, 문을 연다 - 을 수행하는 자동문 조차도 앞에서 인식한 '인식률의 문제'를 갖는데, 인식률에 영향을 주는 주요 변인은 움직임, 거리, 태양빛 등이다. (적외선 감지 방식의 한계에 대해서는 논하지 않기로 하고;;) 이 인식률의 문제로 인해서 많은 사용자들이 자동문에 부딪히거나, 끼이는 것이다. 자동문의 센서는 사실 "사람이 가까이 오는 것"을 감지하는 것이 아니라 "일정 거리 범위 안에 움직이는 물체가 있는 것"만을 감지하므로, 위 변인들 중 무엇 하나의 특이한 변화가 있을 경우 "사람이 가까이 오는 것"을 감지하지 못하거나 잘못 감지하기도 한다. 요컨대 사람이 가까이 있어도 움직이지 않는다면 문을 닫기로 결정할 수 있는 것이다. (물론, 이를 막기 위해 별도의 몇가지 센서를 조합하여 사용하는 모델도 있다)

(참고) 자동문에 적용되는 센서들 ☞ http://www.acedoor.co.kr/sensor.html

위에서 언급한 흔한 자동문 사고들은 사용자가 센서의 특성과 원리를 판단하고 있는 '멘탈 모델 mental model'이 실제의 '시스템 모델 system model'과 다르기 때문에 생긴다. (상당히 전통적인 UI 원론처럼 보이지만, 그렇지 않다) 특히 기계가 해당 기능을 수행하는 판단 기준이 되는 임의적인 센서 입력은 그 보이지 않는 특성상 기존의 PUI나 GUI 시스템보다 더 다양한 멘탈 모델의 자유도가 있고, 따라서 잘못된 멘탈 모델으로 인한 사고의 가능성은 매우 높아진다.

이러한 실질적인 사용성 사고 외에도, 센서의 임의적인 입력은 사용자에게 그 자체만으로도 불쾌감을 주기도 한다. 일반적으로 기술 개발자의 관점에서 이루어지는 논의에서 (참가자는 개발자도 될 수 있지만, 보통의 잠재 사용자를 대상으로 해도 마찬가지이다) 가장 자주 사용되는 표현이 "사용자가 그냥 _____하기만 해도 기계가 알아서 ____ 해준다면 좋을 것 같다"는 것이다. 이를테면 사용자가 복도를 따라 걸어가기만 하면 복도의 조명이 진행방향에 따라 순서대로 켜진다면 좋을 것 같다 라든가, TV 앞의 소파에 앉기만 하면 좋아하는 TV 프로그램을 켜주고 조명을 TV 시청에 맞게 조절해 주면 좋을 것 같다는 식이다.

그러나, 실제로 그런 식으로 만들어서 용납될 수 있는 시스템은 유령의 집 정도가 아닐까 한다. 내가 생각하고 있는 기능들을 직접 조작하기 전에 알아서 수행해주는 시스템은 말로는 그럴 듯 하지만, 실제로는 굉장히 껄끄러울 것이다. 손가락 하나 잘못 까딱하면 그 다음에는 무슨 일이 일어날지, 전혀 알 수가 없는 상황에서 사용자가 과연 안정감을 느낄 수 있을까? 사용자 인터페이스 디자인의 제1원칙인 '사용자에게 통제감을 줄 것 User in Control'이 암시적 입력을 위한 기술이 적용된 시스템에서도 가능할까? 혹은, 질문은, 어떻게 가능할까?

다양해진 입력 만큼이나 출력 기술에도 많은 기술적 발전이 있었다. 단순한 삐- 소리가 보다 다양한 음악소리나 음성으로 바뀐 것부터 시작해서 숫자만 표시하던 작은 화면 대신 큰 화면에서는 사진과 다름없는 이미지를 보여준다. 또한 각종 근거리 및 원거리 네트워크 기술의 발달로 인해 여러 기기에 분산되어 있는 입력 장치와 출력 장치는 다른 조합으로 이용될 수 있다. 인간은 기계로부터의 여러 출력을 동시에 받아들이지 못하지만, 필요에 따라 선택된 출력들의 조합으로 사용자의 맥락에 최적화된 기능과 서비스를 제공할 수 있는 것이다. 그러한 필요는 각 장치들이 보유하고 있는 센서와 연산장치에 의해서 탐지된다.

일반적으로 사용자는, 기계가 온갖 종류의 센서와 연산장치로 자신의 모든 측면을 감시하더라도 그 사실을 굳이 인지하기 전까지는 그 의미를 파악하지 못한다. 휴대폰은 항상 그 위치를 인지하며 통화가 가능하도록 기지국과 교신하고 있으며, 자연스레 통신회사에서도 사용자의 현위치를 파악할 수 있다. 하지만 사용자는 어느날 백화점에 들어가는 순간 휴대폰에서 할인행사 안내 메시지를 받고나서야 비로소 이러한 사실을 깨닫고 자신에 대한 감시의 눈길을 느끼는 것이다.

원래는 사용자 맥락에 맞춘 최적의 서비스라는 의도라 할지라도, 이렇게 어디서나 튀어나오는 컴퓨팅 ubiquitous computing 서비스를 만나게 되는 사용자는 비로소 도처에 깔려 자신을 감시하는 센서의 존재를 실감하고, 신기해 하거나 만족하기보다 섬뜩함을 느끼게 된다. George Owell의 <1984>에서 언급된 감시자 Big Brother 역시 때와 장소를 가리지 않고 감시 당하고 있음을 사람들에게 주지시킴으로써 거부감을 유발하고 있는 것이다.

따라서 다양한 입력장치에 의한 암시적인 입력에 의해서 역시 다양한 출력장치들의 최적의 조합을 제공해준다는 발상은, 기본적으로 인간의 자유본능(거창하다;;)과의 타협점을 다시 생각해봐야 할 듯 하다.






4. 맺음말

엉망이다. 나도 안다. ㅡ_ㅡ;; 그래도 일단 올리고 나서, 죄책감이 어느 정도 맺히고 나면 다시 손을 보기로 했다. 이대로는 천년만년 둘 것 같아서... -_-a;; 일단은, 안 그래도 온갖 쓰레기가 난무하는 인터넷에 이런 글 올려서 미안하다는 말로 대충 무마하고 이제 그만 한숨 돌려야겠다.


신고
Creative Commons License
Posted by Stan1ey
[자그만치 3주를 넘도록 이 글 하나를 껴안고 끙끙대고 있습니다만, 이건 아무래도 초안 수준을 벗어날 수가 없네요... 일단 올리기는 하지만, 두고두고 고쳐봐야 하겠습니다. 따라서 이 글을 읽으시는 분도 이 블로그 밖에서의 인용이나 트랙백, 코멘트 등은 삼가해주시기 바랍니다.]


1. UI: MMI에서 HCI로

HCI(Human-Computer Interaction)라는 분야는 인간과 컴퓨터(주로 PC) 사이의 상호작용을 효율적으로 재설계하는 데에 중점을 두고 있다. 오늘날 많은 제품들이 마이콤(UI 이야기하면서 이 단어를 쓰는 것도 참 오래간만이다. ㅋ)과 화면을 가지고 있어서 기본적으로 컴퓨터와 같은 입출력 모델을 가지고 있기 때문에, HCI와 UI는 비슷한 주제를 다루는 분야가 되었다. 최근 들어 학계를 중심으로 HCI를 보다 컴퓨터 기술이 많이 들어간 시스템을 다루는 것으로 분리하려고 하기도 하지만, 원래 UI와 공동소유하고 있던 개념을 포기하지 않는 한 두 용어의 혼란은 앞으로도 피할 수 없을 것이다.

사실 원래 굳이 H'C'I라고 하기 전에, 학계에서 통용되던 명칭은 MMI(Man-Machine Interface)였다고 한다. 그 당시의 학계 분위기를 내가 정확히 알 수는 없지만, 명칭에서 느껴지는 이 하드웨어의 느낌이라니! 분명히 HCI라는 용어는 컴퓨터가 물리적인 동작을 필요로 하는 기계가 아니라는 측면을 강조하는 과정에서 나왔을 것이다. 하지만, 실제로 HCI에서 다루는 많은 내용들이 MMI 시절의 이슈들과 다른 점이 없다는 걸 생각해보자. 우선 UI의 연구내용이 입력과 출력, 그리고 기타 이슈에 대한 것으로 나뉠 수 있다고 대~충 가정한다면, 각각의 주요 관심분야는 다음과 같다.

이슈 연구 내용
MMI HCI
입력 - 버튼(push button)
- 다이얼
- 스위치, 레버
- 화면 상의 버튼
- 스크롤 바
- 라디오박스, 체크박스
- 기타 풀다운 메뉴, 입력상자 등
출력 - 입력장치의 명칭(label) 및 도안
- 안내문, 경고문
- 계기판
- 메뉴이름(label) 및 아이콘
- 안내메시지, 오류메시지
- 상태표시영역 및 레이아웃
- 기타 그래픽적인 표현 내용
기타 - 인간 신체의 표준 및 한계
- 물리적인 구조와 형태
- 기계적인 동작원리
- 인간 지각/기억의 표준 및 한계
- 입출력 장치의 특성
- 메뉴의 정보구조

MMI도 HCI도, 사용자 인터페이스는 인간 사용자에 대한 것이므로 '인간'이 변하지 않는 한 마주하고 있는 물건이 뭐가 됐든 연구의 주제는 크게 변하지 않았다. 가위를 쥐던 자동차 핸들을 쥐던 마우스를 쥐던, 종이를 보던 신호등을 보던 화면을 보던 사람의 사용자로서 생각해야 하는 것은 제한된 주제라고 할 수 있다.

HCI의 연구대상인 컴퓨터의 경우 그 전형적인 형태가 문자입력(키보드), 포인팅(마우스), GUI(화면장치) 등을 중심으로 형성되어 있었기 때문에 그 자체로서 큰 변화를 기대할 수는 없는 상황이었다. 물론, HCI는 그 내용적인 측면(컨텐트 혹은 정보)이 양적으로 크게 확대되었다는 점에서 정보구조의 설계나 정보의 표현방식 수준에서 많은 연구가 이루어지기는 했으나, 기존의 MMI에 비해 질적인 발전이 이루어졌다고 말하기에는 다소 부족하다.

MMI 시절의 사용자 멘탈모델(비교적 단순한 물리적인 구조와 동작원리를 이해함으로써 얻어지는 glass box)과 HCI 시대의 사용자 멘탈모델(컴퓨터 안에서 이루어지므로 학습하기 전에는 알 수 없는 black box)의 차이에 대해서 말하는 것도, 생각하기에 따라 공허할 수 있다. MMI 시절의 사용자가 기계장치의 구동원리 - 어떻게 엔진이 돌아가기 시작해서 캠과 톱니바퀴와 도르레와 지렛대를 통해서 동작이 이루어지는지 - 에 대해서 파악하고 있는 것만큼의 멘탈모델과, HCI의 사용자가 컴퓨터의 구동원리 - 어떻게 전자의 흐름이 제어되고 2진 신호로 읽혀서 튜링 머신에서부터 복잡한 사칙연산까지, 그리고 더 복잡한 다른 비수학적 함수들을 수행하는지 - 에 대해서 파악하고 있는 것만큼의 멘탈모델은 사실 비슷한 수준이라고 생각할 수 있지 않을까? 이러한 관점은 Steven Johnson의 <Everything Bad is Good for You / 바보상자의 역습>에서도 일부 지지되고 있는데, 요컨대 문명이 발달하면서 개개인이 보다 고차원의 외부자극을 얻게 되기 때문에 일반적으로 사람(=사용자)은 점점 똑똑해지고 있다는 것이다.

결국, MMI나 HCI를 구분하는 멘탈모델의 '양적인 수준 차이' 혹은 '필요한 기반지식의 차이'는 사실 크지 않다는 것이 내 생각이다.



2. UI: HCI를 넘어서

최근 들어 일반 사용자들도 조금씩 깨닫고 있는 HCI는 이제서야 비로소 'Machine' 이슈가 아닌 'Computing' 이슈를 가지고 있는 것 같다. 기존의 MMI와 HCI가 주로 대상 기기('Machine')에 대한 입력과 출력에 대한 이슈를 다뤘고, 기타 이슈들은 원론적인 접근이나 입출력 이슈의 참고사항에 불과했다고 한다면, 새로 주목을 받고 있는 'Computing' 이슈는 컴퓨터 기기의 지능적인 판단과 기능에 대한 것이다.

전자기술의 발달에 따라 다양한 정보를 수집하는 작은 장비(sensor)를 통해서 우리 주변의 기기는 사용자에게 굳이 알리지 않고도 사용자에 대한 많은 정보를 알 수 있게 되었으며, 18개월에 2배씩 빨라진다(Moore's Law; Intel)는 정보처리장치(processor)는 모호하고 방대한 이 정보를 조합하고 비교하여 이를 의미있는 패턴으로 이해할 수 있는 수준으로 발전하고 있다. 또한 이를 위해서 많은 데이터를 저장, 처리하고 화면에 표시하기 위한 저장장치(memory, storage)들도 매년 집적도를 2배로 늘리고(Hwang's Law; 삼성) 가격은 점점 낮아져 더이상 제약으로 여겨지지 않을 정도이다.

이런 상황에서 출시되는 제품들에는, 지난 수십년간 컴퓨터의 역사와 함께 대학 연구실에서 특수하게 개발된 장비와 별도로 마련된 실험실, 그리고 높은 사양의 컴퓨터를 써서나 가능했던 복잡한 패턴인식 기술이 점진적으로 적용되고 있다.

음성인식을 통한 구두명령의 인지라든가 영상인식을 통한 인간의 동작과 표정의 이해 등은 SF 영화를 통해서도 널리 알려지고 심지어 '당연시되는' UI 기술이지만, 실제로 제품에 적용되기 시작하는 것은 이보다 훨씬 단순하지만 오히려 덜 알려졌기에 '당연시되지 않아' 상품성이 있는, 가속도 센서를 이용한 동작인식이나 광센서를 이용한 밝기조절 수준의 기술이다.

[○] UI 기술 실용화 사례 ______________


핀란드의 국립연구소인 VTT의 ICT 부문에서 말하는 HTI라는 분야는 - 처음 접했을 때에는 '뭐 이런 짝퉁같은 용어가...'라고 생각될 수 있지만 - 이러한 경향을 잘 반영하고 있다고 생각한다.

기존 제품은 나름대로 전형적인 입출력 장치를 갖고 있어 그 장치들의 배치나 장치 조작으로 인한 전자적 정보 및 기능 구조의 항행이 커다란 이슈였다. 즉 입출력 장치의 설계에 대해서는 눈에 보이고 만져지는 수준에서 논의가 이루어질 수 있었으며, 입출력이 안정적으로 이루어진다는 전제 하에 보이지 않는 부분 - 정보/기능 구조의 설계 - 를 다루는 것이 중요한 연구 대상이었다.

하지만 HCI의 대상이었던 정보기기(≒computer)가 기존에 전산학 개론에서 배웠던 것처럼 단순한 입력-연산-출력 기기의 정적인 조합이 아니라;
  ① 센서와 인공지능 기술이 융합되어 사용자의 명확한 의도 없이도 자동적으로 이루어지는 입력 방법;
  ② 사용자의 시선을 전제한 화면 외에도 다양한 양식 modality 의 출력이 포함되는 출력 방법; 그리고
  ③ 이러한 모호하거나 복잡한 입출력 사이에서 다양한 변수를 고려하고 사용자 의도(명확한 explicit '명령'이라기보다 행위에 함축되어 있는 implicit '의도'라는 표현이 적당할 것이다)에 맞는 기능을 판단하는 기준의 체계;
가 연구 대상이 되어야 할 것이다.

이러한 내용의 연구/개발이 이제까지와 같이 디자인 중심으로 이루어질 수 있는가..에 대해서는 많은 논란이 있을 수 있겠다. 이러한 논란은 산업의 큰 흐름이 바뀔 때마다 그 산업에서 특정 부분 - 이 경우 미학적이거나 수사학적인 부분 - 을 담당하는 업종에 항상 주어진 숙제였다. 직조공장이 생기자 양산 가능한 패턴을 디자인하고, 기업에서 생활용품을 양산하게 되자 공예로부터 독립하고, 전자제품이 등장하자 UI라는 분야를 만들고, 정보기기가 등장하자 정보구조 information architecture 의 중요성을 강조하는 등 변신에 변신을 거듭한 것이 이 분야의 흐름인만큼, 그 직종의 명칭이 뭐든 간에 필요한 지식을 흡수해서 그 타이틀을 거머쥐는 직종이 HTI 분야의 주역이 될 것이다.

다음 글에서는 HTI에서 풀어야 할 문제들을 살펴보겠다.

신고
Creative Commons License
Posted by Stan1ey
첨부1. 휴대기기에의 적용
Sensing Techniques for Mobile Interaction
Ken Hinckley, Jeff Pierce, Mike Sinclair, Eric Horvitz
UIST 2000 (Symposium on User Interface Software and Technology)
CHI Letters 2 (2), pp. 91-100
[Best Paper Award]
http://research.microsoft.com/users/kenh

첨부2. 인식기술의 불명확성 대응
Interaction Techniques for Ambiguity Resolution in Recognition-based Interfaces
Jennifer Mankoff, Scott E. Hudson, Gregory D. Abowd
UIST '00. pp. 11-20
http://www.cc.gatech.edu/fce/errata/publications/
신고
Creative Commons License
Posted by Stan1ey

사회에 나와 7년이 넘도록 소위 "미래의 UI"라는 것을 만드는 業으로 살아오면서, 몇번인가 내가 하는 일이 옳은 방향인가 고민했던 시기가 있었다.

디자인 분야에서 교육을 받고 디자이너라는 직함을 가지고 기술 연구소에 입사했을 때에는, 나름대로 기존의 UI 디자인이 가지고 있는 바닥이 보인다 싶었다. 졸업하던 1999년에는 웹디자이너로서 나름 커리어를 가지고 있었지만, 웹에 대해서 그 수많은 가능성과 장미빛 미래에도 불구하고, 웹 '디자인'에 대한 장미빛 미래는 어디에도 찾아볼 수 없었던 것이다.

특히 Jacob Nielsen을 위시한 미국의 선구자들이 만든 UI Design Guideline을 들여다보면 뭔가 좀 석연치 않은 점이 있었다. 우리나라에 웹과 GUI가 거의 동시에 퍼지기 직전에, 소프트웨어의 UI라는 분야가 주목을 받은 적이 있다. 처음에는 소프트웨어 공학(S/W Engineering)의 일부 분야로서 등장해서, 몇몇 디자인 배경의 사람들이 그 일을 하면서 "느낀 점"을 정리한 것이 초기 가이드라인이었는데, 그런 내용을 처음으로 접했던 1995년에도 그 내용이 과연 '가이드라인'으로서의 깊이를 가지고 있느냐에 대한 논란이 많았다. 실무적으로 따를 수 있는 지침이라기보다 디자인을 하는 데 염두에 두어야 할 원칙(principle), 혹은 그냥 철학(philosophy)의 수준에서 보아야 한다는 주장이 많았던 것이다. 처음 접했던 Web UI [Design] Guideline은, 그 깊이가 의심받았던 SW GUI Design Guideline을 그대로 답습한 것이었다.

그리고 그보다 더 큰 문제는, 그 이후 몇년간 웹디자이너로서 10여개의 웹사이트를 만들면서 나름 열의를 갖고 찾아보았지만, 디자인 분야에서 그 이상의 논점을 찾지 못했다는 데 있다. 입력은 버튼이나 마우스, 출력은 백날 화면의 아이콘. 왠만큼 머리좋은 사람들이 모인 자리를 가봐도 주제는 메뉴가 위에 있는 게 좋으냐 왼쪽에 있는 게 좋으냐. ... 이게 뭐냐 싶었던 거다.

그래도, Apple이나 Microsoft의 SW GUI Design Guideline과 J. Nielsen의 Web Design Guideline에서 굳이 차이점을 찾는다면, 그건 웹이라는 특정한 기술로 인해서 생기는 특수성에 대한 것이었다. 이 특수성은 웹을 접하면서 사람..혹은 사람들이 갖게 되는 '모델'에 대한 것("사람들은 웹을 페이지 단위로 항행한다")과, 사용하는 '행위'에 대한 것("각 페이지의 왼쪽 위부터 빠르게 훑으면서 키워드만 본다")과, 기술의 한계로 인한 '제약'에 대한 것("페이지 로딩시간은 2초를 넘지 않도록 해야한다")이었다.

그렇다면 차라리, 기존의 UI 분야인 GUI를 벗어나서, 새로 등장할 UI를 탐색하는 편이 더 재미있지 않을까? (어차피 시각적인 디자인에는 재능이 별로 없기도 하고 -_- ) ... 뭐 이런 생각에 GUI 담당자로서 벤처회사에 참여할 수 있는 기회를 포기하고 기술 연구소로 방향을 잡은 것이다.

(서설이 길었다 -_-;; 그냥 다음 글로 넘겨야지)

신고
Creative Commons License
Posted by Stan1ey

INTERACTION.

2007.01.01 09:41

이 블로그의 대문이미지를 넣을 차례가 됐을 때 떠오른 이 그림.

사용자 삽입 이미지

영화를 보다가 UI랑 엮이는 장면이 있으면 곧잘 저장해 두곤 했는데, 이 영화 <Cast Away>를 보다가 이 장면이 나온 다음부터는 영화보다 다른 생각이 더 많이 났다.

사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

소통에 대한 인간의 본능? 소통이라고 하면 communication이 더 가까우니 그냥 상호작용 interaction 이라고 해야 하나? ㅋㅋ 어쨋든 엎어치나 메치나 말장난이 되겠지만, 어쨋든 이 장면은 당시 Social UI에 심취해 있는 나에게 아주 좋은 (어쩌면 심각하게 잘못된) reference가 되어 주었다. ... Social UI의 정의가 agent character든 CSCW든 간에.

어쨋든... 그냥 대문그림에 대한 주인장의 변..같은 거다. 이 글은.
신고
Creative Commons License
Posted by Stan1ey

BLOG main image
by Stan1ey

카테고리

분류 전체보기 (347)
HTI in General (45)
User eXperience (11)
Voice UI (50)
Vision UI (14)
Gesture UI (25)
Tangible UI (28)
Robot UI (14)
Public UI (9)
Virtuality & Fun (56)
Visual Language (15)
sCRAP (70)

글 보관함



www.flickr.com
This is a Flickr badge showing public photos and videos from Stan1ey. Make your own badge here.