본문 바로가기

Human Interface Agent10

Voice Search in Korean 지지난 주에 다음 커뮤니케이션에서 아이폰용 Daum 앱에 음성검색 기능을 포함시켰다기에 이게 웬일이냐..하고 있는데, 지난 주에는 구글 코리아에서도 모바일 음성검색의 한국어 버전이 안드로이드 앱으로 (아이폰용도 업데이트할 예정) 발표되고, NHN에서도 올해 안에 음성검색 모바일앱을 내놓겠다고 한다. 누가 먼저 시작했는지는 모르겠지만, 이 일련의 음성검색 발표 러쉬에는 업계의 경쟁심리가 작용했을 것이다. 그렇지만 다음도 일찌감치 음성인식 앱을 준비하고 있음을 홍보한 적이 있고, 구글 음성검색이야 진작에 출시되어 있었던 만큼 준비들은 오래전부터 해왔을 테고, 그래선지 음성인식의 적확률에 대해서도 다음의 앱이나 구글의 앱이나 기대 이상이라는 반응이다. 특히 안드로이드 OS는 초창기부터 음성인식을 위한 고려가 .. 2010. 6. 20.
Siri - Virtual Personal Assistant 이 프로젝트가 드디어 iPhone App으로 출시가 되었다. 무료. 여기에 대해서 뭐라뭐라 글을 쓰기엔, 내가 요새 좀 지쳤다. 아니 굳이 그렇지 않더라도, 십년도 더 된 일이니 이제 와서 키보드를 두드리기가 민망하다고 하는 게 올바른 고백이겠다. :$ 그러니 그냥 동영상이나 하나 더 올리고 마무리. 보란듯이 잘 됐으면 좋겠다. 현실적으로 문제가 없지 않겠지만, 그래도 이젠 슬슬 꿈꾼 보람이 있어야 하지 않을까. 나도 한 우물 열심히 파면서 살아야 하는데, 어느새 여기까지 와 버린 건가... ;d 2010. 2. 6.
Emotional AI 처음 회사생활을 시작해서 건드렸던 게 MS Agent 2.0 엔진을 이용한 대화형 에이전트를 만드는 거 였다. Visual Basic Script와 JavaScript를 혼합해서 인터넷 익스플로러와 넷스케이프에 연동하고 다른 프로그램에 연동하고 해 가면서, 주어진 과제 - 실제로는 완전하게 동작하지 않는 "사람과 대화하는 컴퓨터"를 그럴 듯 하는 게 구현하는 것 - 를 어떻게든 해보려고 노력했다. 그때는 그렇게 10년동안 연구하면 그 '그럴 듯한' 시스템이 실제로 만들어질 줄 알았지만, 10년이 지난 지금도 그 시스템을 만들려면 비슷한 수준의 인공지능과, 비슷한 수준의 구라를 조합해야 할 게다. 당시 사용했던 MS Agent 모델 James 어쨋든 당시에는 거의 이론적인 수준으로만 존재했던 대화모델을 어.. 2009. 8. 8.
Microsoft Office 2010: The Movie 얼마전에 올라온 것 같은 이 MS Office 2010 홍보 동영상을 이제서야 보게 됐다. 비교적 열성과 전문성이 보이는 홈페이지 내용에 비해서, 이 동영상은 마치 고등학생들이 만든 프로젝트 영상 같달까... 어중간한 프로의식에 일단 흉내는 냈지만 도통 공감이 가지 않는 재치있는(?) 내용들이 거슬린다. 게다가 실제로 의미있는 장면이나 대사는 없고, 그냥 헐리웃 영화 예고편에 대해서 순수하게 풍자하고자 만든 영상이라면 오히려 수긍이 가겠다. ... 사실대로 말하자면, 내 입장에서는 내용이 아주 없지도 않았다. 비록 실패했지만, 개인적으로 대화형 Human Interface Agent를 적용한 Social UI의 의미있는 시도로 기억하고 있는 Clippy가 주인공(?)의 죽어버린 친구로 나온다. 여기에 따.. 2009. 7. 20.
Gestural UI from Microsoft 미국에서는 E3가 한창이다. 그거 준비한다고 우리 회사에서도 몇명 고생한 것 같고 (UX팀은 그런 신나는 일에서는 아무래도 거리가 있다). E3의 press conference에서 Microsoft가 일전에 인수한 3DV Systems의 2.5D 동작인식 카메라를 넣은 시스템을 "Project NATAL"이라는 이름으로 발표했다. 그런데, 이게 단지 동작인식 뿐만 아니라, 얼굴을 통한 사용자 인증과 음성인식까지 넣어서 "컨트롤러가 필요없음"을 강조하고 있다. ... 이게 이렇게 잘 될 것 같으면 그동안 수많은 영상인식 연구원들이 왜 그 고생을 했게. ㅡ_ㅡ;;;;; 기가 막히게 잘 되는 음성인식은 오히려 그렇다 치고, 장애물이 있어서 카메라에서 보이지 않는데도 동작인식이 되는 모습 같은 건 모델이 된 꼬.. 2009. 6. 2.
Game + Voice UI + Robot 뭐 이렇게 내 관심사에 딱 맞는 물건이 나온다냐. -_-a;; 이 게임 - Bot Colony - 은 로봇 에이전트를 통해서 게임을 하면서, 그 로봇과 "제한없는 자연어 대화"가 가능하다고 한다. ... 솔직히 100% 믿지는 않지만, 가능한 대화내용보다 대화DB를 벗어날 때의 오류상황에 대해서 더욱 공을 들였다면 뭐 아주 허풍은 아닐 수 있겠다. 특히 요새 게임이야 DVD(4GB가 넘는)를 여러장 사용하기도 할 정도로 용량이 크니까, 음성인식 엔진도 상당한 수준의 것을 사용할 수 있지 않을까나. 출력은 합성음보다는 녹음된 게 품질도 용량도 나을테고. 아직 웹사이트에는 이 게임에서 음성대화가 어떤 조작/대화 기능을 제공하고 그게 게임내용과는 어떻게 연결되는지를 알려주지 않는다. YouTube에 올려놓은 .. 2009. 3. 25.
Is VUI Born Evil? 도시바에서 새로 나오는 프로젝터에서, 메뉴를 읽어주는 기능을 넣는다고 한다. 좀 생뚱맞기는 하지만, 가끔 화면이 나오지 않는 순간이 있다거나 메뉴가 상하좌우 뒤바뀌어 있는 경우에는 조금 유용할지도 모르겠다. "전구 좀 갈라니까!" 라는 오류메시지도 화면에 출력하는 것보다 주목을 끌 수 있을지도. 그런데 이 제품의 Voice UI 기능 탑재를 전하는 포털의 자세는 정말 악마의 재래를 전하는 듯 하다. 아직 음성이 어떤 순간에 어떤 어조로 쓰일지가 전혀 알려지지 않은 상황인데, 음성이 들어간다는 것만으로도 MS Office Assistant였던 Clippy와 비교당하고 있는 거다. 게다가 사실 Clippy는 음성UI가 아니다! 화면을 가리고 서서 당당히(?) 대화를 요구한 게 무엇보다 거슬리는 점이었던 건데.. 2008. 11. 22.
C'mons in Vauxhall Ads. 요새 TV에서 종종 나오는, 좀 우스운 자동차 광고가 있다. 바로 영국 자동차 회사인 Vauxhall에서 판매하는 Corsa라는 이름의 자동차인데, 그냥 봉제인형을 이용했구나...하고 그냥 "C'mon!" 이라는 대목만 무의식적으로 따라하면서 보던 광고다. 그런데, 얼마전 시내의 쇼핑몰에 갔다가, 이런저런 잡동사니를 파는 (대표상품은 각종 축하 카드였던 듯) 가게에서 이런 장면을 봤다. 얼래? 흠... 아마 이 인형들이 원래 있던 캐릭터인가 보네... 하고 (속으로 '디자인 취향 참...' 하면서) 지나치려다가, 저 "As Seen on TV"라는 문구가 좀 맘에 걸렸다. 그래서 바로 또 웹서핑 삼매경. ... 요새 좀 심심한 듯. 역시나 인터넷의 누군가가 위키피디아에 잘 정리해 놓은 저 C'MON! 에.. 2008. 9. 5.
Sharing Eyesight with Agent 이 블로그 최초의, 해외 특파원 소식이다. -_-;;; 출장 와서 동료들과 함께 아침을 먹으면서 (1인당 하나씩 시키기엔 양이 너무 많았다 -_-a ) 영국 TV를 보는데, 재미있는 걸 발견해서 이야깃꺼리가 됐다. BBC UK TV 와 Channel 4+1, E4+1 채널 중 몇 군데에서 청각장애인을 위한 수화를 뉴스나 드라마, 심지어 쇼프로에 이르기까지 제공해 주는데, 우리나라처럼 화면 한쪽에 동그란 영역을 따로 설정한 게 아니라 수화 narrator가 화면에 포함되어 있는 형태인 것이다. 게다가 특이한 것은, 대사가 없을 경우에도 배꼽에 손을 얹고 정면을 바라보고 있는 '차례' 자세가 아니라 아래와 같이 "같이 TV를 보는" 자세를 취하고 있는 게 이채롭다. 위와 같이 시청자와 같이 TV를 보다가, .. 2008. 5. 12.
Mobile VUI Booms Up with Crowdsourcing? ... 그럴 가능성이 보인다. Voice UI는 다른 GUI나 특히 Web UI와 달리 개인이 직접 입출력 기능을 구현할 수 있는 방법이 없다는 점 때문에 많이 개발되지도 확산되지도 않고 있었는데, 얼마 전에 Tellme에서 iPhone용 SDK를 개발하고 있다는 뉴스가 떴다. iPhone의 경우엔 마이크/스피커 달려있고, Wifi나 다른 데이터 통신도 되고, 무엇보다 많은 개인 개발자들이 이미 온갖 application을 만들어서 대부분 어둠의 경로로, 일부는 iTunes를 통해서 유료 혹은 무료로 배포하고 있는 상황이니만큼 이 SDK가 미칠 영향은 적지 않을 것이다. 이미 iPhone (혹은 iPod Touch)에 달려있는 수많은 센서들을 기발한 방법으로 사용한 많은 사례들이 나오고 있는데, 여기에 .. 2008. 4. 15.
반응형