본문 바로가기
Vision UI

Computer Vision may Fail for a While

by Stan1ey 2008. 1. 28.
영상인식은 가장 기대되는 HTI 관련 기술 중 하나이다. 예전에 어느 세미나에선가 발표자가 "미래의 모든 기술은 영상인식을 바탕으로 할꺼다"는 말에 크게 공감한 적도 있었으니까. 물론 여기서 영상인식은 2차원 공간에서의 정보처리에 대한 것이고, 그 논리대로라면 멀티터치 방식도 영상인식 기술을 활용한 게 된다.

어쨋든, 이 영상인식 기술들이 '컴퓨터 편한 기준에 의해' 평가되고 개발되었기 때문에 인간과 같은 능력을 가질 수 없을 거라는 연구가 MIT의 신경과학자에 의해서 발표되었다고 한다.

이를테면 다음과 같은 그림에서, 사람은 이 그림들이 모두 같은 물체(자동차)를 다른 각도와 크기로 찍은 사진이라는 것을 알지만, 영상인식으로는 이러한 것을 알 수가 없다는 것이다.
a Computer Vision Challenge

사실 이러한 문제 제기가 과히 새로운 것 같지는 않다. 이미 복잡한 데이터의 여러 연속된 측면을 분석하여 하나의 entity로서 인식하는 방법이 영상인식에 적용되고 있기도 하고, 여러 각도에서 본 물체를 각각 학습해서 하나의 물체로서 인식하는 방법도 몇몇 분야에서 실용화되어 있다.

하지만 여전히, 이 기사의 말미에 언급된 대로, 지금의 연구 방법으로는 인간만큼의 시각적 능력을 갖기 어렵다...는 것은 아마 영상인식 뿐만 아니라 인공지능을 연구하는 모든 사람들에게 숨기고 싶은 상처이거나, 가장 커다란 도전과제가 아닐까.

그럼에도 불구하고, 화이팅~!!!
반응형