다시..? 흠, 어쨋든.

터치스크린이 모바일 기기의 대세로, 다시 휴대폰의 총아로 떠오르는 이 마당에 한물 간 음성인식을 들고 나온 기사가 있다. "미래 휴대폰 변화의 주역은 '목소리'"라나.

출처: 아이뉴스24
http://www.inews24.com/php/news_view.php?g_menu=020300&g_serial=274474

일단 고마운 일이지만... 역시 새로운 이슈도 새로운 해법도 나오지 않은 것 같다. 본문 중에는 30% 실제 인식률을 이야기하고, 최근 일을 하다가 뭔가 비슷한 숫자를 듣기는 했지만, 여전히'랩' 인식률은 아래 표와 같이 보고되는 모양이다.

연구기관 시스템 특징 DB 단어 규모 인식률
IBM Tangora 고립단어인식 영어 2만 95%
NEC 고립단어인식 일본어 1천800 97.5%
ATR 연속음성인식 일본어 1천35 95.3%
SRI DECIPHER 연속음성인식 영어 1천 95.2%
CMU SPHINX 연속음성인식 ATIS 3천 95%
Ney 연속음성인식 NAB`94 2만 84.6%
Cambridge HTK 연속음성인식 HUB4 3만2천800 83.8%
KAIST 연속음성인식 한국어 3천64 96.7%

표. 국내외 음성인식 기술수준의 비교 (출처 : 카이스트)


이 간격을 어쩌면 좋을꼬... 여기에 사용자가 원하는 수준("꼭 100%를 원하는 건 아니예요...")까지 더해지면 뭐 말 다 했지. 삼성전자 담당자가 이야기했다는 "인식률을 획기적으로 높일 수 있는 기술"은 이미 개발되어 있다. 여러가지 접근 방법과 알고리듬, 하드웨어에서부터 온갖 트릭에 이르기까지...

누가 먼저 용기 and/or 확신을 가지고 쓰느냐. 그게 남았을 뿐인 것 같다.

Posted by Stan1ey

BLOG main image
by Stan1ey

카테고리

분류 전체보기 (347)
HTI in General (45)
User eXperience (11)
Voice UI (50)
Vision UI (14)
Gesture UI (25)
Tangible UI (28)
Robot UI (14)
Public UI (9)
Virtuality & Fun (56)
Visual Language (15)
sCRAP (70)

글 보관함



www.flickr.com
This is a Flickr badge showing public photos and videos from Stan1ey. Make your own badge here.