다시..? 흠, 어쨋든.
터치스크린이 모바일 기기의 대세로, 다시 휴대폰의 총아로 떠오르는 이 마당에 한물 간 음성인식을 들고 나온 기사가 있다. "미래 휴대폰 변화의 주역은 '목소리'"라나.
http://www.inews24.com/php/news_view.php?g_menu=020300&g_serial=274474
일단 고마운 일이지만... 역시 새로운 이슈도 새로운 해법도 나오지 않은 것 같다. 본문 중에는 30% 실제 인식률을 이야기하고, 최근 일을 하다가 뭔가 비슷한 숫자를 듣기는 했지만, 여전히'랩' 인식률은 아래 표와 같이 보고되는 모양이다.
연구기관 | 시스템 | 특징 | DB | 단어 규모 | 인식률 |
IBM | Tangora | 고립단어인식 | 영어 | 2만 | 95% |
NEC | 고립단어인식 | 일본어 | 1천800 | 97.5% | |
ATR | 연속음성인식 | 일본어 | 1천35 | 95.3% | |
SRI | DECIPHER | 연속음성인식 | 영어 | 1천 | 95.2% |
CMU | SPHINX | 연속음성인식 | ATIS | 3천 | 95% |
Ney | 연속음성인식 | NAB`94 | 2만 | 84.6% | |
Cambridge | HTK | 연속음성인식 | HUB4 | 3만2천800 | 83.8% |
KAIST | 연속음성인식 | 한국어 | 3천64 | 96.7% |
표. 국내외 음성인식 기술수준의 비교 (출처 : 카이스트)
이 간격을 어쩌면 좋을꼬... 여기에 사용자가 원하는 수준("꼭 100%를 원하는 건 아니예요...")까지 더해지면 뭐 말 다 했지. 삼성전자 담당자가 이야기했다는 "인식률을 획기적으로 높일 수 있는 기술"은 이미 개발되어 있다. 여러가지 접근 방법과 알고리듬, 하드웨어에서부터 온갖 트릭에 이르기까지...
누가 먼저 용기 and/or 확신을 가지고 쓰느냐. 그게 남았을 뿐인 것 같다.
반응형