Новая российская технология «Руссограф», созданная Центром Речевых Технологий, дает возможность выполнять распознавание слитной русской речи. Новая технология создавалась с учетом фонетических и грамматических особенностей русского языка. В ее разработке принимали участие специалисты в самых разных областях: в лингвистике, фонетике, математике, обработке сигналов и программировании. Для работы над проектом в ЦРТ использовали набор речевых баз данных, в который входят записи более чем 3000 дикторов общей длительностью около 300 часов, собранных с учетом 5 диалектных групп русского языка. Эти базы были использованы для создания акустических моделей звуков русской речи. Для создания языковых моделей в ЦРТ была собрана текстовая база русского языка объемом 35 миллионов слов. Для проведения экспериментальных исследований был развернут мощный вычислительный кластер с производительностью около 1012 операций в секунду. Важной частью проекта стало создание базового речевого декодера, который, используя оригинальные акустические и языковые модели русского языка, преобразовывает речевой сигнал в текст. Новая технология распознавания речи может использоваться в самых разных областях: для голосового управления компьютерной и бытовой техникой, промышленным оборудованием и транспортом; управления службами и сервисами по телефону; систематизации фонограмм и поиска по аудио архивам, а также обеспечения безопасности людей и объектов. Особенно актуальной новая разработка может стать для тех русскоговорящих людей, чьи физические возможности ограничены. Сейчас ЦРТ работает над аппаратной реализацией технологии. Уже в 2008 году компания обещает предложить несколько продуктов, построенных на основе технологии распознавания, в частности систему интерактивного голосового управления для контакт-центров, а также системы управления промышленными объектами. В перспективе компания планирует и создание на базе технологий распознавания и синтеза карманного переводчика устной русской речи. Данный продукт может быть подготовлен уже к Олимпиаде-2014 в Сочи. Благодаря этому, участники и гости Олимпиады из разных стран смогут говорить и понимать друг друга без посторонней помощи, даже не зная иностранного языка. Источник...
|