Впервые разработчики вплотную подошли к созданию промышленной системы распознавания русской речи

Author:

Intel, 28.11.2001

МОСКВА, 28 ноября 2001 г. — Сегодня компании Intel и Cognitive Technologies представляют результаты реализации инвестиционного проекта по развитию систем распознавания русской речи. Достигнутые результаты позволяют говорить о том, что компании вплотную подошли к созданию промышленной системы распознавания русской речи и разработке дальнейших направлений применения систем распознавания в мобильной связи, голосовых порталах и системах голосового управления.

В результате реализации проекта впервые в России создан обширный инструментарий для разработки систем распознавания речи, который включает крупный речевой корпус русского языка RuSpeech, достаточный для распознавания естественной речи говорящего в реальном времени. Сложность создания такого корпуса объясняется, в первую очередь, сложностью грамматики и фонетики русского языка, а его масштабность может конкурировать с лучшими мировыми речевыми корпусами, созданными для распознавания речи. RuSpeech является речевой базой данных, с которой компьютер сможет «сверять» естественную речь диктора, распознавая не только слова, уже присутствующие в базе, но и отдельные фонемы и последовательности фонем русского языка, что позволит минимизировать количество ошибок при распознавании новых, отсутствующих в корпусе слов.

Тексты для речевого корпуса создавались 220 дикторами, каждый из которых прочел, в среднем, более 250 предложений. В состав речевого корпуса входит более 50 тыс. предложений с фонетической разметкой каждого произнесенного предложения. RuSpeech содержит порядка 50 часов непрерывной речи объемом 15 Гб, размещаемых на 30 c лишним компакт-дисках. Объем этого речевого корпуса в несколько раз превышает популярные речевые базы английского языка WSJ Speech и TIMIT.

Фактически это означает, что впервые появился инструмент для создания дикторонезависимой системы распознавания русской речи. Интеграция созданного инструментария с имеющимися передовыми технологиями анализа и распознавания речи приведут к решению этой задачи в самое ближайшее время.

Результаты этой разработки могут быть использованы в:

— голосовых порталах;
— голосовом управлении в телефонии (справочные службы, телефонный доступ к электронной почте, голосовой набор номера);
системах диктовки.

Технологиями распознавания научный коллектив, на базе которого была создана компания Cognitive Technologies, занимался еще с середины 70-х гг. в рамках исследования и создания систем искусственного интеллекта, а с 1993 г. активно вел разработки в области распознавания речи наряду с системами распознавания графических изображений. Тем не менее, в связи с целым рядом существовавших технических проблем — необходимость обучать систему голосу конкретного пользователя, зависимость от оборудования, малый словарный запас — разработки носили скорее научный, перспективный характер и были далеки от промышленного применения, а сфера практического применения такого рода систем была не вполне ясна как в России, так и в мире в целом.

За последние годы большая часть технических проблем, в том числе, дикторозависимости и аппаратных требований, была в значительной мере снята, а мировой объем рынка таких систем только в 2001 г. оценивается компанией Datamonitor в $650 млн. По прогнозам компании, в ближайшие 5 лет этот рынок увеличится почти в 10 раз и составит $5,6 млрд. По оценкам департамента маркетинга компании Cognitive Technologies, объем рынка речевых технологий в России к 2006 г. может составить порядка $200 млн. Это обусловлено большой востребованностью данных технологий, в том числе в мобильной телефонии и голосовых порталах. Такое состояние рынка, перспективность разработок в области речевых технологий, а также отсутствие систем распознавания русской речи и побудило компанию Intel инвестировать в проект создания русскоязычных речевых систем.

Информация о компании Intel

Корпорация Intel является крупнейшим в мире производителем микропроцессоров, а также одним из ведущих производителей оборудования для персональных компьютеров, компьютерных сетей и средств связи. Дополнительную информацию об Intel можно получить на сервере корпорации в World Wide Web по адресу , а также на русскоязычном Web-сервере фирмы Intel ().
Тел. Intel: 721-4900

Информация о компании Cognitive Technologies

Cognitive Technologies Ltd. является ведущим проектным интегратором и поставщиком прикладных решений в областях Корпоративных Информационных Систем, финансовых систем, реестров и баз данных, делопроизводства, документооборота, ввода данных в информационные системы, а также технологий искусственного интеллекта, Интернет/Интранет, Business Intelligence, оптического распознавания (OCR/ICR), архивации, поиска и извлечения документов (Document Image Processing, Search & Retrieval), обработки изображений документов, потокового ввода документов и ввода стандартных форм документов.

Компания была создана в 1993 году на базе лаборатории искусственного интеллекта Института Системного Анализа РАН (бывший ВНИИСИ АН СССР), руководимой профессором, доктором технических наук, Арлазаровым В.Л. Под непосредственным руководством Владимира Арлазарова создавались программа «Каисса» (первый чемпион мира по шахматам среди компьютеров) и СУБД «ИНЭС» (2000 инсталляций в крупнейших государственных структурах Советского Союза).

В компании работает три доктора наук и пятнадцать кандидатов наук. В настоящий момент компания насчитывает 297 сотрудников.

Тел. Cognitive Technologies: 135 8968, 135 5510, e-mail: [email protected] , Интернет: www.cognitive.ru