Ведущие

научные

школы

Ведущие научные школы, работающие в институте в настоящее время и получившие признание в Республике Беларусь и за ее пределами

Распознавание и синтез речи


Основатель и лидер научной школы: доктор технических наук Б.М. Лобанов.
Участники научной школы: кандидат филологических наук Е.Б. Карневская, кандидат технических наук Б.В. Панченко, кандидат технических наук А.С. Рылов, кандидат технических наук М. Фатеев, кандидат технических наук Т.В. Левковская, доктор психологических наук Г.В. Лосик, Н.П. Дегтярёв, Л.Д. Бухтилов, В.В. Минкевич, Л.М. Первой, С.Н. Никифоров, В.В. Шатерник, А.Н. Иванов, А.В. Кубашин, Л.И. Цирульник, В.В. Киселёв, А.Г. Давыдов, Д.В. Жадинец.
Основные научные  направления:
  • многоязычный и многоголосый синтез речи по тексту;
  • компьютерное клонирование персонального голоса и речи;
  • робастное распознавание дискретной и слитной речи;
  • обнаружение ключевых слов в потоке речи;
  • компьютерные системы реабилитации инвалидов слуха и зрения.
Основные научные результаты
  • разработаны теория и алгоритмы высококачественного многоязычного  и многоголосого синтеза речи по тексту;
  • впервые сформулирована постановка и решение проблемы компьютерного клонирования персонального голоса и дикции человека в процессе синтеза речи по тексту;
  • разработаны теория и базовые алгоритмы анализа и распознавания слов в текущем речевом потоке в условиях наличия разного рода акустических помех.
Основные практические результаты     
Разработаны и использованы в прикладных системах:
  • впервые в СССР - русскоязычный синтезатор речи «ФОНЕМАФОН» и многофункциональный автомат распознавания и синтеза речи «МАРС», доведенные до уровня серийных  промышленных образцов (1985);
  • аппаратно-программный комплекс многоязычного и многоголосого синтеза речи для белорусского, русского, польского и чешского языков (1990);
  • система многодикторного распознавания в шумах слитных речевых команд для голосового управления приборами самолета (1995);
  • система распознавания произносимых имён для интеллектуального телефонного секретаря-автоответчика (1998);
  • система распознавания цифр и названий букв для регистрации парковки автомобилей с помощью мобильного телефона (2000);
  • высококачественный многоязычный и многоголосый синтезатор речи по тексту на  основе аллофонного  описания элементов речи. Языки: Русский, Польский, Белорусский (2002);
  • система распознавания ключевых слов в потоке речи (2003);
  •  виртуальный голосовой собеседник (2004).
Выполненные совместные международные проекты
  • «Двуязычный синтез речи - немецкий / русский». Дрезденский университет, Германия. Фонд FTU Karlsruhe (1995-97).
  • «Анализ естественного языка и речи». Саарбрюкенский Университет, Германия; Университет Манчестера, Великобритания; Институт информационных проблем, Россия. Фонд: INTAS (1996-98).
  • «Распознавание зашумлённой речи». Секстант Авионик, Франция. Фонд Министерства обороны (1996-97).
  • «Распознавание речи по телефону». Компания NovCom NV, США.
  • «Говорящий компьютер для слепых пользователей». Фонд Сороса (1998).
  • «Пакет говорящих программ для инвалидов по зрению», Ставропольская и Тульская библиотеки для слепых, Россия; Центральное правление Украинского Общества слепых (1994-95).
Опубликовано свыше 300 научных работ, в т.ч. 6 монографий, 45 статей и докладов в международных изданиях, 25 изобретений.
Защищены 5 кандидатских диссертаций и одна докторская. Готовятся к защите 4 кандидатские диссертации.