Разработка метода распознавания слитной речи применительно к компьютерному анализу тема диссертации и автореферата по ВАК РФ 05.13.16, кандидат технических наук Тыщенко, Григорий Анатольевич
- Специальность ВАК РФ05.13.16
- Количество страниц 156
Оглавление диссертации кандидат технических наук Тыщенко, Григорий Анатольевич
ВВЕДЕНИЕ
ГЛАВА 1. ОБЩИЕ ПРОБЛЕМЫ ПОСТРОЕНИЯ СИСТЕМ ЕСТЕСТВЕННОГО ДИАЛОГА '
§1.1. Анализ проблем создания систем естественного диалога
§1.2. Модельное представление процессов речеобразования, выявление наиболее информативных параметров
§1.3. Общие проблемы распознавания речи и ее сегментации, методы распознавания речевого сигнала . . 26 ПОСТАНОВКА ЗАДАЧИ
ГЛАВА 2. ФОРМИРОВАНИЕ РЕЧЕВЫХ ОБРАЗОВ И ИХ РАСПОЗНАВАНИЕ
§2.1. Фонемо-слоговая сегментация речевого сигнала
§2.2. Фонемо-слоговый анализ распознавания речевой информации
§2.3. Распознавание речевой информации в потоке слитной речи с использованием лингвистического анализатора
§2.4. Выводы
ГЛАВА 3. ПОСТРОЕНИЕ СИСТЕМЫ КОМПЬЮТЕРНОГО АНАЛИЗА ЕСТЕСТВЕННОЙ РЕЧИ НА ОСНОВЕ СЕМАНТИЧЕСКИХ СЕТЕЙ
§3.1. Анализ вводимых данных и вопросов
§3.2. Генерация ответов по заданному вопросу
§3.3. Выводы 125 ЗАКЛЮЧЕНИЕ 126 БЛАГОДАРНОСТИ 128 СПИСОК ЛИТЕРАТУРЫ 129 ПРИЛОЖЕНИЕ 1
ВВЕДЕНИЕ
Быстрый технический прогресс и повсеместное проникновение вычислительной техники в научную и повседневную деятельность за последние десятилетия сделали актуальной проблему создания средств общения между человеком и вычислительной техникой в режиме естественного диалога. Решение данной задачи предполагает создание речевых интерфейсов ввода-вывода, с помощью которых вычислительная техника будет способна не только распознавать сказанное человеком, но и анализировать полученную информацию. В основе этой проблемы лежит практическая необходимость создания систем передачи информации с повышенной эффективностью и высокой помехоустойчивостью, систем автоматического управления машинами с помощью голоса, информационно-справочных систем с распознаванием речевых сигналов и речевым ответом, переводчиков с голоса, медицинских систем диагностики и т. д. На текущий день задачи, связанные с распознаванием и анализом естественной речи, еще далеки от полного решения в отличие от синтеза речи.
В настоящее время существуют и частично внедрены в практику системы высококачественной цифровой передачи речевых сигналов, разработаны системы вокодерной передачи, промышленностью и рядом коммерческих фирм выпускаются устройства распознавания и синтеза речевых сигналов, разработаны системы идентификации личности по речевым сигналам, информационно-справочные системы, экспертные системы [1-12]. Экспертной является система, которая располагает экспертными правилами, не прибегая к слепому поиску, работает хорошо, рассуждает путем оперирования с символами, владеет фундаментальными принципами из предметной области и прибегает к более слабым методам рассуждений в тех случаях, когда не срабатывают экспертные правила и когда необходимо строить объяснения.
Однако, несмотря на достигнутые успехи, проблема распознавания произвольной речи и компьютерного анализа речевой информации еще далека от полного решения.
На сегодняшний день для существующих систем распознавания произвольной речи характерен ряд важных ограничений: чувствительность к смене параметров речевого тракта (смена диктора), чувствительность к четкости произношения, неспособность к распознаванию слитной речи.
Существующие информационно-справочные и экспертные системы характеризуются такими ограничениями, как узкая направленность, необходимость дополнительного обучения при работе с такими системами, сложность поиска требуемой информации. Кроме того, заполнение таких систем производится только экспертами в данной области и разработчиками данных систем. Все эти проблемы, возникающие при попытке создания систем подобного рода, обусловлены отсутствием единой теории общения, охватывающей все аспекты взаимодействия человека с окружающим миром, и выбором программно-инструментальных средств для проектирования данных систем.
Следовательно, важнейшей задачей является создание методов, допускающих применение разработанной теории цифровой обработки сигналов и теории представления знаний, разработка алгоритмов, учитывающих реальную структуру речевого сигнала и представления знаний и ориентированных на техническую реализацию с использованием средств вычислительной техники.
Цель диссертации заключается в следующем: разработка метода сегментации слитной речи на основе модельных представлений речевого сигнала; разработка и исследование метода распознавания слов в слитной речи; реализация системы компьютерного анализа речевой информации.
Научная новизна работы состоит в том, что в ходе проведенных исследований были получены следующие результаты:
1) предложен новый принцип автоматической сегментации слитной речи на основе теории речеобразования;
2) разработана новая методика пословного распознавания слитной речи на основе фонемо-слогового анализа;
3) впервые установлено, что использование предложенной автоматической сегментации при пословном распознавании слитной речи позволяет снизить влияние смены параметров речевого тракта на процесс распознавания;
Научная и практическая значимость работы. Разработанный в диссертации метод автоматической сегментации и распознавания слитной речи может быть применен для создания высокоэффективных систем распознавания слитной речи. Методика распознавания речевой информации была использована для создания пакета обучающих программ в игровом варианте для школы-центра медико-социальной реабилитации детей с нарушением слуха г. Волгограда. Разработанная методика компьютерного анализа естественной речи позволяет глубже понять принципы работы подобных систем, что также может представлять интерес с точки зрения проектирования систем естественного диалога между человеком и вычислительной техникой.
Степень обоснованности результатов и выводов диссертации подтверждается применением при решении поставленных задач строгих математических методов в рамках границ их применимости и сравнением полученных в работе результатов с соответствующими результатами известных экспериментальных работ.
Публикации. Основные результаты исследований по теме диссертации опубликованы в 10 печатных работах [13-22].
Апробация работы. Основные результаты диссертационной работы были представлены на Второй Всероссийской НТК с международным участием «Электроника и информатика - 97» (Россия, Москва, 1997), на V
Международной конференции «Математика, компьютер, образование» (Россия, Дубна, 1998), на VI Международной конференции «Математика, компьютер, образование» (Россия, Пущино, 1999), на Второй Международной конференции «Цифровая обработка сигналов и ее применение» (Россия, Москва, 1999), на VII Международной конференции «Математика, компьютер, образование» (Россия, Дубна, 2000), а также на конференциях и семинарах ВолГУ и ВолГТУ.
Структура работы. Диссертация состоит из введения, трех глав, заключения, пяти приложений и списка литературы, включающего 101 наименований. Работа содержит 138 страниц основного текста, в том числе 82 рисунка и 5 таблиц. В приложения входят алгоритмы программ и акты о внедрении материалов диссертационной работы.
Рекомендованный список диссертаций по специальности «Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)», 05.13.16 шифр ВАК
Автоматический анализ, распознавание и синтез тональной речи (на материале вьетнамского языка)1984 год, доктор технических наук Нгуен Ань Туан, 0
Математические модели и комплекс программ для автоматической оценки качества речевого сигнала2002 год, кандидат технических наук Николаев, Алексей Николаевич
Исследование и разработка алгоритмов и программ автоматического распознавания ограниченного набора команд вьетнамской речи2010 год, кандидат технических наук Нгуен Ван Хунг
Разработка адаптивного метода робастного понимания слитной речи на основе интегральной обработки данных2003 год, кандидат технических наук Ронжин, Андрей Леонидович
Моделирование эмоциональных реакций пользователя при речевом взаимодействии с автоматизированной системой2009 год, кандидат технических наук Розалиев, Владимир Леонидович
Введение диссертации (часть автореферата) на тему «Разработка метода распознавания слитной речи применительно к компьютерному анализу»
В первой главе диссертации, носящей обзорный характер, проведен сравнительный анализ существующих методов проектирования автоматизированных систем анализа речевой информации, включающих способность к общению с человеком на естественном языке.
Далее рассмотрены модельные представления процессов речеобразо-вания и общие проблемы распознавания и сегментации* речевого сигнала. Рассмотрены существующие методы распознавания речевого сигнала. Обсуждаются вопросы практической реализации алгоритмов цифровой Задача сегментации речевого сигнала рассматривается как задача членения речевого сигнала на функционально значимые отрезки, в пределах которых параметры сигнала (оконный спектр и др.) практически неизменны. обработки речевых сигналов, повышения их эффективности и качества получения характеристик.
Во второй главе, носящей оригинальный характер, предложена новая методика автоматической сегментации слитной речи в рамках линейной модели речеобразования.
Разработана методика моделирования аналога нейронной сети для распознавания фонем и слогов речевого сигнала на основе кусочно1 линейного алгоритма. Проанализировано использование аналога нейронной сети совместно с лингвистическим анализатором для распознавания слов потока слитной речи.
В третьей главе в качестве приложения к системе распознавания слов слитной речи предложена интерпретация компьютерного анализа речевой информации в ПЭВМ с использованием семантических сетей применительно к системам «вопрос-ответ». Проанализирован случай, связанный с возникновением спорных ситуаций при переводе естественной речи на внутренний язык машины. Определены условия в рассматриваемой задаче. Разработана методика генерации ответов с внутреннего представления машины на язык общения между людьми.
В заключении сформулированы основные результаты и краткие выводы из представленной диссертации.
Основные положения, выносимые на защиту:
1. Разработанная методика сегментации слитной речи в рамках линейной модели речеобразования позволяет в потоке слитной речи выделять границы переходных участков между фонемами и слогами.
2. Методика распознавания фонем и слогов речевого сигнала с. использованием моделирования аналога нейронной сети позволяет производить обучение системы более эффективно по сравнению с использованием кусочно-линейного алгоритма. 9
3. Методика пословного распознавания слитной речи на основе фо-немо-слоговой сегментации и использования лингвистического анализатора в качестве координирующего устройства системы распознавания позволяет увеличить вероятность распознавания слитнойречи.
Похожие диссертационные работы по специальности «Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)», 05.13.16 шифр ВАК
Разработка и исследование методов повышения эффективности программно-аппаратных вычислительных средств обработки речевых сигналов1999 год, кандидат технических наук Федоренко, Олег Григорьевич
Разработка и исследование математических моделей обработки и распознавания речи на основе множественных баз признаков1999 год, кандидат технических наук Леднов, Дмитрий Анатольевич
Алгоритмы распознавания речевых команд в управляющих системах2006 год, кандидат технических наук Литвиненко, Сергей Леонидович
Исследование и разработка нейросетевых методов анализа и обработки речевого сигнала в задаче распознавания речи2006 год, кандидат технических наук Кушнир, Дмитрий Алексеевич
Модели и программная реализация распознавания русской речи на основе морфемного анализа2007 год, кандидат технических наук Карпов, Алексей Анатольевич
Заключение диссертации по теме «Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)», Тыщенко, Григорий Анатольевич
§3.3 Выводы
Разработана система для анализа вводимой речевой информации, в основе которой лежат семантические сети. Анализ полученной системы показал:
1. Вероятность правильного анализа предложения составляет 90% по 300 реализациям вводимых предложений.
2. Добавление нового семантического ограничения при наложении семантической сети на предложение не влияет на другие семантические ограничения.
3. Введенный компромисс записи найденных слов предложения как в одну, так и в другую группу понятий гарантирует правильное нахождение требуемого ответа на поставленный вопрос пользователя при возникновении спорных ситуаций по идентификации слов предложения с известными системе понятиями.
4. Полученная система компьютерного анализа позволяет эффективно производить пополнение баз данных вводимыми предложениями и находить требуемую информацию в системе исходя из требований поставленного пользователем вопроса без непосредственного вмешательства человека.
5. Структура системы позволяет произвести в дальнейшем ее адаптацию к более адекватному восприятию сложных, нестандартных конструкций предложений, что делает возможным использование представленной системы при проектировании электронных секретарей, способных общаться с человеком на естественном языке.
126
ЗАКЛЮЧЕНИЕ
В ходе выполнения диссертационной работы были получены следующие результаты:
1. Предложена новая методика сегментации слитной речи в рамках линейной модели речеобразования, в основе которого лежит вычисление площади сечения речевого тракта. Данный метод позволяет определить границы переходных участков между слогами и фонемами с вероятностью 96% по 500 реализациям речевых сегментов из вводимых фраз естественной речи. Предложенный метод фонемо-слоговой сегментации слитной речи позволяет снизить влияние изменения параметров речевого тракта на процесс распознавания речевого сигнала.
2. Разработана методика распознавания фонем и слогов речевого сигнала с использованием моделирования аналога нейронной сети, которая позволяет распознавать фонемы и слоги, с вероятностью 95% по 800 реализациям распознавания речевых сегментов (при условии, что АНС настроен на одного диктора). Вероятность распознавания фонем и слогов другими дикторами составляет 88% по 450 реализациям распознавания речевых сегментов.
3. Разработана система распознавания слитной речи на основе фонемо-слоговой сегментации, которая позволяет распознавать слова слитной речи с вероятностью 80% по 100 реализациям вводимых фраз (при условии, что АНС настроен на одного диктора). Для других дикторов без обучения АНС вероятность распознавания слов слитной речи составляет 71%.
4. Предложена структура построения системы компьютерного анализа вводимой речевой информации, которая позволяет правильно анализировать предложения с вероятностью 90% по 300 реализациям предложений, а также производить пополнение баз'данных вводимыми
127 предложениями и находить требуемую 1 информацию в системе без непосредственного вмешательства человека.
128
БЛАГОДАРНОСТИ
Автор считает своим долгом выразить благодарность своему научному руководителю Заярному В.П. за постановку задачи, внимание и интерес к работе диссертанта.
Кроме того автор выражает благодарность сотрудникам кафедры Прикладной физики за моральную и «голосовую» поддержку во время работы над диссертацией.
Особую благодарность автор выражает своей маме Тыщенко Е.А. и своему другу Протопоповой H.H.
Список литературы диссертационного исследования кандидат технических наук Тыщенко, Григорий Анатольевич, 2000 год
1. Калинцев Ю.К. Разборчивость речи в цифровых вокодерах. М.: Радио и связь, 1991.
2. Beskow J, Elenius К & McGlashan S. The OLGA project: An animated talking agent in a dialogue system. In: Bannert R, Heldner M, Sullivan К & Wretling P, eds., Proc of Fonetik -97, Dept of Phonetics, Umee Univ., 1997, Phonum 4: 69-72.
3. Рабинер Л., Шафер P. Цифровая обработка речевых сигналов // Пер. с англ. М.: Радио и связь, 1981.
4. Алексеев В. Услышь меня, машина // Компьютерра, 1997, № 49 (226), С. 32-39.
5. Шмелева А. Правда о распознавании речи // Компьютер Пресс, 1998, № 1, С. 306-316.
6. Рахилина Е.В. Семантика локативных вопросов. // Вопросы кибернетики. Проблемы разработки формальной модели языка. Москва, 1988, С. 87-100.
7. Крючкова E.H. Математическая модель естественного языка как основа реализации человеко-машинного интерфейса // Инф. Системы в экон., экол. и образ. / Алт. гос. гехн. ун-т Барнаул, 1997, С. 90-94.
8. Чекмарев А. Речевые технологии: проблемы и перспективы // Компьютерра, 1997, № 49 (226), С. 28-31.
9. Болотова Л.С., Волкова В.Н. Экспертные системы в новых информационных технологиях // Новые информационные технологии в системотехнике. М.:.Мир, 1990.
10. Шмелева А. Увидеть звук // Мир ПК, 1998, № 9, С. 48-55.
11. Мястковски С. Мы можем поговорить ? // Мир ПК, 1999, № 3, С. 41-47.
12. Статистические и динамические экспертные системы: Учеб. Пособие для вузов // Попов ЭВ., Фоминых И.Б., и др. М.: Финансы и статистика. 1996. - 320 с.
13. Заярный В.П., Сарана Д.В., Евстратов И.В., Тыщенко Г.А. Моделирование речевого тракта, определение параметров и распознавание речевого сигнала // В сб. «Вестник ВолГУ», вып. 2, Сер. Математика, физика 1997, С. 137-144.
14. Тыщенко Г.А., Заярный В.П., Сарана Д.В., Евстратов И.В. Проблема решения задачи выделения слов в потоке слитной речи при распознавании речевых сигналов // Тез. докл. на VI Межд. конф. «Математика, компьютер, образование», Пущино 1999, с. 278.
15. Заярный В.П., Сарана Д.В., Тыщенко Г.А. Комбинированный аналого-цифровой преобразователь ' для компьютерных измерительных систем // В сб. «Автоматизация технологических процессов в машиностроении» ВолГТУ, Волгоград 1997, С. 123126.
16. Сарана Д.В., Тыщенко Г.А., Евстратов И.В., Заярный В.П. Распознавание речевой информации по измеренной функции возбуждения. // Вторая Всероссийс. НТК с межд. участием «Электроника и информатика 97», - Москва 1997, с. 24.
17. Сарана Д.В., Тыщенко Г.А., Заярный В.П. Вероятностный метод распознавания слитной речи с применением лингвистического предсказания//В сб. «Вестник ВолГУ», вып. 3, Сер. Математика, физика 1998, С. 170-175.
18. Тыщенко Г.А., Заярный В.П. Осмысление понятий при распознавании речевой информации // В'сб. труд, молод, учен, и студ. Волгогр. гос. ун-та. Волгоград: Изд-во ВолГУ, 1997. - С. 298-300.
19. Тыщенко Г.А., Заярный В.П. Компьютерное осмысление понятий при распознавании речевой информации в рамках искусственного интеллекта // Тез. докл. на V Межд. конф. «Математика, компьютер, образование», Дубна-1998, с. 203.
20. Тыщенко Г.А., Сарана Д.В., Евстратов И.В., Заярный В.П. Самообучающаяся компьютерная система «вопрос-ответ» II Информационные технологии. 1999. № 5. С. 36-38.
21. Тыщенко Г.А., Фонемо-слоговая сегментация речевого сигнала в потоке слитной речи // Вторая Межд. конф. «Цифровая обработка сигналов и ее применение», Москва 1999, с. 543.
22. Тыщенко Г.А., Заярный В.П. Распознавание речевых образов при моделировании вероятностного аналога • нейронной сети // Тез. докл. на VII Межд. конф. «Математика, компьютер, образование», Дубна-2000, с. 324.
23. Откупщикова М.И., Игнатова В.Н., Кремнева Н.Д. Универсальное и специальное в лингвистическом обеспечении системы анализа с заданным уровнем понимания //Структур, и прикл. лингв. 1998, № 5, С. 151-171.
24. Исследование по логике научного познания. М.: Наука, 1990.
25. Будущее искусственного интеллекта. М.: Наука, 1991.
26. Бондаренко М.Ф., Терзиян В .Я., Попков И.И. Моделирование лингвистических знаний в интеллектуальных естественно языковых интерфейсах // Харьк. ин-т радиоэлектрон. Харьков, 1992. 235 с.
27. Искусственный интеллект: В 3 кн. Кн.1: Системы общения и экспертные системы: // Справочник под ред. Э.В. Попова. М.: Радио и связьД 990.
28. Слейгл Дж. Искусственный интеллект. М.: Мир, 1973.
29. Уинстон П. Искусственный интеллект. М.: Мир, 1980.
30. Георгиев В.О. Модели представления знаний предметных областей диалоговых систем (обзор) // Изв. АН СССР, Техн. Киберн., 1991, №5, С. 3-23.
31. Хант Э. Искусственный интеллект. М.: Мир, 1978.
32. Эндрю А. Искусственный интеллект: Пер. с англ. // Под ред. Д.А. Поспелова. М.: Мир, 1985.
33. Кузин JI.T. Основы кибернетики. Т. 2 Основы кибернетических моделей М.: Энергия, 1979.
34. Вудс В.А. Сетевые грамматики для анализа естественных языков. В кн.: Кибернетический сборник. Новая серия. Вып. 13 М.:Мир, 1976, С. 120-158.
35. Соловьев С.Ю., Соловьева Г.М. Представление знаний в системах альтернатив // Логико-комбинаторные методы в искусственном интеллекте и распознавание образов. Кишинев, 1985.-С. 16-25.
36. Виноград Т. Программа, понимающая естественный язык . М.: Мир, 1976.
37. Марселлус Д. Программирование экспертных систем на ТУРБО ПРОЛОГЕ // Пер. с англ. И.И. Чижикова. Предисл. C.B. Трубицына. М.: Финансы и статистика, 1994, С. 255.
38. Одинцов Б.Е. Ассоциативные знания в машинном воображении и мышлении // Приборы и системы управления, 1998, № 6, с. 3235.
39. Одинцов Б.Е. Пресуппозиция в ассоциативных сетях и машинное понимание текстов. Львов: ЛГУ, 1996.
40. Одинцов Б.Е., Дик В.В. Синтаксичность моделей баз знаний интеллектуальных систем // Приборы и системы управления, 1998, №1, с. 15-17.
41. Маркел Дж. Д., Грей А. X. Линейное предсказание речи // Пер. с англ.-М.: Связь, 1980.
42. Сорокин В. Н. Теория речеобразования. М.: Радио и связь, 1985.
43. Сапожков М. А. Речевой сигнал в кибернетике и связи,-М:Связьиздат, 1963.
44. Фант М. Акустическая теория речеобразования // Пер с англ. -М.: Наука 1964.
45. Жинкин Н.И. Механизмы речи. М.: АПНР РСФСР, 1958, 370 с.
46. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов // Пер. с англ. М.: Мир, 1978.
47. Fant G. The voice source in connected speech. Speech Comm 22: 1997, P. 125-139.
48. Vaseghi S.V. Advanced Signal Processing and Digital Noise Reduction. John Wiley & Sons Ltd., 1996, P. 397.
49. Коротаев Г.А. Некоторые аспекты линейного предсказания при анализе и синтезе речевого сигнала // Зарубежная радиоэлектроника. -1991. №7. С. 3-15.
50. Atal, B.S.: Determination of the Vocal Tract Shape Directly from the Speech Wave. J. Acoust. Soc.Am. 47, 65(A), 1970b.
51. Wakita H.: Estimation of the Vocal Tract »Shape by Optimal Inverse Filtering and Acoustic/Articulatory Conversion Methods. SCRL
52. Monograph No. 9, Speech Communications Research Laboratory, Santa Barbara, California, 1972.
53. Гольденберг JI. M. Цифровая обработка сигналов. М.: Радио и связь, 1990.
54. Hugberg J. Prediction of formant frequencies from linear combinations of filterbank and cepstral coefficients. TMH-QPSR, KTH, 4/1997: P.41-49.
55. Применение цифровой обработки сигналов. Под ред. Э. Оппенгейма // Пер. с англ. М.: Мир, 1980.
56. Каппелини В., Константинадис А. Дж., Эмилиани П. Цифровые фильтры и их применение // Пер. с англ. М.: Энергоатомиздат, 1983.
57. Гутников B.C. Фильтрация измерительных сигналов, Ленинград: Энергоатомиздат, 1990, С. 190.
58. Арутюнов ПЛ., Афанасьев К.С. Синтез цифровых фильтров при описании их сигнальными графами // Микроэлектроника, том 26, N1 1997.
59. Гутников B.C. Фильтрация измерительных сигналов, Ленинград: Энергоатомиздат, 1990, С. 190.
60. Потапова Р.К. Речевое управление роботом. М.: Радио и связь, 1989.
61. Потапова Р.К. Тайна современного кентавра. Речевое взаимодействие «человек машина». - М.: Радио и связь, 1992. -248 с.
62. Rose K.R., Hughes P.M. Speech systems // ВТ Technol. J. 1995. -13, №2. -P. 51-63.
63. Rabiner L.R., Juang B.H. Fundamentals of Speech Recognition // Englewood Cliffs, NJ: Prrentice-Hall, 1993.
64. Автоматическое распознавание и синтез речевых сигналов. Сб. науч. тр./ АНСР, Институт кибернетики им. В.М. Глушкова, Науч. совет АН СССР по пробл. "Кибернетика"; редколл.: Т.К. Винцюк и др.. Киев: ИК, 1989.
65. Анализ, распознавание и синтез речи // Под ред. В.Н. Трунина-Донского. М.: ВЦ АН СССР, 1987. -102 с.
66. Потапова Р.К. Лингвистические ограничения и сегментация слитной речи // Проблемы построения систем понимания речи. -М.: Наука, 1980.
67. Загоруйко Н.Г. Методы распознавания- и их применения. М.: Сов. Радио, 1972.
68. Кирилов С.Н., Стукалов Д.Н. Анализ речевых сигналов на основе акустической модели // Изв. РАН. Тех. кибернетика. 1994. №2. - С. 147-153.
69. Fant G. Acoustical analysis of speech. In: Crocker MJ, ed, Encyclopedia of Acoustics. New York: John Wiley & Sons, Inc., 1997 Vol 4, Chapt 127: 1589-1598.
70. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев, 1987.
71. Strom N. Speaker modeling for speaker-adaptation in automatic speech recognition. In: Johnson К & Mullennix J, eds. Talker Variability in Speech Processing. San Diego: Academic Press; 1997, P.167-190.
72. Jelinek F. Continuous speech recognition by statistical methods // Proc. IEEE, vol. PROC-64, 1976, P. 532-555.
73. Potapova R. One of the Methods of Automatic Syllable Segmentation for Connected Speech // Proc. Xl-th ICPhs. Tallin, 1987. - Vol. 5. - P. 385-387.
74. Allen J. How do humans process and recognize speech ? 11 IEEE Trans/ Speech and Audio Process, special issue on robust speech recognition, 1994, vol.2, P. 567-578.
75. Уровни языка в речевой деятельности: К проблеме лингвистического обеспечения автоматического распознавания речи // Под ред. Л.В. Бондаренко Л.:ЛГУ, 1986. - 269 с.
76. Иванова И.Д. Автоматическая сегментация речевого сигнала с целью получения частотных признаков гласных фонем // Первая Межд. конф. «Цифровая обработка сигналов и ее применения», Россия, Москва, 1998, том 4, С. 42-48.
77. Воробьев С.А. Алгоритмы обработки экспериментальных кривых с фрагментами повторяющейся формы нестабильной длины // Стат. Проблемы управления, вып.89, Вильнюс, ИМК АН Литвы, 1990, с. 144.
78. Цемель Г. И. Опознавание речевых сигналов. М.: Наука, 1971.
79. Коршунов Ю.М. Математические основы кибернетики, М.: Энергоатомиздат, 1987.
80. Смирнов В.Н., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики. М.: Наука, 1965.
81. Ярлыков M.C., Миронов М.А. Марковская теория оценивания случайных процессов. М.: Радио и связь, 1993, 462 с.
82. Вознесенский A.C. Информационные критерии качества распознавания состояний объектов и выбор параметров для его осуществления // Информационные технологии, 1996, № 5, С. 3540.
83. Горбань А.Н. Обучение нейронных сетей. М.: СП ПараГраф. 1990.
84. Strom N. Phoneme probability estimation with dynamic sparsely connected artificial neural networks // The Free Speech Journal, 1997, 1/5: 1-41.
85. Specht D.F. Probabilistic neural networks // Neural Networks, 1990, №3, P. 109-118.i
86. Wynne-Jones M. Constructive algorithms and pruning: Improving the multi layer perseptron. In: Vichnevetsky R., Miller JJH, editors. Proceeding of the 13th IMACS World Congress on Computation and Applied Mathematics; 1991 July; Dublin: 747-750.
87. Копосов А.И., Щербаков И.Б., Кисленко H.A., Кисленко О.П., Варивода Ю.В. и др. Создание аналитического обзора информационных источников по применению нейронных сетей для задач газовой технологии. ВНИИГАЗ, 1995.
88. Уоссермен Ф. Нерокомпьютерная техника. М.: Мир, 1992.
89. Wynne-Jones М. Node splitting: A constructive algorithm for feedforward neural networks // Neural Computing and Applications, v.l, No. 1, 1993, p. 17-22.
90. Ash T. Dynamic node creation in backpropagation networks. La Jolla (CA): Institute for cognitive Science, UCSD; 1989 Feb. Technical Report 8901.
91. Юдин А. А. Бифуркации стационарных решений в синергетической нейронной сети и управление распознаванием образов // Автоматика и телемеханика 1996.-Т. 11, С. 139-147.
92. Моттль В.В., Мучник И.Б. Скрытые марковские модели в структурном анализе сигналов. М.: ФИЗМАТЛИТ, 1999 352 с.
93. L. R. Rabiner A tutorial on hidden Markov models and selected applications in speech recognition // Proc. IEEE, vol. 77, Feb. 1989, pp. 257-285.
94. Адомиан Дж. Стохастические системы. Пер. с англ. М.: Мир, 1987,-376 с.
95. Рубанов JI. И. Метод классификации словаря дляпомехоустойчивой системы машинного понимания естественногоязыка // Изв. АН СССР, Техн. Киберн., 1991, № 5, С. 84-93.
96. Сопряжение датчиков и устройства ввода данных с компьютерами IBM PC: Пер. С англ. // Под ред. У. Томпкинса, Дж. Уэбстера. М.: Мир, 1992. - 392 С., ил.
97. Новиков Ю.В., Калашников O.A., Гуляев С.Э. Разработка устройств сопряжения для персонального компьютера типа IBM PC. Пракг. пособие. М.: ЭКОМ., 1998. 224 с.
98. Бондарев П.А., Силкин В.В. Программная реализация инструментальных средств для построения экспертных систем // Информационные технологии, 1998, № 9, С. 19-24.
99. Степашко B.C. О задаче структуризации знаний эксперта в области моделирования по эмпирическим данным // Кибернетика и вычислительная техника. 1991. Вып. 92, С. 80-83.
100. Искусственный интеллект. Применение в интегрированных производственных системах // Пер. с англ. А.П. Фомина М.: Машиностроение, 1991, 539 с.
101. Дарахвелидзе П.Г., Марков Е.П. Delphi среда визуального программирования: - СПб.: BHV - Санкт-Петербург, 1996, - 352 с.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.