Компьютерное моделирование графемно-фонемного преобразования в английском языке тема диссертации и автореферата по ВАК РФ 10.02.21, кандидат филологических наук Корочков, Александр Викторович
- Специальность ВАК РФ10.02.21
- Количество страниц 396
Оглавление диссертации кандидат филологических наук Корочков, Александр Викторович
Введение.
Глава 1. Классификация и сравнение подходов к построению графемно-фонемного преобразования.
1.1. Классификация
1.2. Словесные подходы
1.3. Морфемные подходы.
1.4. Графемные подходы
1.5. Комбинированные подходы.
1.6. Сравнение подходов
Выводы по первой главе.:.
Глава 2. Графемные подходы.
2.1. Изученность вопроса (состояние дел).
2.2. Последовательность моделирования.
2.2.1. Источники правил.
2.2.2. Исходные наборы (своды) правил.
2.2.3. Дополнительная обработка.
2.2.4. Алгоритмизация и реализация.
2.2.5. Результаты моделирования.
2.3. Формальная система.
2.3.1. Операции и типы правил.
2.3.2. Упорядоченность правил.
2.3.3. Выбор правила для преобразования.
2.3.4. Представление объектов.
2.3.5. Конечный преобразователь.
Выводы по второй главе.
Глава 3. Моделирование процесса слогоделения.
3.1. Исходная задача.
3.2. Исходные правила.
3.3. Предварительная часть формализации.
3.4. Графемная сегментация и категоризация.
3.5. Слоговое маркирование.
3.6. Обработка буквы X.
3.7. Обработка начального слога.
3.8. Обработка конечного слога.
3.9. Набор правил маркирования.
3.10. Примеры анализа.
3.11. Проблема зияний и диграфов.
3.12. Вспомогательные правила.
3.13. Компонент слогоделения.
Выводы по третьей главе.
Глава 4. Моделирование процесса акцентуации.
4.1. Исходная задача.
4.2. Исходные правила.
4.2.1. Исходный набор правил
4.2.2. Мотивировка и примеры
4.3. Предварительная часть формализации.
4.3.1. Дополнительные свойства объектов
4.3.2. Дополнительные операции
4.4. Выделение частей слова.
4.5. Специальный морфологический анализ.
4.6. Правила акцентуации.
4.7. Предварительная инициализация.
4.8. Первичное ударение.
4.9. Вторичное ударение и терминация.
4.10. Компонент акцентуации.
4.11. Примеры анализа.
Выводы по четвертой главе.
Глава 5. Моделирование процесса определения типа слога.
5.1. Характеристики слога.
5.2. Определение модифицированности слога.
5.3. Первичная открытость/закрытость слога.
5.4. Вторичная закрытость слога.
5.4.1. Исходный набор правил
5.4.2. Мотивировка и примеры
5.4.3. Формализация.
5.5. Определение степени редукции.
5.5.1. Исходный набор правил
5.5.2. Мотивировка и примеры
5.5.3. Формализация.
5.6. Компонент определения типа слога.
5.7. Примеры анализа.
Выводы по пятой главе.
Глава 6. Моделирование процесса посимвольных преобразований согласных.
6.1. Введение.
6.2. Формулировка задачи.
6.3. Преобразование буквы В.
6.4. Преобразование буквы С.
6.5. Преобразование буквы D.
6.6. Преобразование буквы F.
6.7. Преобразование буквы G.
6.8. Преобразование буквы Н.
6.9. Преобразование буквы J.
6.10. Преобразование буквы К.
6.11. Преобразование буквы L.
6.12. Преобразование буквы М.
6.13. Преобразование буквы N.
6.14. Преобразование буквы Р.
6.15. Преобразование буквы Q.
6.16. Преобразование буквы R. vn 6.17. Преобразование буквы S.
6.18. Преобразование буквы Т.
6.19. Преобразование буквы V.
6.20. Преобразование буквы W.
6.21. Преобразование буквы X.
6.22. Преобразование буквы Z.
6.23. Удвоенные согласные звуки.
6.24. Последовательность обработки.
Выводы по шестой главе.
Глава 7. Моделирование процесса посимвольных преобразований гласных.
7.1. Исходная задача. ф 7.2. Преобразование буквы А.
7.3. Преобразование буквы Е.
7.4. Преобразование буквы 1.
7.5. Преобразование буквы 0.
7.6. Преобразование буквы U.
7.7. Преобразование буквы Y.
7.8. Выбор текущего элемента.
7.9. Примеры анализа.
Выводы по седьмой главе.
Глава 8. Компьютерное моделирование.
8.1. Реализация системы.
8.1.1. Язык программирования
8.1.2. Характеристики системы
8.2. Эталонные машиночитаемые словари.
8.2.1. Словарь Хорнби
8.2.2. Словарь Мюллера.
8.2.3. Словарь проекта CMU.
8.3. Оценочные процедуры.
8.4. Апробация системы на словарях.
8.4.1. Быстродействие и степень адекватности.
8.4.2. Влияние дополнительной разметки
8.4.3. Выводы по результатам эксперимента
Выводы по восьмой главе.
Рекомендованный список диссертаций по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Акустические и перцептивные корреляты цельнооформленности слога: экспериментально-фонетическое исследование на материале американской спонтанной речи2012 год, доктор филологических наук Андросова, Светлана Викторовна
Сопоставительное исследование членения частей речи в языках с развитым морфологическим строем: на материале русских и английских художественных произведений авторов XX века2009 год, кандидат филологических наук Кузьмина, Ирина Анатольевна
Структура слога в языках панджаби и хинди: Экспериментально-фонетическое исследование2003 год, кандидат филологических наук Шумская, Лола Шомахмадовна
Фонетические свойства звуковой системы сингальского языка как основа для автоматического транскриптора2003 год, кандидат филологических наук Хораканвелаге Сирисена
Функциональный анализ фонемно-графемных соответствий в письменной речи детей: На материале согласных2005 год, кандидат филологических наук Кузьмина, Татьяна Витальевна
Введение диссертации (часть автореферата) на тему «Компьютерное моделирование графемно-фонемного преобразования в английском языке»
наиболее эффективного подхода для использования в последующем компьютерном моделировании перехода; - выявление на основе введенной классификации структуры перехода, т.е. разбиение всего перехода на отдельные подэтапы; - определение последовательности моделирования; - описание формальных средств, которые могут быть достаточными для получения промежуточного формального описания, предназначенного для последующей реализации на одном из языков программирования; - описание при помощи этого формального средства каждого из выявленных подэтапов и его частичная (первичная) апробация путем анализа соответствующих примеров; - компьютерное моделирование полученного описания, т.е. его реализация на одном из языков программирования; - выбор или создание/модификация источников для апробации полученной компьютерной модели (машиночитаемых словарей соответстС4'^ вующей структуры, содержащих в словарных статьях результат эталонного транскрибирования); - построение оценочной процедуры; - апробация компьютерной модели при помощи этой процедуры и используемых источников, в частности, получение количественной оценки степени адекватности применяемых правил чтения для английского языка.Структура диссертации отражает ход исследования и соответствует последовательности решения сформулированных выше задач. Пер("^z вая глава посвящена рассмотрению возможных подходов, вторая - аналич /Л зу состояния дел в описании моделируемого объекта исследования и введению формальных средств, используемых для его описания. Главы с третьей по седьмую посвящены построению формальных моделей слогоделения, акцентуации, определения типа слога и посимвольного преобразования. Восьмая глава посвящена описанию создания компьютерной модели формализованного в предшествующих главах преобразования и ее апробации на материале машиночитаемых словарей (в частности, получению количественной оценки степени адекватности применяемых правил чтения для английского языка и влиянии на адекватность преобразования информации о частеречной и/или морфемной разметке). (*>• (^> Разработка теоретических положений и создание на их основе компьютерной модели графемно-фонемного преобразования для английского языка стало возможным благодаря комплексному использованию теоретических и экспериментальных методов исследования.Методология работы опирается на: - системный подход, позволяющий определить место предмета исследования диссертации в области обработки естественного языка; - монографический метод, предполагающий всестороннее, полное и детализированное описание исследуемого объекта, в данном случае этапа графемного-фонемного перехода; - проектный метод, определяющий целостность исследования, стадии и порядок его разработки; - абстрактно-логический метод, используемый при классификации подходов и описании исходных наборов правил; -моделирование как метод исследования структуры и основных свойств объекта моделирования; I'L - эмпирический метод, связанный с постановкой экспериментальных проверок теории (правил); - эмпирической основой работы послужили уже существующие и дополнительно созданные правила чтения.Научная новизна исследования определяется, во-первых, как постановкой самой проблемы полного формального описания этапа графемно-фонемного перехода для английского языка на основе существующих правил чтения, так и сущностью избранного подхода к ее решению. Названные выше цели и задачи исследования применительно к данному материалу ранее другими авторами не ставились. Во-вторых, впервые получена полная работающая компьютерная модель графемно-фонемного перехода (части этапа чтения графемного текста) для английского языка, основанного на традиционных правилах чтения. В-третьих, впервые получена количественная оценка степени адекватности применяемых правил чтения для английского языка, степени влияния на адекватность преобразования информации о частеречной и/или морфемной разметке и исчерпывающий список слов-исключений для этих правил, начинающихся с буквы А английского алфавита, и созданы предпосылки для получения полного исчерпывающего списка слов-исключений для этих же правил. * С'^ К результатам, выносимым на защиту, можно отнести следующие: 1. Логическая классификация возможных способов организации этапа графемно-фонемного перехода.2. Результаты сравнения возможных способов организации перехода и критерии, используемые для их получения.3. Описание структуры перехода для используемого подхода. (^ ( ^ i^L 4. Определение последовательности применения существующих правил чтения для реализации структуры перехода (алгоритмизация исходных правил чтения).5. Модифицированный вариант существующих исходных правил чтения и авторские правила.6. Формальное описание выявленных подэтапов перехода для английского языка.6.1. Формальное описание слогоделения.6.2. Формальное описание акцентуации.6.3. Формальное описание определения типа слога.6.4. Формальное описание посимвольных преобразований.7. Количественные оценки степени адекватности применяемых правил чтения для английского языка и степени влияния на адекватность преобразования информации о частеречной и/или морфемной разметке Теоретическая значимость работы. Теоретическая значимость полученных результатов состоит в том, что они могут быть использованы при построении как частных теорий графемно-фонемных переходов для других языков, так и общей теории графемно-фонемных переходов. Кроме того, полученные результаты могут послужить основой для построения типологии языков, базирующейся на степени сложности графемнофонемного перехода в языках и используемых при этом типах преобразований (правил).Практическая значимость исследования заключается в создании предпосылок для получения эффективного и компактного (для применения, например, в мобильных устройствах связи) программного и/или аппаратного лингвистического обеспечения синтеза речи, способного работать на неограниченном входном материале, что характерно для любых систем, построенных на правилах. * ' (+; ;ML. Результаты данного исследования могут быть также использованы в общих и специальных курсах языкознания и в практике обучения студентов английскому языку.Апробация работы. Основные идеи и результаты настоящего исследования обсуждались на Огаревских чтениях Мордовского государственного университета (Саранск, 2002), на международной конференции "Когнитивное моделирование в лингвистике" (Варна, 2003) и на международной конференции SPECOM' 2003 ("Речь и компьютер") (Москва, 2003). (J^ » ' (^ > С!^^
Похожие диссертационные работы по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Функциональные характеристики системы фонем: На материале лугомарийского, горномарийского, русского и немецкого языков2001 год, кандидат филологических наук Бондарева, Лариса Алексеевна
Образование новых консонантных групп в древнеанглийском языке1969 год, Гугелева, О. В.
Звуковая форма современного бурятского языка: Теоретические и практические аспекты качественного и количественного анализа2003 год, доктор филологических наук Раднаева, Любовь Дашинимаевна
Орфографические инновации в немецком языке в конце XIX - XX веках2003 год, кандидат филологических наук Вульфф, Надежда Владимировна
Фонемная структура лексики английского языка1974 год, кандидат филологических наук Слипченко, Л. Д.
Заключение диссертации по теме «Прикладная и математическая лингвистика», Корочков, Александр Викторович
Выводы по восьмой главе
1. Завершающим этапом моделирования является построение компьютерной модели.
2. Компьютерно реализованные правила могут быть представлены достаточно компактно. Объем созданных баз данных правил-27 и 105+14 килобайт.
3. Для проведения лингвистических экспериментов (компьютерной апробации модели) необходимо наличие машиночитаемых версий обычных словарей.
4. Исходные словари могут отличаться фонемным описанием одних и тех же единиц, что может потребовать проведения их синхронизации.
5. Также необходимо наличие некоторой оценочной процедуры, выявляющей среднее время на обработку одного слова и словесную и фонемную адекватность построенной системы. Вычисление первых двух характеристик является достаточно тривиальной задачей, вычисление же последней требует решения проблемы соотнесенности сравниваемых значений фонем. Для решения этой проблемы может быть использована 82 шаговая процедура, позволяющая получить необходимый результат в достаточном приближении.
6. В результате эксперимента на основе первого неразмеченного варианта представления информации из словаря А.С. Хорнби для версии правил 1999 (без учета слов-исключений, которые не вводились в базу данных правил) была получена оценка степени их фонемной адекватности в 69 %, а словесной - в 20 %, для версии 2002 и полностью размеченной версии этого же словаря - 88% и 55% соответственно (наилучшая для словаря оценка).
7. Для неразмеченного машиночитаемого варианта словаря В.К. Мюллера наилучшая оценка фонемной адекватности составила 83%, а словесной - 39%.
8. Учет частеречной принадлежности при преобразовании позволяет повысить его словесную адекватность примерно в 1,5 раза.
9. Учет морфемного деления позволяет повысить словесную адекватность преобразования менее чем в 1,2 раза.
10.Одновременный учет и частеречной принадлежности, и морфемного деления позволяет повысить словесную адекватность преобразования почти в 2 раза.
11 .Фонемная адекватность мало зависит от использования дополнительной информации о частеречной принадлежности и/или морфемном делении.
12.Полностью размеченный вариант словаря В.К. Мюллера мог бы дать при использовании правил версии 2002 словесную адекватность в 75,2%, а фонемную - в 91,3%.
13.Стандартные списки слов-исключений не являются исчерпывающими.
14.Адекватность построенной системы преобразования может быть увеличена.
15.Является целесообразным применение при обучении чтению упорядоченных (алгоритмизированных) правил чтения.
ЗАКЛЮЧЕНИЕ
Решение общей задачи компьютерного моделирования графемно-фонемного преобразования (ГФП) является многоэтапным процессом, который необходимо начинать с выявления и последующего сравнения возможных подходов к ее решению. Исходя из типа преобразуемого объекта были выделены следующие основные способы организации исследуемого преобразования:
- словесный, или пословный, описываемый непосредственным переходом между графическим представлением слова (графическое слово) и фонемным (фонемное слово);
- морфемный, предполагающий непосредственный переход от графического морфа к фонемному;
- графемный, предполагающий посимвольное преобразование.
Для проведения сравнения подходов были предложены следующие критерии:
1. Быстродействие (у ).
2. Объем используемой памяти (£).
3. Степень охвата, или покрытия, входного графического материала (Л): з И ,
Л--, где /- множество таких элементов на входе системы преобразования, для которых она может выдать результат, a U— множество всех возможных элементов на входе системы (/с U);
4. Степень правильности, или адекватности, этого преобразования (а):
I и\ а
1*1 где R — множество таких элементов на входе системы, для которых получаемый результат преобразования является правильным и единственным (RcT).
По этим критериям основные базовые подходы: варианты пословного (П1, П2 и ПЗ), морфемный (П4), варианты графемного (П5, П6) и наиболее важные (интересные) их комбинации: пословно-графемный (П7), графемно-пословный (П8) и графемно-морфемный (П9) были расположены на следующих относительных шкалах:
Я: 0 < П4 < (П1 = ПЗ) < П2* < П9 < (П5* =П6 = П7 = П8)= 1. а : 0 < П2* < П4< П1 < (ПЗ = П5*) = 1. а: 0<? П6<П9 < (П7 = П8) ?= 1. с (у): O(Min) < П2* < П7 < ПЗ < П1 < П4 < П6 < П5 * < +оо(Мах). O(Min) < ? П9 < П8 ?< +со(Мах).
Исходя из проведенного в работе сравнения можно заключить, что компьютерное моделирование ГФП для английского языка разумно начинать с реализации графемного подхода и далее в зависимости от полученного результата решать вопрос о необходимости реализации графемно-словесного или графемно-морфемного подхода (на основе данных реализованного графемного подхода).
Графемные подходы могут быть разделены по источникам (происхождению) правил на те, которые получены вследствие применения некоторой автоматической процедуры, и те, которые построены ручным способом. Последние могут быть разделены на основании используемых в правилах лингвистических характеристик объектов на традиционные и концептуальные (теоретические, системные) - первые применяются при обучении чтению, а вторые - при построении автоматических систем синтеза речи.
Моделирование (как первых, так и вторых) правил любого происхождения имеет практическую значимость и актуальность в применении компьютерной лингвистики при построении автоматических систем синтеза речи, способных функционировать на неограниченном входном мате риале, что характерно для любых систем, построенных на правилах. Но только моделирование вторых позволяет получить новые данные, применимые и за пределами компьютерной лингвистики, например, при построении наиболее эффективной методики обучения чтению на английском языке. Кроме того, моделирование последних ранее не проводилось (что определяет новизну исследования). Поэтому представляемое исследование посвящено моделированию процесса графемно-фонемного преоб разования на основе традиционных (применяемых в нашей обучающей системе и построенных на использовании вполне определенных лингвистических характеристик) правил чтения.
Выявлено, что до использования в компьютерной модели традиционные правила должны быть подвергнуты предварительной обработке вследствие следующих причин:
- множественности источников их представления;
- наличия однотипных правил с разнообъемностью охвата (формулировок);
- наличия противоречащих друг другу правил;
- отсутствия явного деления правил на блоки (модули), решающие свои специфические задачи и, как следствие, отсутствие информации о порядке взаимодействия (последовательности работы) соответствующих блоков;
- отсутствия явно заданной последовательности применения правил;
- предназначенности для использования человеком, а не компьютерной (моделирующей) системой.
Соответственно, эта обработка должна включать следующее:
- определение источников правил для использования;
- выбор одного из неравнообъемных или представляющих альтернативу правил;
- распределение правил по блокам, ответственным за решение специфических (однотипных) задач (создание сводов исходных правил);
- задание последовательности применения (упорядочение) правил внутри блоков (<алгоритмизация правил);
- формализация правил.
Определено приоритетное использование источников специальной направленности по отношению к работам общего характера.
Выявлено, что правила преобразования для графемного подхода должны включать: объект преобразования (графема), получаемый объект (фонема или фонемы), объекты, окружающие преобразуемый объект (графем-ный контекст), супраграфемную информацию: тип слога (ударный/безударный, открытый/закрытый), тип морфемы (аффикс/корень), категорию (часть речи) слова, включающего преобразуемый объект (графему).
Все это предполагает осуществление следующих процессов: морфологический анализ, синтаксический анализ, слогоделение, акцентуация, определение типа слога, пографемное контекстно и слогово-зависимое преобразование в фонемы.
Первые два из названных являются независимыми от ГФП процессами и не являются предметом рассмотрения в данной работе.
Исходя из вышеизложенного были созданы своды (блоки) исходных правил, описывающих слогоделение, специальный морфологический анализ, акцентуацию, определение типов слогов по критериям открытости/закрытости, наличия буквы г (модификатора) в качестве правого контекста гласного элемента и собственно графемно-фонемное преобразование.
Правила в исходных множествах (сводах) были упорядочены (алгоритмизированы) с применением критериев "общее - частное правило" и "более и менее частотное (часто употребляемое) правило".
Формализация исходных правил строилась" на-основе системы правил подстановок, или переписываний, относящихся к формальному классу конечных преобразователей (трансдьюсеров), которая задается определенными входными и выходными алфавитами и конечными совокупностями правил (формул) вывода. Совокупности правил вывода задаются как упорядоченные множества. Используется два типа правил вывода: правила замены описания некоторого лингвистического объекта на другое и правила применимости либо правил замены, либо других правил применимости. Операция замены в соответствующих формулах обозначается символом "-»", а операция применимости — символом "=>".
Общая форма двухуровнего правила применимости следующая: Л~-со=>(а-'-/Зфа'-'/3 а---/3(ра-~0), где операция, обозначенная многоточием, соединяет части разрывного контекста, а алфавитные символы обозначают объекты, являющиеся операндами операций.
Каждое правило обозначается типом и номером в этом типе. Тип задает множество правил. Порядок выборки элемента из множества определяется номером правила.
Далее введенная формальная система используется для описания выделенных этапов графемно-фонемного преобразования.
Компонент слогоделения отвечает за выделение графического слога, состоящего в обязательном порядке из одного элемента категории гласных, который факультативно может быть окружен элементами, относящимися к категории согласных. Все согласные элементы, расположенные до первого слогообразующего элемента (гласного), относятся к первому слогу. Все согласные элементы, расположенные после последнего слогообразующего элемента, относятся к последнему слогу. Если между слогообразующими элементами находится одна согласная буква, то она относится к правому слогу, если больше одной, то первая из них относится к левому слогу, а остальные - к правому (кроме одного частного случая).
Процесс слогоделения проходит в следующем порядке. Входная строка, полученная в результате либо автоматического, либо смоделированного "вручную" через возможные выходные данные морфологического анализа, инициализируется, сегментируется, категоризируется и маркируется. Инициализация предполагает обрамление исходной строки объектами, задающими границы строки и начальное значение для подсистемы маркирования слогов. При категоризации, совмещенной с графемной сегментацией, каждый выделенный графемный объект (символ или их последовательность) проинициализированной строки получает атрибут (признак) принадлежности к категории гласных или согласных элементов. Маркирование заключается в присвоении каждому объекту атрибута, обозначающего номер слога.
В формальном своде правил выделено 1 правило инициализации, 48 правил сегментации-категоризации и 18 правил маркирования.
В процесс акцентуации включены следующие последовательные процессы: частеречной инициализации, выделения частей слова, подлежащих отдельному анализу, специального морфологического анализа, предварительной инициализации, собственно акцентуации и терминации. Предлагается 2 правила частеречной инициализации, 46 правил выделения частей слова, подлежащих отдельному анализу, 34 правила специального морфологического анализа, 2 правила предварительной инициализации, 41 правило собственно акцентуации (включающие 32 правила постановки первичного ударения и 9 правил постановки вторичного ударения) и 5 правил терминации.
Предложена процедура определения характеристик слогообразующего элемента (типа слога), которая включает следующие последовательные процессы: определения модифицированности (наличия буквы г справа от гласного элемента), первичной открытости/закрытости, вторичной закрытости (слогов, исходно являющихся открытыми) и степени полноты озвучивания гласного элемента. Она использует 3 правила определения модифицированности слога, 2 правила определения первичной открытости/закрытости слога, 12 правил определения вторичной закрытости слога и 31 правило определения степени полноты озвучивания гласного элемента слога.
Для описания графемно-фонемных соответствий для согласных английского алфавита в работе предложено 3 формализованных правила для буквы В, 14 правил - для буквы С, 11 правил - для буквы D, 1 правило -для буквы F, 10 правил — для буквы G, 2 правила — для буквы Н, 1 правило
- для буквы J, 3 правила - для буквы К, 9 правил - для буквы L, 2 правила
- для буквы М, 19 правил - для буквы N, 6 правил - для буквы Р, 3 правила - для буквы Q, 8 правил - для буквы R, 35 правил - для буквы S, 17 правил - для буквы Т, 1 правило — для буквы V, 6 правил - для буквы W,
15 правил — для буквы X, 3 правила - для буквы Z и 24 правила для недопущения удвоения согласных звуков. Всего предлагается 193 правил этой категории (в это число не включены правила с полным контекстом, который описывает отдельную словоформу, предназначенные для обработки слов-исключений).
Для описания процессов посимвольного преобразования гласных предложено 44 формализованных правила для буквы А, 69 правил - для буквы Е, 41 правило - для буквы I, 55 правил - для буквы О, 52 правила -для буквы U, 9 правил - для буквы Y. Таким образом, всего предлагается 270 правил этой категории (в это число также не включены правила с полным контекстом, предназначенные для обработки слов-исключений).
Всего предлагается 463 правила посимвольных преобразований (в это число не включены правила с полным контекстом, т.е. правила, описывающие исключения).
Завершающим этапом моделирования является построение компьютерной модели, т.е. перевод промежуточного формализованного представления в конечную стадию формализации, отраженную через компьютерный язык программирования.
Компьютерной реализацией описанной ранее формальной системы является система автоматического транскрибирования KorLang Transcriber. Для реализации системы транскрибирования была выбрана собственная система программирования ассоциативных сетей KorNet, позволяющая работать с динамическими объектами произвольной структуры, что и представляют собой лингвистические объекты — компоненты вышеприведенных правил.
Особенностью созданной системы транскрибирования является возможность параллельного существования компьютерных моделей (реализаций) различных версий правил преобразования. На данный момент создано 2 версии, отличающиеся источниками правил и используемыми способами реализации правил (декларативным и/или процедурным). Объем созданных баз данных правил - 27 и 105+14 килобайт.
Оценка моделей проходила на основе машиночитаемых версий двух словарей: раздел буквы "А" словаря А.С. Хорнби (1210 единиц) и адаптированный вариант седьмого издания (1961 год) англо-русского словаря В.К. Мюллера (35068 единиц). Машиночитаемая версия раздела словаря А.С. Хорнби была создана специально для проведения оценочного эксперимента.
В работе предложены оценочные процедуры, которые выявляют среднее время на обработку одного слова, словесную и фонемную адекватность системы. Вычисление первых двух характеристик является достаточно тривиальной задачей, вычисление же последней требует решения проблемы соотнесенности сравниваемых значений фонем. Для решения этой проблемы предложена 83 шаговая процедура, позволяющая получить необходимый результат в достаточном приближении.
В результате эксперимента на основе первого варианта представления информации из словаря А.С. Хорнби для версии правил 1999 (без учета слов-исключений, которые не вводились в эту базу данных правил) была получена оценка степени их фонемной адекватности в 69 %, а словесной — в 20 %, для версии 2002 наилучшие оценки - 88% и 55% соответственно.
Для словаря В.К. Мюллера наилучшая оценка фонемной адекватности составила 83%, а словесной - 39%. При работе с данными из этого словаря система не использовала информацию о частеречной принадлежности и морфемном делении преобразуемого слова.
Из апробации на основе словаря А.С. Хорнби, для которого было создано несколько машиночитаемых вариантов представления, различающихся наличием или отсутствием дополнительной частеречной и/или морфемной разметки, были получены следующие данные.
Разница между анализом с учетом частеречной принадлежности (используется в правилах специального морфологического анализа, постановки ударений, определения полноты озвучивания гласной слога и некоторых правилах посимвольных соответствий) и без него составляет в абсолютном выражении для словесной адекватности 15%, а для фонемной — 4%. Увеличение адекватности относительно неразмеченного варианта, адекватность которого может быть взята в этом случае за базовую и приравнена к 100%, составляет для словесной адекватности 53,57%, а для фонемной — 5%.
Разница между анализом с учетом морфемного деления (используется в большинстве правил) и без него составляет в абсолютном выражении для словесной адекватности 5%, а для фонемной - 2%. Увеличение адекватности относительно неразмеченного варианта, адекватность которого может быть взята за базовую и приравнена к 100%, составляет для словесной адекватности 17,85%, а для фонемной - 2,5%.
Разница между анализом на основе неразмеченного варианта словаря А.С. Хорнби и анализом на основе частеречно и морфемно размеченного варианта составляет в абсолютном выражении для словесной адекватности 26%, а для фонемной - 8%. Увеличение адекватности относительно неразмеченного варианта, адекватность которого может быть взята за базовую и приравнена к 100%, составляет для словесной адекватности 92,85%, а для фонемной - 10%.
Подключение стандартного словаря слов-исключений к анализу на основе неразмеченного варианта словаря А.С. Хорнби привело к увеличению в абсолютном выражении словесной адекватности на 1%, т.е. составила 29%, фонемная же адекватность осталась практически неизменной. Увеличение адекватности относительно неразмеченного варианта, адекватность которого может быть взята за базовую и приравнена к 100%, составило для словесной адекватности 3,57%.
Подключение стандартного словаря слов-исключений к анализу на основе полностью размеченного варианта словаря А.С. Хорнби привело к увеличению в абсолютном выражении словесной адекватности на 1%, т.е. составила 55%, фонемная же адекватность осталась также неизменной. Увеличение адекватности относительно размеченного варианта, адекватность которого может быть взята за базовую и приравнена к 100%, составило для словесной адекватности 1,85%.
Данные, полученные в результате эксперимента, позволяют сделать следующие выводы.
1. Упорядоченные (алгоритмизованные) правила чтения позволяют правильно озвучивать (читать) значительную часть входного материала, особенно с точки зрения фонемного состава результата (более 88%) адекватности). Сообразно этому можно считать вполне целесообразным их применение при обучении чтению.
2. Учет частеречной принадлежности при преобразовании позволяет повысить его словесную адекватность в 1,5 раза, что является достаточно большой величиной и косвенно говорит о соответствующей степени использования частеречной характеристики в рассматриваемых правилах и объеме подпадающих под эти правила входных данных.
3. Учет морфемного деления позволяет повысить словесную адекватность преобразования менее чем в 1,2 раза.
4. Одновременный учет и частеречной принадлежности, и морфемного деления позволяет повысить словесную адекватность преобразования почти в 2 раза, что в конечном итоге говорит о важности учета этих характеристик при преобразовании (чтении).
5. Фонемная адекватность мало зависит от использования дополнительной информации о частеречной принадлежности и/или морфемном делении, что может говорить о том, что доля в результате несоответствующих эталону фонем относительно невелика, что косвенно также подтверждается общей степенью фонемной адекватности (88%).
6. Стандартные списки слов-исключений не являются исчерпывающими.
При последующем использовании этих выводов необходимо учитывать их некоторую гипотетичность, связанную с использованием для апробации в нескольких вариантах представления только относительно небольшой части словаря А.С. Хорнби.
Также некоторой гипотетичностью будет обладать перенос полученных данных на словарь В.К. Мюллера. Эта экстраполяция могла бы дать следующие абсолютные результаты, просчитанные от базовых вариантов в 39 и 83%. Полностью размеченный вариант словаря В.К. Мюллера мог бы дать при использовании правил версии 2002 словесную адекватность в 75,2%, а фонемную - в 91,3%. Расхождение с результатами, полученными на основе машиночитаемой версии части словаря А.С. Хорнби, может объясняться различиями в фонемном описании словарного материала, что действительно было обнаружено в процессе работы с рассматриваемыми словарями.
Еще одним результатом эксперимента явился исчерпывающий для полученного свода правил список слов-исключений, который приводится в соответствующем приложении. Предварительный анализ этого списка позволяет заключить, что адекватность построенной системы преобразования может быть увеличена.
С общелингвистической точки зрения полученное формальное описание (модель) графемно-фонемного преобразования в английском языке может быть рассмотрена как теория соответствующего процесса и может послужить основой для создания подобных теорий для других языков.
Впервые полученные верифицируемые количественные данные о степени адекватности традиционных правил чтения и степени влияния на эту адекватность таких лингвистических характеристик, как информация о морфемной структуре слова и его частеречной принадлежности, могут быть использованы при оптимизации процесса обучения английскому языку.
Данные о количестве применяемых при преобразовании (чтении) правил могут быть использованы для описания сложности графемно-фонемного преобразования в различных языках при построении соответствующих типологических теорий.
Список литературы диссертационного исследования кандидат филологических наук Корочков, Александр Викторович, 2005 год
1. Абрамкина Т.А. Обучение произношению и технике чтения на английском языке. — М.: Изд-во МГУ, 1972. — 118 с.
2. Андрианова JI.H., Багрова Н.Ю., Ершова Э.В. Английский язык для заочных технических вузов: Учебник. — М.: Высшая школа, 1988. — 415 с.
3. Балинская В.И. Графика современного английского языка. — М.: Высшая школа, 1964. 354 с.
4. Балинская В.И. Орфография современного английского языка. — М.: Высшая школа, 1967. 327 с.
5. Большой англо-русский словарь. В 2-х т. Ок. 160000 слов. / Под общ. рук. И.Р.Гальперина, Э.М. Медниковой 4-е изд., испр., с доп. - М.: Рус.яз., т. 1 - 1987 - 1037 е., т.2 - 1988 - 1071 с.
6. Гумбольт В. фон. Избранные труды по языкознанию. Пер. с нем. — М., 1984.
7. Драгунова Е. И., Краснощекова Г. И. Английская орфоэпическая система. Методическое пособие для преподавателей средней школы. — М.: Учпедгиз, 1944.
8. Зиндер J1.P. Общая фонетика. 2 изд. М., 1979.
9. Зиндер JI.P. Проблемы и методы экспериментально-фонетического анализа речи. JL, 1980.
10. Ю.Кнут Д. Искусство программирования для ЭВМ, т. 3, Сортировка и поиск. М.: Мир, 1978. - 844 с.
11. П.Корочков А.В. Система программирования KorNet // XXIV Огарев-ские чтения: Тезисы докладов научной конференции.: В 3 ч. Часть 3 Саранск: Изд-во Мордов. университета, 1995. С. 15.
12. Корочков А.В. KorNet модель данных и система программирования семантической сети для платформы Win32/PC // Методы и средства управления технологическими процессами: Сб. тр. III
13. Междунар. науч. конф. — Саранск: Изд-во Мордов. ун-та, 1999. С. 148-152.
14. Корочков А.В. Компьютерное моделирование графемно-фонемного преобразования в английском языке (постановка задачи) // Социальные и гуманитарные исследования: традиции и реальности: Межвуз. сб. науч. тр. Саранск, 2002. Вып. 2. С. 388-392.
15. Корочков А.В. Компьютерное моделирование графемно-фонемного преобразования в английском языке (выбор подхода) // Вестник Мордовского университета. 2003. № 1-2. С. 79-91.
16. Корочков А.В. Компьютерное моделирование слогоделения в английском языке // Лингвистические и экстралингвистические проблемы коммуникации: теоретические и прикладные аспекты: Межвуз. сб. науч. тр. — Саранск, 2003. С. 174-186.
17. Лингвистический энциклопедический словарь / Гл. ред. В.Н. Ярцева. — М.: Сов. энциклопедия, 1990. 685 с.
18. Матюшкина-Герке Т.И. и др. Учебник английского языка для 1 курса институтов и факультетов иностранных языков. Учебник. — М.: Высшая школа, 1974. 384 с.
19. Мкртчян И.Г. Learn to Read English Words. (Пособие по технике чтения на английском языке). М.: Международные отношения, 1977.- 192 с.
20. Мюллер В.К. Англо-русский словарь. М.: Гос. изд-во иностр. и нац. словарей, 1961.
21. Панов М.В. Современный русский язык. Фонетика. М., 1979.
22. Потапова Р.К. Речь: коммуникация, информация, кибернетика. М., 2001.
23. Реформатский А.А. Из истории отечественной фонологии. М., 1970.
24. Реформатский А.А. Фонологические этюды. М., 1975.
25. Реформатский А.А. Очерки по фонологии, морфонологии и морфологии. М, 1979.
26. Сидоров В.Н. О Московской фонологической школе // Развитие фонетики современного русского языка. М., 1971.
27. Щерба JI.B. Языковая система и речевая деятельность. JL, 1974.
28. Страуструп Б. Язык программирования Си++: Пер. с англ. — М.: Радио и связь, 1991.-352 с.
29. Узкий А.Ф. Правила чтения английских слов. (Учебное пособие). — СПб.: Химера, 2002.-112 с.
30. Цейтин Г.С. Программирование на ассоциативных сетях // ЭВМ в проектировании и производстве, вып.2, под ред. Г.В. Орловского. — JI: "Машиностроение", Ленингр. отд., 1985. С. 16-48.
31. Шаншиева С.А. Английский язык для математиков (интенсивный курс для начинающих): Учебник. М.: Изд-во МГУ, 1991. — 400 с.
32. Adamson, M.J., Damper, R.I. A recurrent network that learns to pronounce English text // Proceedings of ICSLP'96 (International Conference on Spoken Language Processing), 1996. P. 1704-1707.
33. Albano, Cavalcante, E., Moreira, A.A. Archisegment-based letter-to-phone conversion for concatenative speech synthesis in Portuguese.1.SLP, 1996.
34. Albrow, K.H. The English Writing System: notes towards a description, Longman, 1972.
35. Allen, J., Hunnicutt, M.S., Klatt, D. From text to speech the MITalk system. MIT Press, Cambridge, Massachusetts, 1987.
36. Andersen, O., Dalsgaard, P. A self-learning approach to transcription of Danish Proper Names // ICSLP'94 (International Conference on Spoken Language Processing), Sep. 1994. P. 1627-1630.
37. Andersen, O., Kuhn, R., Lazarides, A., Dalsgaard, P., Haas, J., Noth, E. Comparison of Two Tree-Structured Approaches for Grapheme-to-Phoneme Conversion // Proc. of ICSLP-96, Philadelphia, Vol. 3, 1996. P. 1700-1703.
38. Bagshaw, P.C. Phonemic transcription by analogy in text-to-speech synthesis: Novel word pronunciation and lexicon compression // Computational Linguistics, 12(2), 1998. P. 119-142.
39. Berendsen, E., Don, J. Morphology and stress in a rule-based grapheme-to-phoneme conversion system for Dutch // J. Laver, M.A. Jack (eds.), Proceedings of European Conference on Speech Technology, Edinburgh, September 1987, vol. 1. P. 239-242.
40. Bernstein, J., Pisoni, D.B. Unlimited Text-to-Speech System: Description and Evaluation of a Microprocessor-Based Device // Proceedings of The International Conference on Acoustics, Speech and Signal Processing (ICASSP-80), 1980. P. 576 579.
41. Bisani, M., Ney, H. Investigations on joint-multigram models for grapheme-to-phoneme conversion // Proceedings of the 7th International Conference on Spoken Language Processing, Denver, CO, Sep. 2002, vol. 1. P. 105-108.
42. Bisani, M., Ney, H. Multigram-based Grapheme-to-Phoneme Conversion for LVCSR.
43. Black, A. W., Lenzo, K., Pagel, V. Issues in building general letter to sound rules // Proceedings of the Third ESCA Workshop on Speech Synthesis, Jenolan Caves, Australia, 1998.
44. Bosch, A. van den, Daelemans, W. Data-oriented methods for grapheme-to-phoneme conversion // Proceedings of European Chapter of ACL, Utrecht, 1993. P. 45-53.
45. Bouma, G. A finite state and data oriented method for grapheme to phoneme conversion // 1st Conf. of the North American Chapter of the Association for Сотр. Linguistics, Seattle, WA, 2000.
46. Chomsky, N., Halle, M., The Sound Pattern of English, Harper and Row, 1968.
47. Coile, Bert Van. Inductive Learning of Grapheme-to-Phoneme rules // ICSLP (International Conference on Spoken Language Processing). 19.1.1-19.1.4, 1990.
48. Coile, Bert Van. Inductive learning of pronunciation rules with the DE-PES system // IEEE, 1991.
49. Coker, C., Church, K., and Liberman, M. Morphology and rhyming: Two powerful alternatives to letter-to-sound rules for speech synthesis //
50. Bailly, G., Benoit, C., editors, Proceedings of the First ESCA Workshop on Speech Synthesis, European Speech Communication Association, Autrans, France, 1990. P. 83—86.
51. Coleman, J. English word-stress in unification-based grammar // Computational Phonology, Edinburgh Working Papers in Cognitive Science 8, ed. T. Mark Ellison and James Scobbie, 1993. P. 97-106.
52. Cremelie, N., Martens, J-P. Generation of word pronunciation networks from automatically learned inter-word coarticulation rules // Proceedings of ProRISC/IEEE Workshop on Circuits, Systems and Signal Processing, 1996. P. 89-94.
53. Daelemans, W. GRAFON: An Object-oriented System for Automatic Grapheme to Phoneme Transliteration and Phonological Rule Testing. Memo, University ofNijmegen, 1985.
54. Daelemans, W. GRAFON: A Grapheme-to-phoneme Conversion System for Dutch // Proceedings of the Twelfth International Conference on Computational Linguistics (COLING-88), Budapest, 1988. P. 133-138.
55. Daelemans, W., Bosch, A. van den, Gillis, S., Durieux, G. A data-driven approach to stress acquisition // Proceedings of the ECML workshop on machine learning techniques for Text Analysis / Adriaans Pieter (Ed.), Vienna, 1993. P. 15-24.
56. Daelemans, W., Gillis, S., Durieux, G. The acquisition of stress: a data-oriented approach // Computational Linguistics, 20, 1994. P. 421-451.
57. Daelemans, W., Bosch, A. van den. Language-independent data-oriented grapheme-to-phoneme conversion // Progress in Speech Synthesis, J. P. van Santen, R. W. Sproat, J. P. Olive, and J. Hirschberg, Eds. New York: Springer-Verlag, 1997. P. 77-90.
58. Damper, R. I. Self-learning and connectionist approaches to text-phoneme conversion // Connectionist models of memory and language, ed. by J. Levy, D. Bairaktaris and P. Cairns, London: UCL Press, 1995.1. P. 117-144.
59. Dedina, M., Nusbaum, H. PRONOUNCE: a program for pronunciation by analogy// Computer Speech and Language, 5, 1991. P. 55—64.
60. Deshmukh, Neeraj, Weber, M., Picone, J. Automated generation of N-best pronunciations of proper nouns. ICSLP, 1996.
61. Divay, M., and Vitale, A.J. Algorithms for grapheme-phoneme translation for English and French: Applications // Computational Linguistics, 23(4), 1997. P. 495-523.
62. Dresher, B.E., Kaye, J.D. A computational learning model for metrical phonology// Cognition, 34, 1990. P. 137-195.
63. Dutoit, T. An introduction to text-to-speech synthesis. Kluwer Academic Publishers, Dordrecht Hardbound, 1997, 312 pp.
64. Elovitz, H.S., Johnson, R., McHugh, A., Shore, J.E. Letter-to-sound rules for automatic translation of English text to phonetics // IEEE ASSP-24, 1976. P.446-459.
65. Fitt, S. The pronunciation of unfamiliar native and non-native town names // Eurospeech 95, 1995. P. 2227-2230.
66. Fitt, S. The generation of regional pronunciations of English for speech synthesis // Eurospeech 97, 1997. P. 2447-2450.
67. Fosler, E., Weintraub, M., Wegmann, S., Yu-Hung Kao, Sanjeev Khu-danpur, Charles Galles, and Murat Saraclar. Automatic learning of word pronunciation from data // ICSLP '96, Philadelphia, addendum, 1996. P. 28-29.
68. Fudge, E. English Word-Stress. Allen and Unwin, London, 1984.
69. Gildea, D., Jurafsky, D. Learning bias and phonological-rule induction // Computational Linguistics, 22, 1996. P. 497-530.
70. Handbook of the International Phonetic Association, Cambridge University Press, 1999.
71. Hammond, M. Syllable parsing in English and French. ROA-58-0000,1995.
72. Hammond, M. Vowel quantity and syllabification in English // Language, 73, 1997. P. 1-17.
73. Hayes, B. Extrametricality and English stress // Linguistic Inquiry, 13, 1982. P. 227-276.ш,
74. Hayes, B. Metrical stress theory: principles and case studies. Chicago: University of Chicago Press, 1995.
75. Hochberg, J., Mniszewski, S., Calleja, Т., Papcun, A. A default hierarchy for pronouncing English // IEEE Transactions on Pattern Analysis and Machine Intelligence, 13,1991. P. 957-964.
76. Hunnicutt, S. Phonological Rules for a Text-to-Speech System // AJCL Microfiche 57, 1976.
77. Hunnicutt, S. Grapheme-to-Phoneme Rules: A Review // STL/QPSR, 2-3/1980, 1980.
78. Hunnicutt, S., Meng, H., Seneff, S. & Zue, V. Reversible Letter-to-Sound Sound-to-Letter Generation Based on Parsing Word Morphology // Eurospeech '93, Berlin, Sept. 21-23, 1993, Vol. 2. P. 763-766.
79. Jannedy, S., Mobius, B. Name pronunciation in German text-to-speech synthesis // ANLP '97, 1997. P. 49-56.
80. Jiang, Li, Hsiao-Wuen Hon and Xuedong Huang. Improvements on a trainable letter-to-sound converter// Eurospeech '97, 1997. P. 605-608.
81. Kaplan, R. & Kay, M. Regular models of phonological rule systems // f1 Computational Linguistics, 20/3, 1994. P. 331-378.
82. Karaali, О., Corrigan, G., Gerson, I. Speech Synthesis with Neural Networks // World Conference on Neural Networks, 1996.
83. Karaali, O., Corrigan, G., Gerson, I., Massey, N. Text-to-Speech Conversion with Neural Networks: A Recurrent TDNN Approach // Euro-speech '97, 1997.
84. Kessler, В., Treiman, R. Syllable structure and the distribution of phonemes in English syllables // Journal of Memory and Language, 37, 1997. P. 295-311.
85. Kienappel, A.K., Kneser, R. Designing Very Compact Decision Trees for Grapheme-to-Phoneme Transcription // Proc. Eurospeech, Aalborg, Denmark, September 2001. P. 1911-1914.
86. Byeongchang Kim, Wonil Lee, Geunbae Lee, Jong-Hyeok Lee. Unlimited vocabulary grapheme-to-phoneme conversion for Korean TTS // Proceedings of ACL-COLING 98, Montreal, 1998. P. 675-679.
87. Byeongchang Kim, Geunbae Lee, Jong-Hyeok Lee. Morpheme-based grapheme to phoneme conversion using phonetic patterns and morpho-phonemic connectivity information // ACM Transactions on Asian Language Information Processing, vol.1, iss.l, 2002. P. 65-82.
88. Klatt D.H. Review of text-to-speech conversion for English // Journal of the Acoustical Society of America, 82 (3), September 1987. P. 737-793.
89. Knight, K., Graehl, J. Machine transliteration // Proceedings of the 35th Annual Meeting of the Association for Computionational Linguistics, 1997. P. 128-135.
90. Korochkov, A.V. Computer Modeling of Grapheme to Phoneme Conversion for English // Proc. of Intern. Workshop SPECOM'2003 (Speech and Computer), Moscow, 2003. P. 155-157.
91. Ladd, D.R. English compound stress // Gibbon, D. and Richter, H., editors, Intonation, Accent and Rhythm, W. de Gruyter, Berlin, 1984. P. 253—266.
92. Lammens, J.M.G. A Lexicon-based Grapheme-to-phoneme Conversion System // European Conference on Speech Technology / Laver, J., Jack, M.A. (Eds.), Edinburgh, September, 1987. P. 281-285.
93. Lawrence, S.G.C., Kaye, G. Alignment of phonemes with their corresponding orthography // Computer Speech and Language, 1, 1986. P. 153-165.
94. Liberman, M., Church, K. Text Analysis and Word Pronunciation in Text-to-speech Synthesis // Advances in speech signal processing, ed. S. Furui and M. Sondhi. New York: Marcel Dekker, 1992.
95. Liberman, M., Prince, A. On stress and linguistic rhythm // Linguistic Inquiry, 8, 1977. P. 249—336.
96. Liberman, M., Sproat, R. The stress and structure of modified noun phrases in English // Szabolcsi, A., Sag, I., editors, Lexical Matters. CSLI, University of Chicago Press, 1992.
97. Libossek, M., Schiel, F. Syllable-based Text-to-phoneme Conversion for German.
98. Linguistic Data Consortium. 1995. COMLEX English pronouncing lexicon. Trustees of the University of Pennsylvania, version 0.2.
99. Lucas, S.M., Damper, R.I. Syntactic neural networks for bidirectional text-phonetics translation // Talking machines: theories, models and applications, ed. by G. Bailly and C. Benoit. Amsterdam: Elsevier/North-Holland, 1992. P. 127-141.
100. Luk, R.W.P., Damper, R.I. Stochastic transduction for text-to-phoneme conversion// Eurospeech 91, 1991. P. 779-782.
101. Luk, R.W.P., Damper, R.I. Inference of letter-phoneme correspondences using generalized stochastic transducers // ICSLP 93, 1993.
102. Luk, R.W.P., Damper, R.I. A novel approach to inferring letter-phoneme correspondences // ICASSP (The International Conference on Acoustics, Speech and Signal Processing), 1991.
103. Luk, R.W.P., Damper, R.I. Inference of Letter-Phoneme Correspondences by Delimiting and Dynamic Time Warping Techniques // IEEE, 1992.
104. Luk, R.W.P., Damper, R.I. Inference of letter-phoneme correspondences with predefined consonant and vowel patterns // IEEE, 1992.
105. Lukin, P., Parshin, A. Text-to-Text Transcription Tool for MS Word // Intern. Workshop "Speech and Computer" (SPECOM' 2003). Moscow, 2003. P. 151-154.
106. Meng, H.M., Seneff, S., Zue, V. Reversible letter-to-sound/sound-to-letter generation based on parsing word morphology // Speech Communication, 18, 1996. P. 47-63.
107. Mobius, В., Sproat, R., Santen, J., Olive, J. The Bell Labs German Text-to-Speech System: An Overview // Proceedings of the European Conference on Speech Communication and Technology, vol. 5, 1997. P. 2443-2446.
108. Monaghan, A. Rhythm and stress in speech synthesis // Computer Speech and Language, 4, 1990. P. 71—78.
109. Ottesen, G., Horvei, В., Stensby, S. Predicting the Pronunciationof Norwegian names by self-learning software // Proceedings of Ono-mastica Research Colloquium, Dec. 1994. P. 17-24.
110. Parfitt, S.H., Sharman, R.A. A bidirectional model of English pronunciation// Eurospeech '91, 2, 1991. P. 800-804.
111. Plaut, D. A connectionist approach to word reading and acquired dyslexia: Extension to sequential processing // Cognitive Science, 23, 1999. P. 543-568.
112. Potapova, R.K. Linguistic rules for Text-To-Speech Synthesis // Text Processing and Cognitive Technologies, 8, Intern. Conference "Cognitive Modeling in Linguistics", Proceedings, Varna, September, 2003. P. 418-432.
113. Potapova, R.K., Sannikov, V.G. Development of text-to-speech algorithms suitable for realisation by microprocessors // Intern. Workshop "Speech and Computer" (SPECOM' 2001). Moscow, 2001. P. 2583.
114. Pounder, A., Kommenda, M. Morphological Analysis for a German Text-to-speech system // COLING '86, 1986.
115. Rentzepopoulous, P.A., Kokkinakis, G.K. Efficient multilingual phoneme-to-grapheme conversion based on HMM // Computational Linguistics, 22, 1996. P. 351-376.
116. Riley M., Ljolje, A. Automatic generation of detailed pronunciation lexicons // Automatic speech and speaker recognition: advanced topics, ed. Chin-Hui Lee, Frank K. Soong, and K.K. Paliwal. Boston: Kluwer, 1996. P. 285-301.
117. Rodd, J. Recurrent neural network learning of phonological regularities in Turkish // CoNLL97: Computational Natural Language Learning, ed. Т. M. Ellison, ACL, 1997. P. 97-106.
118. Ross, J. A Reanalysis of English Word Stress (Part I) // Brame, M., (ed), Contributions to Generative Phonology, University of Texas
119. Press, Austin, Texas, 1972.
120. Sejnowski, Т., Rosenberg, C. Parallel networks that learn to pronounce English text // Complex Systems, 1, 1987. P. 145-168.
121. Sproat, R. English noun-phrase accent prediction for text-to-speech // Computer Speech and Language, 8, 1994. P. 79-94.
122. Stanfill, C.W. Memory-based reasoning applied to English pronunciation // Proceedings AAAI-87, Seattle, WA, 1987. P. 577-581.
123. Stoianov, I.P. Connectionist lexical processing
124. Stoianov, I.P., Nerbonne, J. Connectionist grapheme to phoneme-conversion: Exploring distributed representations // 'Computational Linguistics in the Netherlands, 1999', 2000.
125. Stoianov, I.P., Nerbonne, J. Exploring phonotactics with simple recurrent networks // F. van Eynde, I. Schuurman, N. Schelkens, eds,'Computational Linguistics in the Netherlands, 1998', Rodopi, Amsterdam, NL, 2000. P. 51-68.
126. Survey of the State of the Art in Human Language Technology / Ronald A. Cole, Joseph Mariani, Hans Uszkoreit Annie Zaenen Victor Zue, Eds., Cambridge: Cambridge University Press, 1995. 533 pp.
127. Torkkola, K. An efficient way to learn English grapheme-to-phoneme rules automatically // IEEE, 1993.
128. Torstensson, N. Grapheme-to-phoneme conversion, a knowledge-based approach // TMH-QPSR Vol. 44 Fonetik, 2002.
129. Trager, G.L., Bloch, B. The syllabic phonemes of English // Language, 17, 1941. P. 223-246.
130. Urbanczyk, S.C., Eady, SJ. Assignment of syllable stress in a de-misyllable-based text-to-speech synthesis system// IEEE, 1989.
131. Venezky R.L. The Structure of English Orthography, Mouton, 1970.
132. Venezky R.L. The American Way of Spelling, Guilford, New York, 1999.
133. Vitale, T. An algorithm for high accuracy name pronunciation by parametric speech synthesizer// Computational Linguistics, 17, 1991. P. 257-276.
134. Weide, R.L. The Carnegie Mellon Pronouncing Dictionary. cmudict.0.4, 1995.
135. Wightman, C.W., Talkin, D.T. The Aligner: text-to-speech alignment using Markov models // Progress in speech synthesis, ed. Jan P.H. van Santen, Richard W. Sproat, Joseph P. Olive, and Julia Hirschberg. New York: Springer, 1997. P. 314-323.
136. Wothke, K. Automatic phonetic transcription taking into account the morphological structure of words // Technical Report, IBM Germany, Scientific Center, Heidelberg, 1991.
137. Yarowsky, D. Homograph disambiguation in text-to-speech synthesis // Progress in speech synthesis, ed. Jan P.H. van Santen, Richard W. Sproat, Joseph P. Olive, and Julia Hirschberg. New York: Springer, 1997. P. 157-172.
138. Yvon, F. Grapheme-to-phoneme conversion using multiple unbounded overlapping chunks // Proceedings of NeMLaP '96 (International Conference on New Methods in Language Processing), 1996.
139. Zemerli, Z., Obrecht, R.A., Henni, A., Sellami, M. Aravoice: An Arabic Text-To-Speech System // Intern. Workshop "Speech and Computer" (SPECOM' 2003). Moscow, 2003. P. 170-177.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.