Нахождение анафорических связей при автоматическом анализе текста: На материале английского языка тема диссертации и автореферата по ВАК РФ 10.02.21, кандидат филологических наук Ахренова, Наталья Александровна
- Специальность ВАК РФ10.02.21
- Количество страниц 220
Оглавление диссертации кандидат филологических наук Ахренова, Наталья Александровна
ВВЕДЕНИЕ.
ГЛАВА I. ИСТОРИЯ ВОПРОСА: МАШИННЫЙ ПЕРЕВОД И АВТОМАТИЧЕСКИЙ АНАЛИЗ ТЕКСТА. АВТОМАТИЧЕСКИЙ ИНФОРМАЦИОННЫЙ ПОИСК.
§ 1. ИСТОРИЯ СТАНОВЛЕНИЯ И РАЗВИТИЯ МАШИННОГО
ПЕРЕВОДА.
§ 2. СОВРЕМЕННОЕ СОСТОЯНИЕ АВТОМАТИЧЕСКОГО СИНТАКСИЧЕСКОГО АНАЛИЗА ТЕКСТА.
§ 3. СОВРЕМЕННОЕ СОСТОЯНИЕ АВТОМАТИЧЕСКОГО СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТА.
ВЫВОДЫ К ГЛАВЕ 1.
ГЛАВА II. АНАФОРИЧЕСКИЕ СВЯЗИ КАК ЦЕНТРАЛЬНАЯ ПРОБЛЕМА СОВРЕМЕННОГО СИНТАКСИЧЕСКОГО АНАЛИЗА.
§ 1. ПОНЯТИЯ РЕФЕРЕНЦИИ И ДЕЙКСИСА В ЛИНГВИСТИКЕ.
§ 2. МЕСТО АНАФОРЫ В ОБЩЕЙ ЛИНГВИСТИКЕ.
2.1. АНАФОРИЧЕСКАЯ НОМИНАЦИЯ КАК ЧАСТНЫЙ СЛУЧАЙ ВЕРБАЛИЗАЦИИ АНАФОРИЧЕСКОЙ СИТУАЦИИ. ПОНЯТИЕ АНАФОРИЧЕСКОЙ НОМИНАЦИИ.
2.1.1. АНАФОР И АНТЕЦЕДЕНТ; АНАФОРИЧЕСКОЕ И АНТЕЦЕДЕНТНОЕ ВЫРАЖЕНИЕ; АНАФОРИЧЕСКОЕ ОТНОШЕНИЕ.
2.1.2. СУБСТИТУТ АНАФОРИЧЕСКОГО ВЫРАЖЕНИЯ.
2.1.3. ЭКСПЛИЦИТНАЯ И ИМПЛИЦИТНАЯ АНАФОРА. КВАЗИАНТЕЦЕДЕНТ, КВАЗИАНТЕЦЕДЕНТНОЕ ВЫРАЖЕНИЕ.
2.1.4. ЭТАЛОННАЯ НОМИНАЦИЯ АНТЕЦЕДЕНТА.
2.1.5. ПРОБЛЕМА ГРАНИЦ АНТЕЦЕДЕНТА И АНАФОРА.
2.2. СЕМАНТИКА АНАФОРЫ.
2.2.1. СЕМАНТИКА АНАФОРЫ В ШИРОКОМ И УЗКОМ СМЫСЛЕ.
2.2.2. ТИПЫ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ МЕЖДУ АНТЕЦЕДЕНТОМ И КВАЗИАНТЕЦЕДЕНТОМ.
2.3. АНАФОРИЧЕСКОЕ ВЫРАЖЕНИЕ.
2.3.1. СТРУКТУРА АНАФОРИЧЕСКОГО ВЫРАЖЕНИЯ.
2.3.2. КЛАССЫ АНАФОРИЧЕСКИХ ВЫРАЖЕНИЙ.
2.4. ПРОЦЕДУРА АНАФОРИЧЕСКОЙ НОМИНАЦИИ.
ВЫВОДЫ К ГЛАВЕ II.
ГЛАВА III. АЛГОРИТМ НАХОЖДЕНИЯ АНАФОРИЧЕСКИХ СВЯЗЕЙ ПРИ АВТОМАТИЧЕСКОМ АНАЛИЗЕ ТЕКСТА.
§ 1. МЕСТО АНАФОРЫ В ПРИКЛАДНОЙ ЛИНГВИСТИКЕ.
§ 2. АЛГОРИТМ НАХОЖДЕНИЯ АНАФОРИЧЕСКИХ СВЯЗЕЙ ПРИ АВТОМАТИЧЕСКОМ АНАЛИЗЕ ТЕКСТА. ПРОВЕРКА ЭФФЕКТИВНОСТИ РАБОТЫ АЛГОРИТМА.
2.1. МОРФОЛОГИЧЕСКИЙ ФИЛЬТР.
ОЦЕНКА ВОЗМОЖНЫХ АНТЕЦЕДНТОВ
2.2. СЕМАНТИЧЕСКИЕ СВОЙСТВА АНТЕЦЕДЕНТОВ.
2.3. МЕСТОПОЛОЖЕНИЕ АНАФОРА ПО ОТНОШЕНИЮ
К АНТЕЦЕДЕНТУ.
2.4. РОЛЬ ЛИЧНЫХ АНАФОРИЧЕСКИХ МЕСТОИМЕНИЙ В АНГЛИЙСКОМ ПРЕДЛОЖЕНИЕ.
2.5. МЕСТОНАХОЖДЕНИЕ ЛИЧНЫХ АНАФОРИЧЕСКИХ МЕСТОИМЕНИЙ 3-ГО ЛИЦА ЕДИНСТВЕННОГО ЧИСЛА В ТЕКСТЕ.
2.6. РЕЗУЛЬТАТЫ ТЕСТА.
ВЫВОДЫ К ГЛАВЕ Ш.
Рекомендованный список диссертаций по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Автоматическое разрешение кореференции местоимений третьего лица русскоязычных текстов2008 год, кандидат технических наук Толпегин, Павел Владимирович
Семантика и дейктические функции личных местоимений в современном английском языке1984 год, Волков, Николай Николаевич
Атрибутивные словосочетания с опорным компонентом, выраженным именными заместителями one, that в современном английском языке1999 год, кандидат филологических наук Андросова, Лидия Михайловна
Семантико-синтаксическая характеристика указательных местоимений и местоименных наречий в современном английском языке1984 год, кандидат филологических наук Мирзамухамедова, Мархамат Фехритдиновна
Корпусно-ориентированное исследование референции: Принципы аннотации и анализ данных2006 год, кандидат филологических наук Красавина, Ольга Николаевна
Введение диссертации (часть автореферата) на тему «Нахождение анафорических связей при автоматическом анализе текста: На материале английского языка»
Прикладная лингвистика зародилась в середине XX века и как научная дисциплина получила название «структурная, прикладная и математическая лингвистика», которое сохранилось до сегодняшнего дня. В отечественной традиции прикладная лингвистика четко делится на квантитативную (математическую) лингвистику, изучающую применение количественных методов при исследовании лингвистических явлений, и компьютерную (вычислительную, инженерную) лингвистику, которая посвящена разработке и реализации автоматизированных систем обработки речевых и текстовых сообщений, в последние годы все чаще называемых речевыми и текстовыми лингвистическими процессорами (ЛП).
В начале своего пути компьютерная лингвистика была в основном представлена модельными и экспериментальными автоматизированными информационно-поисковыми системами и системами машинного перевода, которые в дальнейшем пополнились автоматизированными системами распознавания и синтеза отдельных слов, а также автоматическими словарями.
Сейчас прикладная лингвистика представляет собой дисциплину, которая объединяет большое количество разнообразных проблем, связанных с решением практических задач, часто выходящих за рамки самой лингвистики. В разное время на первый план в ней выходят и различные проблемы, на которых и сосредотачиваются основные усилия. Вследствие ряда объективных причин в отечественной прикладной лингвистике одной из таких актуальных задач является разработка лингвистического обеспечения различного рода автоматических и автоматизированных систем. Это и системы автоматического перевода, и системы информационного поиска, и системы автоматизированного управления. Все большую актуальность в настоящее время приобретает разработка систем искусственного интеллекта.
Если первоначально разработка лингвистического обеспечения велась преимущественно в плане моделирования и формализации естественного языка, то сейчас первичным является моделирование понимания естественного языка. Такая задача первоначально решалась применительно к ведению диалога между человеком и компьютером. Она заключалась в том, чтобы осуществить перевод вопроса, обращенного к компьютеру, с естественного языка на язык внутреннего представления информации, принятый в данной системе. Для этой цели, как правило, использовался семантический язык в виде фрейма, сети или языка исчисления предикатов (Перцова 1980). Тот факт, что компьютер на осмысленный вопрос дает такой же осмысленный ответ, можно рассматривать как своего рода свидетельство того, что здесь имеет место понимание. Но о моделировании собственно понимания в этом случае можно говорить лишь условно (Новиков 2000).
С большим основанием к пониманию следует отнести более сложный класс задач, связанных с анализом и пониманием полных текстов. Н.Н. Леонтьева в одной из своих последних работ убедительно показала, что необходимость моделирования понимания в той или иной форме присутствует во всех основных видах систем, связанных с автоматической обработкой информации, представленной на естественном языке (Леонтьева 2000).
Результатом такого компьютерного понимания является та или иная информация, которая извлекается компьютером из текста и фиксируется в виде различных семантических представлений. При этом основным инструментом, используемым для автоматического понимания, являются различного рода знания, предварительно аккумулируемые в системе. Роль знаний в этом процессе, несомненно, велика, о чем свидетельствуют данные, характеризующие понимание текста человеком. Так, например, в работе Н. Рафиковой экспериментально доказывается теоретическое положение о том, что в основе понимания, осуществляемого человеком, лежит актуализация определенных структур знания в результате воздействия на когнитивную сферу языковых единиц различного уровня (Рафикова 2000). Но понимание не сводится только лишь к актуализации знаний. Известно, что знать и понимать — это не одно и то же. «Можно знать нечто и не понимать его действительного смысла, можно успешно действовать, но не понимать сущность происходящего» (Гусев, Тульчинский 1985, 17). Поэтому глубокое и полное понимание, которое, конечно же, в значительной степени базируется на знании, все же выходит за его рамки, поднимается над ним и представляет собой, возможно, особый вид знания, своего рода «знание о знании». Такой переход означает переход на уровень смысла, который участвует в процессе осмысления и как средство и как его конечный результат. Вне этого понимание и смысл оказываются комплиментарными понятиями, т.е. одно предполагает другое. «Понятия смысла и понимания являются соотносительными и не могут рассматриваться в отрыве друг от друга. Смысла также нет вне понимания, как и понимание есть усвоение некоторого смысла», — пишут по этому поводу С.С. Гусев и Г.Л. Тульчинский (Гусев, Тульчинский 1985,42).
Наметившаяся тенденция в плане моделирования понимания в автоматических системах, особая роль смысла в этом процессе, в то же время крайняя противоречивость и неопределенность представлений об этом явлении — все это является основанием для того, чтобы активизировать усилия, направленные на изучение смысла, мышления, понимания и, соответственно, языка как продукта этих процессов психической деятельности человека.
Важность изучения этих процессов подчеркивается, в первую очередь, тем, в каком русле идут современные исследования в области компьютерной лингвистики. Здесь необходимо отметить работу группы ученых под руководством профессора Новикова А.И. над экспериментальным изучением смысла (Новиков 2002), также работу Леонтьевой Н.Н., связанную с автоматической обработкой информации, представленную на естественном языке (Леонтьева 2000). Бесспорно, заслуживают упоминания исследования в области обучения при помощи компьютера и разработки основных стратегий компьютерного обучения в лингвистике, а также разработки тестирующих и моделирующих программ обучения и т.д., описанных в книге Потаповой Р.К. «Новые информационные технологии и лингвистика» (Потапова 2002).
К решению задач, выдвинутых современными системами искусственного интеллекта и другими, которые мы условно называем системами автоматического понимания или анализа текста, теоретическая лингвистика оказалась не готова. Она не предложила способов формирования таких единиц, которые воспринимались бы другой, внешней системой, не разработала «словарей» соответствий между лингвистическими и экстралингвистическими понятиями. Лингвистический анализ не строит крупных единиц «навстречу» единицам, описывающим факты и события действительности и отношения между ними.
В результате образовался разрыв, на одной стороне которого — лингвистические сущности, единицы, которые строятся только лингвистическим анализом (внутренние единицы), на другой — система понятий конкретной области знаний (внешние единицы). Два языка — внутренний и внешний — оказались не в состоянии найти точек соприкосновения друг с другом.
В результате практические системы весь свой искусственный интеллект тратят на преодоление этого разрыва, причем для решения конкретной задачи в каждой узкой предметной области этот разрыв преодолевается заново.
Мы делаем вывод, что в любой модели анализа текста необходимо сочетание двух подходов — информационного и лингвистического.
Как результат обобщения, или как теоретическое обоснование разных типов прикладных систем, разработана абстрактная модель, названная информационно-лингвистической моделью (ИЛМ), в рамках которой можно проследить по шагам все звенья автоматического понимания текста. Коротко говоря, ее смысл сводится к тому, что из одного и того же естественного текста (ЕТ) система может извлекать разную информацию дня разных пользователей в зависимости от их интересов, объема знаний и от того, какие модули компьютерного знания подключены к процессу понимания ЕТ. Такой подход (возможность извлечения разных «смыслов» из единого множества текстов, своего рода лингвистическая относительность) обосновывается и практической необходимостью (действительно, разным пользователям нужна разная информация из текстов), и соображениями конструктивного характера: отдельные модули создаются как самостоятельно работающие подсистемы, которые включаются и выключаются в разных режимах работы системы.
Концептуальные структуры текста желательно создавать на основе хороших лингвистических представлений текста. Это означает учет всех свойств текста — от графематических особенностей до свойств связности текста — и привлечение описаний объектов предметной области (ПО) в виде тезаурусов или других способов задания специальных знаний. Кроме того, концептуальные структуры необходимо соотносить с возможными запросами пользователя (это сфера информатики) и с языком адресата информации. Важно также знание того, каковы внутренние установки и цели автора текста (это прагматика - сравнительно новая область теоретической лингвистики).
Пока никому не удалось реализовать такую модель, которая может учесть все эти аспекты и выдавать Адресату (или пользователю) необходимую информацию из произвольного корпуса текстов. Тем более важно рассмотреть теоретически, из каких «кубиков» складывается механизм автоматического понимания.
Как показывает современная практика работы с системами машинного перевода наиболее «слабыми» местами любой системы являются блоки автоматического синтаксического и семантического анализа текстов. Но данные проблемы являются глобальными и тяжело решаемыми, поэтому мы должны начинать процесс решения этих проблем поэтапно, а не комплексно. Должны сначала сделать эти самые «кубики», а уже потом построить полновесную модель автоматического синтаксического или семантического анализа.
В нашей работе мы остановились на формировании одного такого «кубика», а точнее - на построении алгоритма нахождения анафорических связей. Надо отметить, что данный аспект находится на стыке семантики и синтаксиса и занимает умы многих ведущих ученых мира, так как, решив эту проблему, мы сможем снять ряд трудностей и задач не только в области прикладной лингвистики, но и в области лингвистики текста.
Так объектом исследования являются анафорические связи личных анафорических местоимений 3-го лица единственного и множественного числа в современной газетной политической статье.
В качестве предмета исследования мы выбрали установление антецедентов автоматическим способом, посредством выявления формальных характеристик смысловых и содержательных зависимостей.
В соответствии с объектом и предметом нашего диссертационного исследования мы определили следующую цель исследования: систематизация формальных средств выражения анафорических связей и зависимостей для основного состава личных местоимений английского языка определенного функционального стиля.
Частными задачами исследования являются:
- изучение контекстных проявлений синтаксических связей анафорического типа для выбранного состава местоимений;
- проверка их алгоритмическим способом;
- составление алгоритмов нахождения анафорических связей для прикладных целей.
Основными методами и приемами исследования мы считаем: дистрибутивный метод, сопоставительный метод, метод прямого перевода, количественный анализ лингвистических явлений синтаксического характера, связанных с анафорой.
Материалом исследования послужили английские и американские газеты (издающиеся в Великобритании "The Times", "The Guardian", "The Independent" и США "Washington Times") за период с 2000 по 2003 год. Объем проанализированного материала составил более 1200 текстов политических статей. Всего было отобрано и проанализировано по 500 примеров на каждый случай употребления анафорических местоимений 3-го лица единственного и множественного числа мужского и женского рода.
Для анализа выбраны средства массовой коммуникации, обладающие достаточной авторитетностью (британская газета "The Times" - один из старейших и широко цитируемых источников информации не только в Великобритании, но и во всем мире; не менее известна пользующаяся репутацией «серьезного» издания американская газета "Washington Times").
Научная новизна исследования заключается в том, что современный политический текст не изучался с точки зрения выявления анафорических связей в целях автоматической переработки, не существует достаточно эффективных алгоритмов для нахождения таких связей и для более широкого использования таких алгоритмов, например, в составлении обучающих программ.
Теоретическая значимость работы объясняется тем, что решение задачи автоматического нахождения анафорических связей есть часть важной и не решенной до сих пор проблемы автоматического синтаксического анализа естественных языков. Здесь также есть выход в теорию текста и фундаментальные положения языковой деятельности и языкового мышления.
Практическая значимость состоит в использовании разработанных алгоритмов нахождения анафорических связей для задач машинного перевода, автоматического индексирования, автоматического получения содержания и смысла текста, в построении человеко-машинного интерфейса и систем искусственного интеллекта.
На защиту выносятся следующие положения:
1. Анафора играет большую роль в автоматическом синтаксическом и семантическом анализе текста, так как без эффективного разрешения анафорических отношений не может быть удовлетворительного синтаксического и семантического анализа. Авторы современных систем автоматического анализа и синтеза зачастую упускают из вида этот немаловажный аспект функционирования языка.
2. Разрешение анафоры требует оптимального алгоритмического взаимодействия как семантических, так и синтаксических факторов, в котором преобладающую роль занимают синтаксические факторы.
3. Тип языка - аналитический или флективный - оказывает существенное влияние на состав и структуру определения анафорических связей.
4. С точки зрения алгоритмического разрешения анафоры наиболее целесообразен подход, основные принципы которого были заложены при разработке проекта Kit-Fast в рамках исследования Eurotra-D и впоследствии развиты и дополнены в рамках нашей работы.
5. Созданный нами алгоритм нахождения анафорических связей обеспечивает эффективность на уровне 80%.
Апробация работы. Результаты работы обсуждались на шестой Международной конференции ассоциации LATEUM на базе МГУ им.
М.В. Ломоносова (сентябрь 2000 г.); на научно-практических конференциях на базе Коломенского государственного педагогического института (март 2002, апрель 2003); на научно-практической конференции Московского государственного областного университета (март 2002); на Международной научно-практическая конференция «Языки мира и мир языка», на базе Московской Академии Экономики и Права (январь 2003). Основное содержание диссертационного исследования отражено в 6 публикациях.
Похожие диссертационные работы по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Текстовые функции местоимений в современном английском языке1999 год, кандидат филологических наук Ремизова, Елена Александровна
Омокомплекс "так" и его функции в современном русском языке2004 год, кандидат филологических наук Федорова, Евгения Михайловна
Стратегии когнитивной обработки дискурсивной анафоры пропозитивно-именного типа2003 год, кандидат филологических наук Воронкова, Анна Владимировна
Ассоциативная анафора в тексте: На материале французского языка1999 год, кандидат филологических наук Бекзентеева, Валерия Викторовна
Применение теории компьютерной семантики русского языка и статистических методов к построению системы машинного перевода2011 год, кандидат физико-математических наук Кан, Дмитрий Александрович
Заключение диссертации по теме «Прикладная и математическая лингвистика», Ахренова, Наталья Александровна
Выводы к Главе III:
Таким образом, из Главы III видно, что основной объем серьезных исследований в области анафоры и ее алгоритмизации ведется за рубежом, а в России в силу ряда объективных причин исследования в этой области практически прекращены или вообще не ведутся. Этим и обуславливается выбор нами темы. Данная глава дает подробное описание хода нашего эксперимента, и ниже приводятся краткие вывода того, над чем мы работали.
В ходе нашего исследования нами было проанализировано 1200 газетных статей, из которых нами было выбрано по 500 примеров на каждое из местоимений. На основе анализа примеров мы предлагаем следующую последовательность действий для нахождения анафорических связей: 1) выявить местоположение антецедента по отношению к анафору в тексте; 2) определить роль антецедента и личных анафорических местоимений в предложении; 3) определить, в каких частях текста могут находиться личные анафорические местоимения третьего лица единственного числа мужского и женского рода.
Так анафоры могут находиться как в одном предложении с антецедентом, так и в начале абзаца, в котором встречается анафор. В предложении анафор обычно выступает в роле подлежащего.
В тексте анафор встречается в следующих структурах: 1) в простых предложениях: в начале предложения, в начале предложения после вводных слов however, first, secondly, although etc.; 2) в сложносочиненных предложениях; 3) сложноподчиненном предложении с придаточными разных типов; 4) при передаче прямой речи: перед прямой речью, между частями прямой речи, после прямой речи; 5) при передачи косвенной речи.
В нашей работе также мы определили спектр текстов, которые могут быть подвергнуты машинному переводу и пришли к выводу, что большинство художественных текстов, а также текстов, которые носят не просто информативный характер, а которые передаются через восприятие той или иной проблемы автором не поддаются машинной обработке.
В результате исследования выяснилось, что в 400 примерах из 500 на каждый случай антецедент был найден верно, что означает, что коэффициент достоверности данного алгоритма равен 80%. Проанализировав случаи, в которых алгоритм находит анафорические связи неверно, мы пришли к выводу о том, что объяснение этому необходимо искать в постановке знаков препинания в английском тексте. Как известно, помимо общих правил постановки знаков препинания в английском языке допускается некоторая свобода в постановке того или иного пунктуационного знака. Этим не часто, но все же пользуются авторы политических статей для достижения определенного стилистического эффекта и придания некоторой эмоциональной окрашенности тексту. Вот именно в этих случаях и происходит сбой в работе алгоритма. Для преодоления этого барьера необходимо составлять алгоритм на базе большего количества примеров, но даже и тогда процент неправильно найденных связей между антецедентом и анафором всего лишь снизится, а не ликвидируется вообще.
Заключение
Проблема автоматического анализа текста на современном этапе развития науки и техники представляется одной из самых важных в теории и практике перевода, так как в наш век всеобщей компьютеризации машине отводится лидирующая роль на всех производствах. Парадоксально, что с довольно-таки высоким уровнем развития технологий в современном мире не создано системы автоматического анализа и синтеза, которая могла бы удовлетворить или хотя бы частично соответствовать достаточно высоким требованиям, как отдельного человека, так и всего социума в целом.
Исследование показало, что помимо разработки систем машинного перевода, которые ведутся достаточно давно и надо отметить в некоторых областях с большим успехом, сегодня, интерес человечества переключен на проблемы синтаксического и семантического анализа и синтеза текстов, искусственного интеллекта, создание новых, более объемных и узкоспециальных словарей, охватывающих все новые и новые области знания современного индивида. Однако все еще остается неразгаданным природа большого количества лингвистических явлений, которые получили достаточное описание в общей лингвистике, но все еще являются загадкой для представителей компьютерной лингвистики и одной из таких проблем является анафора или анафорические отношения в тексте. «Загадочность» этого явления заключается в его природе, так как помимо лингвистических знаний и понятийного аппарата человека в формировании анафорических отношений участвует психика, что, как известно, является еще мало изученной областью знания и еще не до конца определены сферы соприкосновения лингвистики и психологии человека. На данный момент алгоритм нахождения анафорических связей в современных отечественных системах машинного перевода фактически отсутствует, так как исследования в этой области в нашей стране практически не ведутся.
Подводя итоги нашего исследования по проблеме нахождения анафорических связей при автоматическом анализе текста, мы пришли к выводу, что данный аспект требует системного подхода и комплексного изучения, так как, совершенствуя один элемент системы, нельзя забывать и о других составляющих. В работе мы определили основные аспекты совершенствования современных систем машинного перевода. Одним из них является разработка алгоритма нахождения анафорических связей для личных анафорических местоимений единственного и множественного числа.
В ходе исследования помимо разработки алгоритма нахождения анафорических связей мы пришли к заключению о том, что, исследуя анафору можно определить спектр текстов, которые могут быть подвергнуты автоматическому переводу и анализу. Так тексты художественного стиля и передаваемые через восприятие информации автором не могут быть переведены адекватно при помощи машины, а тексты функционального стиля очень легко поддаются автоматической обработке.
Согласно результатам данного исследования процесс нахождения анафорических связей проходит в три этапа: 1) определение местоположения в тексте антецедента по отношению к анафору; 2) определение местонахождения личных анафорических местоимений Зго лица единственного и множественного числа в тексте; 3) установление роли личных анафорических местоимений в английском предложении.
Результаты проделанной работы были обобщены и систематизированы в схеме нахождения анафорических связей для личных анафорических местоимений Зго лица единственного и множественного числа (см. Приложение), на основании которой был создан рабочий алгоритм нахождения анафорических связей.
Список литературы диссертационного исследования кандидат филологических наук Ахренова, Наталья Александровна, 2003 год
1. Автоматический перевод 1949 — 1963 гг.: Критико-библиографический справочник//Сост. И.Л. Мельчук, Р.Д. Равич. М., 1967. - 516 с.
2. Андреев Н.Д. Машинный перевод и проблема языка-посредника//Вопр. Языкозн. 1957. № 5. с. 117-121.
3. Апресян Ю.Д., Богуславский И.М., Иомдин JI.JI. и др. Лингвистическое обеспечение системы «Этап-2». М., 1989. 295 с.
4. Арутюнова Н.Д. Лингвистические проблемы референции//Новое в зарубежной лингв. Выпуск XIII. Логика и лингвистика. М., 1982.
5. Арутюнова Н.Д. Сокровенная связка//Изв. АН СССР. Сер. Лит. и языка. 1980. № 4.
6. Арутюнова Н.Д. Предложение и его смысл. М.: Наука, 1976. 384 с.
7. Ахманова О.С. и др. Синтаксис как диалектическое единство коллигации и коллокации. М.: Изд. МГУ, 1969.
8. Бар-Хиллел И. Будущее машинного перевода//Науч. докл. высшей школы. Филол. науки. 1962. № 4. с. 203-206.
9. Беляева Л.Н. Применение ЭВМ в лингвистических исследованиях и лингводидактике. Л., 1986. 84 с.
10. Бенвенист Э. Общая лингвистика. М., 1974. 315 с.
11. Богуславская О.Ю., Муравьева И.А. Механизмы анафорической номинации//Моделирование языковой деятельности в интеллектуальных системах. М., 1987. — с. 78-128.
12. Блумфильд Л. Язык. М.: Изд. «Прогресс», 1968. 607 с.
13. Василевский А.Л., Марчук Ю.Н. Вычислительная лингвистика. Учебное пособие для студентов отделения прикладной лингвистики. М., МГПИИЯ им. М. Тореза, 1970. 265 с.
14. Гусев С.С., Тульчинский Г.Л. Проблема номинация в философии. М., 1985. 268с.
15. Диалог 97. Труды международного семинара по компьютерной лингвистике и ее приложения. Ясная Поляна 10-15 июня 1997 г. Под ред. Нариньяни А.С. М., 1997. 315 с.
16. Диалог 96. Труды международного семинара по компьютерной лингвистике и ее приложения. Пущино, 4-9 мая 1996 г. Под ред. Нариньяни А.С. М., 1996. 305 с.
17. Диалог 95. Труды международного семинара по компьютерной лингвистике и ее приложения. Казань, 31 мая-4 июня 1995 г. Под ред. Бухарева Р.Г. и др. Казань, 1995. 362 с.
18. Дикарева С.С. Семантика анафоры//Структур. и прикл. лингвистика. JL, 1987. - Вып. 3. - с.29-38.
19. Емельянова О.В. Функционирование анафорических местоимений в контексте с неопределенным антецедентом // Вопр. англ. контекстологии. JL, 1990. - Вып. 3. - с. 44-49.
20. Звегенцев В.А. Предложение и его отношение к языку и речи. М., Изд-во МГУ, 1976. 306 с.
21. Зелко В.М. Проблема разработки лингвистического обеспечения систем китайско-русского информационного машинного перевода. Канд. дис. М., ин-т языкознания АН СССР. 1991. с. 96-112.
22. Комиссаров В.Н. Слово о переводе. М.: ИНО, 1973. — 237 с.
23. Компьютерра 2002. Интернет. http://www.computera.rU/ffline2002//446//8250
24. Кулагина О.С. Исследования по машинному переводу. М., 1979.- 319 с.
25. Кулагина О.С., Мельчук И.А. Машинный перевод с французского языка на русский//Вопр. языкозн. 1956. №5. с. 111-121.
26. Лейкина Б.М., Никитина Т.Н., Откупщикова М.И. и др. Система автоматического перевода, разрабатываемая в грамматике математической лингвистики. ВЦ ЛГУ//Науч.-тех. Информация. 1966. № 1.- с. 40-50.
27. Леонтьева Д.А. Психология смысла. М., 2000.
28. Леонтьева Н.Н. К теории автоматического понимания текстов. М.: МГУ, 2000.
29. Леонтьева Н.Н. К теории автоматического понимания естественных текстов. Часть 1. Моделирование системы «мягкого понимания» текста: информационно-лингвистическая модель. М.: Изд. МГУ, 2000.
30. Леонтьева Н.Н. Система французско-русского перевода (ФРАП): лингвистические решения, состав, реализация//Машинный перевод и прикладная лингвистика: Проблема создания системы автоматического перевода. Вып. 271. М, 1987. с. 6-26.
31. Марчук Ю.Н. Основы компьютерной лингвистики. Учебное пособие. — М.: Изд-во МПУ «Народный учитель», 2000. 226 с.
32. Марчук Ю.Н. Методы моделирования перевода. М, 1985. 199 с.
33. Марчук Ю.Н. Проблемы машинного перевода. М, 1983. 201 с.
34. Маслова С.Б. Об анафорической и дейктической функции лексемы that: (На материале соврем, англ. яз.) // Одес. Гос. Ун-т им. И.И. Мечникова. Одесса, 1990. - 42 с.
35. Машинный перевод: Сб. статей. М., 1957. 314 с.
36. Мельчук И. А. Опыт теории лингвистических моделей «смысл-текст». М, 1974. 314 с.
37. Мельчук И.А. Работы по машинному переводу с СССР//Вестн. АН СССР, 1959. № 2. с. 43-47.
38. Молошная Т. Н. Алгоритм машинного перевода с английского языка на русский//Проблемы кибернетики. Вып. 3. М., 1960. с. 209-272.
39. Молчанова Е.К. Дейктические и анафорические местоимения суффиксы в языках среднеазиатского языкового союзаУ/Сов. Тюркология. Баку, 1987. - № 2. - с. 80-85.
40. Новиков А.И. Доминантность и транспозиция в процессе осмысления текстаУ/Scripta linguisticay applicatae. Проблемы прикладной лингвистики 2001. Сборник статей/Отв. ред. А.И. Новиков. - М.: «Азбуковник», 2001. - с. 155-180.
41. Падучева В.В. Высказывание и его соотнесенность с действительностью. М., 1985.
42. Падучева В.В. Презумпции и другие виды неэксплицитной информации в тексте//Научно-техническая информация. Сер. 2. 1981. № 11.
43. Панов Д.Ю. Автоматический перевод. 2-е изд. М., 1958. 72 с.
44. Переводная машина П.П. Троянского: Сб. матер, по переводной машине для перевода с одного языка на другие, предложенной П.П. Троянским в 1933 г./Отв. ред. Д.Ю. Панов. М., 1959. 52 с.
45. Перцова Н.Н. О системах понимания текста на ЕЯ. Препринт ВЦ СО АН СССР. Вып. 231. Новосибирск, 1980.
46. Пиотровский Р.Г. Инженерная лингвистика и теория языка. Л., 1979.- 112 с.
47. Потапова Р. К. Новые информационные технологии и лингвистика: Учебное пособие. М.: МГЛУ, 2002. - 576 с.
48. Прикладное языкознание. Учебник/Л.В. Бондаренко, Л.А. Вербицкая, Г.Я. Мартыненко и др.; Отв. редактор А.С Герд. СПб.: Изд-во С.-Петербург. Ун-та., 1996. 528с.
49. Пушкина Е.Н. Личные местоимения в субстантивном анафорическом замещении/Горьк. гос. пед. ин-т иностр. яз. им. Н.А. Добролюбова. Горький, 1989. — 20 с.
50. Рафикова Н.В. Психологические исследования процессов понимания текста. Тверь, 1999.
51. Рецкер Я.И. О закономерных соответствиях при переводе на родной язык. Теория и методика учебного перевода. — М., 1950.
52. Рождественский Ю.В. Типология слова. М., Высшая школа, 1969, 321 с.
53. Русская грамматика. Т2: Синтаксис. М., 1980.
54. Русская грамматика. Т2. Синтаксис. М., 1970.
55. Синтаксический компонент в системах машинного перевода//ВЦП. Сер. 2, Машинный перевод и автоматизация информационных процессов. Обзорная информация. Вып. 5. М., 1981. 130 с.
56. Словарь русского языка: В 4-х т/АН СССР, Ин-т С48 рус.яз.; Под ред. А.П.Евгеньевой. — 2-е изд., испр. И доп. — М.: Русский язык, 1981.T.I. А-Й. 1981.- 698 с.
57. Фреге Г. Смысл и денотат. // Семиотика и информатика. 1977. -Вып. 8. - с.181-210.
58. Чижаковский В.А., Беляева Л.Н. Тезаурус в системах автоматической переработки текста. Кишенев, 1983. 163 с.
59. Шаляпина З.М. Англо-русский многоаспектный автоматический словарь (АРМАС)//Машинный перевод и прикладная лингвистика. Вып. 17. М., 174.-с. 7-67.
60. Языкознание БЭС/Гл.ред. В.Н. Ярцева — 2-е изд.- Я41М.: Большая Рос. Энциклопедия, 1998. 685 е.: ил.
61. Якобсон Р. Лингвистика и поэтика// Структурализм «за» и «против». М., 1975.
62. Ariel Mira, Assessing Noun-Phrase Antecedents. London: Routledge, 1990.-320 p.
63. Arnold D. Machine translation: an introductory guide. Cambrige University Press. 1992. p. 340.
64. Bobrow D.G. A question-answering systemfor high school algebra word problems/ AFIPS conference proceedings. 1964. p. 16, pp. 591-614.
65. Chomsky Noam, Lectures on Government and Binding. — Dorchester: Foris, 1981.-250 c.
66. Chomsky Noam, Some Concepts and Consequences of the Theory of Government and Binding. Cambridge, Mass.: The MIT Press, 1982. - 240 c.
67. Chomsky Noam, Knowledge of Language: Its Nature, Origin and Use. — New York: Praeger, 1986. 220c.
68. Chomsky Noam, The Minimalist Program. Cambridge, Mass.: The MIT Press, 1995.-210c.
69. Clark Herbert H. and Marshall Catherine C., Definite reference and Mutual Knowledge. Joshi, Webber and Sag, 1981. - 160 p.
70. Clark Herbert H. Using language. Cambridge: Cambridge University Press. 1996.
71. Dorr B.J. Machine Translation: A View from the Lexicon. Cambridge, MA, MIT, 1993.-432 p.
72. Dugas A., Labelle D. Le groupe nominal N1 de N2 et autres suites N de N// Informatique and Langue Naturelle, I.L.N. 93, Actes. Dec. 2-3, 1993, Nante. Universite de Nantes, 1993. pp.445-456.
73. Evans Gareth Pronouns, qualifiers and relative clauses I. Canadian Journal of Philosophy. 1977. p. 7, pp. 467-536.
74. Geldbach S., Anaphora and translation discrepancies in Russian-German MT // Kluwer Academic Publishers. Internet, 1998.
75. Grimes J. The thread of discourse. The Hague: Mouton Publishers; 1975.
76. Grosz B. The representation and use of focus in a system for understanding dialogs. Technical Note 150, Artificial Intelligence Center, SRI4 1977.
77. Halliday M.A.K., Hasan R. Cohesion in English. London: Longmans, 1976.
78. Halliday M.A.K. Language as social semiotics: The sociological interpretation of language and meaning. London, 1978.
79. Hirst G. Anaphora in natural language understanding: a survey. New York: Springer-Verlag, 1981.
80. Hobbs J.R., Resolving Pronoun References. Lingua'44, 1978. pp. 311-338.
81. Huang Yan, Anaphora. A Cross-linguistic Study. Oxford University Press, 2000. - 396 c.
82. Huang Yan, The Syntax and Pragmatic Anaphora: A Study with Special Reference to Chinese. Cambridge: Cambridge University Press.
83. Hutchins W.J., Somers H.L. An Introduction to Machine Translation. Ac. Press. 1992.-337 p.
84. Hutchins W.J. Recent Developments in Machine Translation. A Review of the last Five Years. New Directions in Machine Translation/Conference Proceedings. Budapest. — 1988. - pp. 7-62.
85. Hutchins W.J. Translation Past, Present, Future. Harwood, 1986, 382 p.
86. Jarafsky D., Martin J. Speech and Language Processing. Upper Saddle, 2002. pp. 672-673, 684-690.
87. Karttunen L. Discourse referents, in J McCawley. Syntax and Semantics 7: Notes from the Linguistic Underground. London: Academic Press, 1976.
88. Kempson R. Grammar and conversation principle. Newmeyer, 1988.
89. Kempson R. Logical form: the grammar cognition interface. Journal of Linguistics, 1988.
90. Lappin, Shalom, Herbert L. An Algorithm for Pronominal Anaphora Resolution. Computational Linguistics. 1994. pp. 525-561.
91. Lust Barbara, Studies in the Acquisition of Anaphora, 2 vols. -Dordrecht: D. Reidel, 1986.
92. Lyons J. Semantics, 2 vols. Cambridge: Cambridge University Press, 1977.
93. Machine Translation: Theoretical and Methodological Issues. Ed. By S Nirenburg. New York, 1987. 350 p.
94. Matsui T. Bridging and relevance. Ph.D. dissertation, University College, London, 1995.
95. Matsui T. Bridging reference and the notion of "topic" and focus'. Lingua, 1994.
96. Mitkov R. Anaphor and Machine Translation. Internet, 1998.
97. Mitkov R. Factors in Anaphora Resolution. Inernet, 1997.
98. Mitkov R. Anaphora Resolution in natural Language Processing and Machine Translation. IAI Working Papers. Saarbrucken, 1995.
99. Quine Wiilard Van Orman. Word and Object. Cambridge, Massachusetts: the M.I.T. Press, 1960.
100. Quirk R., Greenbaum S., Leech G, Svartvik J. A grammar of contemporary English. London: Longmans, 1972.
101. Radford A. Transformational Grammar. A First Course. Cambridge University Press. 1988.- pp. 116-117.
102. Reiger C. Conceptual memory and inference. In Schank R. editor. Conceptual information processing. Amsterdam: North-Holland Press, 1975.
103. Sinder C. Towards a computational theory of definite anaphora comprehension in English discourse. Technical report 537, Artificial Intelligence Laboratory, MIT, 1979.
104. Wasow Th. Reflections on Anaphor // Studies in the Acquisition of Anaphor. Dordrecht etc, 1986, vol. I. - pp. 107-122.
105. Webber B.L. A formal approach to discourse anaphora. New York: Garland Publishing, 1979.
106. Winograd T. Procedures as a representation of data in a computer program for understanding natural language. Technical Report 17, MIT Artificial Intelligence laboratory, 1971.
107. Wilks Y. A preferential pattern-seeking semantics for natural language inference. Artificial Intelligence, 6, 1975.
108. Woods W. Translation network grammars for natural language analysis. Communications of the ACM, 13(10), 1970.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.