Методология минимизации усилий в инженерной лингвистике тема диссертации и автореферата по ВАК РФ 10.02.21, доктор филологических наук Шереметьева, Светлана Олеговна
- Специальность ВАК РФ10.02.21
- Количество страниц 287
Оглавление диссертации доктор филологических наук Шереметьева, Светлана Олеговна
СОДЕРЖАНИЕ
стр.
ВВЕДЕНИЕ
ГЛАВА I. ТЕОРЕТИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ ПРОБЛЕМЫ
ИНЖЕНЕРНОЙ ЛИНГВИСТИКИ
1.1 Предмет инженерной лингвистики и ее значение
1.2. Проблемы анализа текста и представления знаний
1.3. Основные приложения инженерной лингвистики
1.3.1. Машинный перевод
1.3.2. Системы синтеза естественного языка
1.3.3. Системы информационного поиска
1.3.4. Системы извлечения текстовой информации
1.4. Используемые методы экономии усилий в инженерной лингвистике
1.4.1. Экономия усилий через "внешние" компромиссы
1.4.2. Лингвистические возможности экономии усилий
I.5 Выводы
ГЛАВА II. СИСТЕМА МОРФОЛОГИЧЕСКОГО АНАЛИЗА С ОГРАНИЧЕННОЙ
БАЗОЙ ЗНАНИЙ
и.1 Проблемы вычислительного моделирования морфологии
II.2. Морфологический анализ с ограниченной базой
знаний
11.2.1. Лингвистические основы модели
и.2 2. Ожидаемые проблемы морфологического анализа
и возможные пути их решения
II. 2 3 . Морфотактика
II.2.4. Анализ
II. 2. 5. Примеры анализа
• II.3 Выводы
ГЛАВА III. ПРОБЛЕМНО-ОРИЕНТИРОВАННОЕ МОДЕЛИРОВАНИЕ
ПОДЪЯЗЫКОВ
II 1.1 Понятие подъязыка и инженерные параметры
его анализа
III.2. Квантитативный анализ глагольной лексики
• с помощью ЭВМ
111.2 .1. Предварительные замечания
Iii.2.2. Методика анализа
III .2.3. Результаты анализа
II 1.3. Моделирование подъязыка описания изобретения
на устройство, ориентированное на автоматизацию патентного делопроизводства
• Iii.3 .1. Предварительные замечания
II1.3.2. Информационная структура описания изобретения
как продукт коммуникации
III. 3.3 .1. Термины-предикаты формулы изобретения
и методика их анализа
III. 3 .3 .2 . Термины-предикаты ИСЧ "Динамика"
111.3.3.3. Актантная лексика: описание формы и 177 ® материалов изготовления деталей изобретения
111.3.3.4. Актантная лексика: структурно-функциональная 180 классификация
III.4. Выводы
ГЛАВА 1У. УПРОЩЕНИЕ ПРОЦЕДУР АНАЛИЗА И СИНТЕЗА
ЕСТЕСТВЕННОГО ЯЗЫКА НА ПРИМЕРЕ ИНТЕРАКТИВНОЙ
СИСТЕМЫ ОБРАБОТКИ ПАТЕНТНОЙ ИНФОРМАЦИИ
ХУ.1. Предварительные замечания
1У.2. Интерактивное извлечение знаний
IV.2.1. Общая характеристика подхода
ху.2.2. Сценарий извлечения технических знаний
1У.З. Автоматический синтез формулы изобретения
1У.3.1. Предварительные замечания
1У .3.2. Определение содержания
Iу. 3 .3. Планирование текста формулы
1У .3.3.1. Кластеризация шаблонов в узлах
концептуальной схемы
ХУ .3.3.2. От концептуальной схемы к плану текста
ХУ.3.4. Реализация
1У.3.4.1. Обход и линеаризация деревьев
ХУ. 3 .4.2. Грамматикализация
1У.4. Упрощенный автоматический перевод
фомулы изобретения
1У .4.1. К постановке проблемы
1У.4.2. Интерактивный этап анализа
ХУ.4.3. Автоматический этап перевода
1У.3.5. Выводы
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЯ
Рекомендованный список диссертаций по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Построение модели извлечения информации из технических текстов2006 год, кандидат филологических наук Бабина, Ольга Ивановна
Модель синтеза текста формулы изобретения1985 год, кандидат филологических наук Шереметьева, Светлана Олеговна
Модель многоязычного интеллектуального контент-анализа (на материале англо-, франко- и русскоязычных новостных сообщений о террористической деятельности)2022 год, кандидат наук Зиновьева Анастасия Юрьевна
Анализ и синтез многокомпонентных одноэлементных именных групп в действующей системе лексического машинного перевода и повышение её эффективности (на материале английского микроподъязыка антенно-фидерных устройств)1983 год, кандидат филологических наук Ионов, Анатолий Иванович
Метод формального описания содержания сложных естественно-языковых текстов и его применение к проектированию лингвистических процессоров2005 год, доктор технических наук Фомичев, Владимир Александрович
Введение диссертации (часть автореферата) на тему «Методология минимизации усилий в инженерной лингвистике»
ВВЕДЕНИЕ
Методология минимизации усилий в инженерной лингвистике определяет совокупность методов и правил выбора деятельности, включая принципы применения лингвистической теории, для создания автоматических систем обработки текста в условиях ограниченности ресурсов времени и материалов языковых описаний, а также стандартных вычислительных алгоритмов.
АКТУАЛЬНОСТЬ темы определяется тем, что несмотря на разнообразие примененных методов, результаты пятидесятилетних исследований в области инженерной лингвистики (их началом можно считать время возникновения -машинного перевода) нельзя назвать удовлетворительными.
Социально и экономически необходимая система полностью автоматизированной высококачественной обработки любого текста так и не стала реальностью.
Основная причина ввдится в том, что разнообразие и количество знаний, требующихся для решения этой проблемы, в связи с бесконечностью и неоднозначностью естественного языка, просто необьятны и создание лингвистического обеспечения системы, содержащего весь лексический и грамматический арсенал языка, равно как и алгоритмов анализа и синтеза языковых структур требует от разработчиков бесконечно много времени и усилий.
Все современные подходы к автоматической обработке текста либо основаны на правилах (рационалистический подход), либо на статистике (статистический подход), либо сочетают правила и статистические приемы (гибридный подход). При этом даже лучшие коммерческие системы (e.g. SYSTRAN) не могут похвстаться большими технологическими или научными
достижениями. Основой их действия являются огромные составленные вручную словари и грамматики и множество правил ad hoc. Наиболее интересным представляется вопрос, какой из подходов окажется в состоянии дать лучшие результаты, когда будут созданы достаточно объемные базы знаний. Т.е. какая из привнесенных в инженерную лингвистику методик является наиболее многообещающей? Ответ далеко не очевиден и зависит, как от социальных (т.е. объема финансирования), так и от технологических и научных факторов. Основная научная (или методологическая) тенденция в области -эксперименты на предмет выявления того, насколько статистические методы могут улучшить состояние дел в инженерной лингвистике без обращения к трудоемкому процессу приобретения большого количества знаний вручную.
Основная технологическая тенденция - поиск лучших способов сочетания эмпирических и рационалистических подходов.
Основная социальная тенденция - акцент на конкурентоспособность систем автоматической обработки текста.
С одной стороны, это некоторым образом дисциплинирует разработчиков, а с другой, - заставляет их искать частные решения возникающих проблем, которые в перспективе заведомо не слишком многообещающи.
Созданием автоматических информационно-поисковых систем, банков данных, баз знаний, словарей, систем анализа, синтеза и перевода информации в настоящее время все больше занимаются специалисты, не имеющие лингвистической подготовки.
Между тем, для разработчиков интеллектуальных систем необходимы теоретические рекомендации лингвистов, учитывающие, с одной стороны, реальные возможности компьютерной техники, а с другой стороны, принципы
лингвистического анализа, поскольку лингвистический процессор сегодня -неотъемлемая часть любой интеллектуальной системы.
Очевидно, что назрела острая необходимость, анализируя опыт исследований, имеющих определенные результат, выявить реальные возможности прикладной лингвистики и компьютерной техники и выработать методологию построения систем автоматической обработки текста, позволяющую экономить, а в идеальном случае, свести к минимуму усилия разработчиков.
Актуальность темы определяется также предложенными решениями ряда инженерно-лингвистических задач, подтверждающими теоретические положения диссертации. Это конкретные приложения инженерной лингвистики, реализация которых оказалась возможной благодаря использов анию сформулированных в работе принципов минимизации усилий. Приложения имеют непосредственное практическое значение:
1. Морфологический анализатор русского языка с ограниченной базой знаний, реализованный на ЭВМ. Морфологический анализ - неотъемлемая часть любой системы обработки текста, однако, несмотря на достаточное количество морфологических анализаторов, "ни одна из существующих ныне систем морфологической обработки текстов не в состоянии вычислить все возможности морфологических выражений естественного языка; ни один из современных морфологических анализаторов не имеет хорошей модели взаимодействия морфологии и синтаксиса..." (Sproat 1992, р.18). Основная проблема всех современных морфологических анализаторов - зависимость от полноты лексикона, обойти которую при существующих подходах к морфологическому анализу не представляется возможным. Поэтому, попытка обеспечить морфологический анализ без опоры на объемные лексиконы, является достаточно актуальной
2. Автоматизированные методы анализа подъязыка. Актуальность этой разработки определяется ее непосредственной связью с построением баз знаний. Приобретение необходимых знаний - сегодня процесс, требующий ручного труда и, поэтому, долгий и дорогой. Поскольку финансирование дается на весьма ограниченный срок, возникает необходимость существенного увеличения лексикона и грамматики в обозримые сроки. Единственный путь - автоматизация этого процесса и ориентация его на подъязык.
3. Анализ подъязыка патентов и разработка вопросов лингвистического обеспечения многоязычной системы безбумажного патентного делопроизводства. Патенты - один из самых оперативных и содержательных источников информации: каждая десятая публикация в мире относится к патентной документации. Это основное средство защиты коммерческих исследований и разработок.
Совершенно очевидно, что, с одной стороны, без помощи техники невозможно справиться с восприятием всего того, что издается патентными службами, а с другой стороны, само издание патентной информации в значительной мере тормозится трудоемкостью оформления заявок на изобретения. Это отрицательно сказывается не только на их оперативности, но и на качестве что , в свою очередь, затрудняет последующую автоматическую обработку патентов.
О важности автоматизации патентных работ (классификация, индексирование, поиск, аннотирование, реферирование, экспертиза, создание и пополнение баз данных и баз знаний, синтез текстов документов и их перевод на другие языки) свидетельстует все возрастающее число публикаций по этой проблеме (Василевский и др. 1972; Дубовик 1978; Мартыненко 1978; Аполлонская и др. 1983; Бунова,1983; Чарская 1983; Карпилович и др. 1985;
Lawson 1985; Bechel et al. 1985; Vermier 1988; Simmons and Slocum 1972; Simmons 1988; Bourbeau and Kittredge 1988; Вильчинский 1988; Детских 1991; Breton 1991; Valkonen 1991; Toedt 1996), где весьма примечательным является то, что разработчики вынуждены во все большей степени признавать необходимость привлечения лингвистического аппарата.
4. Автоматизированная система многоязычного синтеза формулы описания изобретения, состоящая из интерактивного модуля извлечения технических знаний и модулей многоязычного синтеза и перевода с реализацией одного из модулей на компьютере.
Актуальность этого аспекта работы определяется особым значением патентной формулы, передающей существенные признаки изобретения и определяющей обьем прав автора, а также тем, что все работы в этой области носят экспериментально-теоретический характер и основная часть патентного делопроизводства в настоящее время осуществляется вручную.
Успешное решение перечисленных проблем требует тщательного анализ?, лингвистических аспектов патентной информации, важность которого отмечается как в отечественной, так и в зарубежной литературе, где подчеркивается, что разработку языковых моделей патентных описаний необходимо передать лингвисту. Уже сейчас интуитивно-логический анализ языка не удовлетворяет патентную экспертизу и задачи экспертизы требуют привлечения современных методов анализа языка. В настоящее время не существует лингвистических моделей или четко сформулированных принципов лингвистического анализа, которые можно было бы использовать для лингвистич еского обеспечения автоматических интеллектуальных систем вообще и патентных, в частности. Исследования в этой области находятся на начальном этапе и настоящая работа является их продолжением.
ЦЕЛЬ ИССЛЕДОВАНИЯ заключается в определении системы исследовательских принципов инженерной лингвистики, которые при сегодняшнем уровне развития компьютерной техники и лингвистической науки позволяют уже сейчас достигать практических результатов, и в поверке их на адекватность путем применения к созданию конкретных систем обработки текста.
Достижение поставленной цели предусматривает решение следующих конкретных задач:
1. Анализ и систематизация основных лингвистических концепций, используемых при разработке различных приложений инженерной лингвистики.
2. Определение принципов минимизации усилий при разработке систем автоматической обработки теста.
3. Доказательство сформулированной системы принципов экономии усилий путем их применения при разработке конкретных приложений инженерной лингвистики.
3.1. Разработка вычислительной модели морфологического анализа с ограниченной базой знаний для русского языка и ее реализация на ЭВМ.
3.1.1. Определение морфотактики модели.
3.1.2. Создание базы знаний.
3.1.3. Разработка алгоритмов анализа и синтеза словоформ.
3.2. Разработка формальных методов анализа подъязыка, позволяющих автоматизировать извлечение лингвистических знаний.
3.3. Параллельный анализ подъязыков описания изобретений на устройство России и США, ориентированный на создание базы знаний автоматизированной системы обработки патентной информации.
3.3.1. Разработка метаязыка для описания лексических значений и функционально-структурных характеристик лексики, создание внутренних
словарей системы.
4. Разработка формального языка записи смысла блоков текста отечественной формулы изобретения и проверка его пригод ности для патентной формулы США.
5. Моделирование понимания отечественной и американской патентных формул, через интерактивное извлечение технических и лингвистических знаний.
6. Моделирование автоматического синтеза отечественной и американской патентных формул и компьютерная реализация последнего.
7. Моделирование автоматического превода патентной формулы.
МАТЕРИАЛОМ ИССЛЕДОВАНИЯ служат а) отечественные и зарубежные
публикации по вопросам инженерной лингвистики, б) словари и грамматики русского языка, в) тексты отечественных и американских описаний изобретений на устройства, а также их переводы. Для разработки и апробации методов автоматического извлечения лингвистической информации привлечен дополнительный материал четырех технических подъязыков.
ОСНОВНЫМ МЕТОДОМ ИССЛЕДОВАНИЯ является
индуктивно -дедуктивный подход, реализуемый с применением таких специальных методов как
1 )статистический анализ,
2)ваяентный анализ,
3) анализ с применением математического аппарата теории бинарных
отношений,
4)метод формального моделирования и фреймового представления
информации.
НОВИЗНА исследования заключается в том, что - впервые формулируется методология минимизации усилий при разработке лингвистического обеспечения реально действующих приложений инженерной лингвистики;
- впервые разработан и реализован морфологический анализатор, не требующий объемного лексикона основ, с базой знаний, принципиально отличной от используемых в остальных системах морфологического анализа;
- впервые осуществлена адаптация традиционной морфологической теории к нужцам автоматической обработки текста. Введено понятие квазикорня, которому придается грамматическое значение, в отличие от лексического значения корня в традиционной морфологии;
- впервые разработана совокупность исследовательских средств и последовательность их применения в процессе моделирования подъязыка патентной информации, ориентированная на создание лингвистического обеспечения автоматической системы обработки текста;
патентный языковой материал впервые исследуется с применением разработанных принципов, что обеспечивает новизну полученных результатов;
- впервые создаются элементы лингвистического обеспечения многоцелевой системы автоматической обработки патентной информации;
- впервые составлены словари поддержки эвристической и композиционной деятельности патентоведа;
- впервые разработан ограниченный язык описания изобретений, ориентированный на автоматическую обработку текста;
- впервые доказывается гипотеза о применимости одного аппарата лингвистического анализа к параллельным подъязыкам английского и русского языков и, как следствие, о наличии большого сходства этих подъязыков на всех
языковых уровнях.
- впервые разрабатывается модель понимания и синтеза патентной формулы на русском и английском языках;
впервые разрабатывается упрощенная модель автоматического перевода патентой формулы с русского языка на английский и с английского на русский;
- впервые разработана модель интерактивного извлечения технических знаний об изобретении;
- впервые рализован на ЭВМ модуль автоматического синтеза формулы изобретения на английским языке.
ТЕОРЕТИЧЕСКАЯ ЗНАЧИМОСТЬ работы заключается в развитии теории описания языковых явлений в рамках "инженерной лингвистики" т.е.разработке методов соотнесения статического описания языка с процессами его вычислительной обработки через принципы минимизации усилий разработчика системы в условиях ограниченных ресурсов. Проведение данного исследования вносит определенный вклад в углубление работ сходной направленности.
Теоретически значимым является уточнение представлений о морфологическом строе языков, возможность иной трактовки морфотакгики языка с целью адаптации традиционной морфологической теории к нуждам автоматической обработки текста. Теоретическое значение имеют подкрепленные конкретными разработками положения об инженерно -ориентированном моделировании подъязыков и описании системы сходств и различий в разноязычных подсистемах языка как средства общения, формализованная методика их сопоставления, а также моделирование лигвистических механизмов понимания и синтеза текстов на английском и русском языках
Полученные в работе результаты вносят определенный вклад в
разработку общей таксономии подъязыков науки и техники.
ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ работы состоит в том,что описанная в работе методология минимизации усилий в инженерной лингвистике может оказать существенную помощь при выборе оптимальных способов построения автоматических систем обработки текста.
Реализованная на ЭВМ модель морфологического анализа уже сейчас может применяться в различных системах автоматической обработки текстов; предложенный морфотактический аппарат и методика построения базы данных с минимальными усилиями разработчиков могут применяться для других языков, например сербо-хорватского (эта работа уже начата в Университете штата Нью Мексике, США); предложенные принципы моделирования подъязыка, результаты его применения к подъязыку патентов и разработанные на их основе правила формального анализа и синтеза патентных текстов, а также алгоритмы машинного перевода формулы изобретения дают возможность их реализации как в ручном варианте, так и с использованием ЭВМ.
Результаты исследования могут быть использованы при разработкеавтоматизированной системы безбумажного патентного делопроизводства, что позволит решить следующие задачи:
1. Облегчение труда и уменьшение затрат времени работников патентных служб при составлении патенты документов, индексировании, информационном поиске, проведении экспертизы и т.д.
2.Повышение качества текстов патентных документов: устранение отклонений от грамматических и стилистических норм языка, соответствие всем инструктивным требованиям.
3. Достижение высокого уровня стандартизации и унификации языка патентных документов, вообще и формулы изобретения в
частности, и расширение возможностей и качества всех видов
автоматизированной обра ботки текстов.
Описываемая в работе модель автоматического синтеза и перевода формулы изобретения на устройство допускает дальнейшее развитие и может быть использована при решении проблемы полной формализации процессов понимания и синтеза на одном или нескольких языках (т.е. перевода) всего текста патентного документа, включая автоматическое выделение существенных признаков изобретения из текста описания изобретения.
Результаты исследования могут быть использованы при чтении курсов по функциональной стилистике и прикладной лингвистике, а также для разработки учебных пособий по составлению и переводу патентных документов.
С методической точки зрения примененные в работе методы моделирования подъязыка могут быть полезными для построения формальных моделей синтеза и МП других видов формул (на способ и вещество), а также при анализе других языковых подсистем.
На защиту выносятся следующие положения диссертации:
1. Инженерная лингвистика предполагает включение соображений об анализе и синтезе текстов в описание любого языкового материала или процесса.
2. Методология инженерной лингвистики - это совокупность методов, доказавших свою пригодность для разработки реально действующих систем обработки текста.
3. Методология инженерной лингвистики не представляет собой набор приемов ad hoc или, что то же самое, "мешок" трюков, но обязательным образом опирается на методы лингвистического анализа при современном уровне формализации лингвистических описаний.
4. Методология инженерной лингвистики основана на приемах
минимизации усилий разработчиков систем, вынужденных считаться с объективно существующими ограничениями ресурсов времени и материалов языковых описаний.
5. Методология минимизации усилий в инженерной лингвистике предусматривает
-определение того, такие именно из имеющихся знаний на самом деле полезны для предлагаемого приложения;
- максимальное использование объема знаний, уже имеющегося в дескриптивной лингвистике;
- проведение дополнительных работ по описанию языкового материала в случае нетривиального приложения. При этом важно определить границы необходимого описания, с тем, чтобы не затрачивать усилий на описание не релевантных для конкретной задачи языковых явлений (параметр глубины) и лексического состава и набора грамматических категорий (параметр широты);
- разумное сочетание интенсионального (с помощью свойств или правил) и экстенсионального (списком) способов задания множеств лингвистических единиц, например, списков глаголов с одинаковым набором валентностей;
- использование внешних и внутренних лингвистических компромиссов относительно уровня автоматизации и качества продукции систем инженерной лингвистики: интерактивное взаимодействие с компьютером на разных стадиях обработки текста, ориентация систем на конкретный подъязык, адаптация лингвистических теорий и их аппарата для решения конкретных задач, использование минитеорий, анализ и способы представления
знаний различной глубины, сочетание теоретического и эмпирического подходов в разных пропорциях на различных стадиях обработки текстов;
- автоматизацию построения баз знаний систем инженерной лингвистики с учетом перечисленных выше приемов минимизации усилий, с одной стороны, и возможностей компьютерной техники, с другой; 6. Правомерность предложенной в работе методологии минимизации усилий доказывается конкретными инженерно-лингвистическими разработками, созданными та ее основе:
морфологическим анализатором русского языка с ограниченной базой знаний; методикой проблемно-ориентированного анализа подъязыка,
авторской системой автоматизированной обработки патентной формулы. Основные положения диссертации прошли апробацию в виде докладов на зональных, республиканских, всесоюзных и международных конференциях в В СНГ, Канаде, США, Франции, Англии, проводившихся с 1984 по 1996 гг. (см. список публикаций).
СТРУКТУРА РАБОТЫ. Диссертация состоит из Введения, четырех глав, Заключения, Списка литературы и трех Приложений. По теме диссетрации опубликованы 33 работы. Основные из них:
Шереметьева С.О. О формальном синтезе формулы изобретения. //Научно-техническая информация, сер.2, N.5,1984.
Буторов В .Д., Шереметьева С.О. Алгоритмический синтез формулы изобретения. //Научно-техническая информация, сер.2, N.7, 1985.
Шереметьева С.О. Прагматика синтаксиса текста в специфической коммуникации/Предложение и текст. Ленинград,ЛГУ, 1988.
Шереметьева С.О., Сарьян В.К. О лингвистическом обеспечении системы безбумажного делопроизводства по оформлению заявок на изобретения. // Научно-техническая информация, сер.2, N.9,1990.
Шереметьева С.О., Сарьян В.К. Об одном подходе к автоматическому переводу формулы изобретения.//Научно-техническая информация, сер.2 N.6, 1991.
Буторов В .Д., Шереметьева С.О. Семангико -синтаксические статистические характеристики предикатов патентной формулы. /Структурная и Прикладная лингвистика. Ст. Петербург. Из-во Ст. Петербургского Университета. 1993.
Шереметьева С. О., Сарьян В.К. Извлечение и формализация лингвистических знаний.//Научно-техническая информация., сер.2,N6.1994.
Шереметьева С.О., Ниренбург С. Эмпирическое моделирование в вычислительной морфологии//Научно-техническая информация., сер.2, N5. 1996.
Шереметьева СО., Ниренбург С. Интерактивная система извлечения знаний в патентном делопроизводстве.//Научно-техническая информация., сер.2, N8.1996.
Шереметьева С.О., Ниренбург С. От интерактивного извлечения знаний к реализацииавтоматичесхого синтеза патентной формулы. //Научно-техническая информация., сер.2, N9.1996.
Sheremetyeva, S. Typologie quantitative d'un sous-langage et traduction automatique. Ш- Journees Scientifiques Lexicomatique et Dictionariques. Montréal. Canada. 1993.
Sheremetyeva, S. 1995. Analyse du Résumé de Brevets a la Base de la Stratification du Lexique Oriente vers la TA IV-es Journees Scientifiques Lexicomatique et Dictionariques. Lyon, France.
Sheremetyeva S. and Nirenburg S. Interactive Knowledge Elicitation in a Patent
Expert's Workstation. IEEE Computer Journal, 1996.
Sheremetyeva,S. and Nirenburg S. Semi-Automatic Authoring of Patent Claims. Technical Report MCCS-96-290. Computing Research Laboratory. New Mexico State University. 1996.
Похожие диссертационные работы по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК
Сопоставительное исследование современного цифрового инструментария автоматизированного перевода (на материале подъязыка «Логистика»)2024 год, кандидат наук Кузьмин Олег Игоревич
Автоматизация анализа массивов текстовых документов в информационно-коммуникационных средах2007 год, кандидат филологических наук Николаева, Ирина Викторовна
Модели и технологии поверхностного понимания текста2002 год, кандидат технических наук Королев, Алексей Николаевич
Теоретические основы и методы построения систем фразеологического машинного перевода2006 год, доктор технических наук Хорошилов, Александр Алексеевич
Статистико-типологический анализ текстов коммерческих контрактов: На материале русского и английского языков1999 год, кандидат филологических наук Улиткин, Илья Алексеевич
Список литературы диссертационного исследования доктор филологических наук Шереметьева, Светлана Олеговна, 1997 год
ЛИТЕРАТУРА
1. Азгальдова И.Б. О передаче знаний, пресуппозиции высказывания и V-экспертной сисгеме//НТИ.- сер.2.- N 1 1990. С.9-11.
2. Аполлонская Т.А. и др. Порождающие и распознающие механизмы I функциональной грамматики. - Кишинев.ПГГИИНЦА, 1987. - 171 С.
3. Аполлонская Т.А. и др. Машинное реферирование французских патентных \ документов спомощью фреймов//НТИ. - сер.2, N 5.- 1983. С.23-29.
4. Апресян Ю.Д. О сильном и слабом управлении (опыт количественного анализа)//Вопросы языкознания. N.3.- 1964. С.32-49.
5. Апресян Ю.Д. Экспериментальное исследование семантики русского глагола. М. Наука, 1967. -252 С.
6. Апресян и др. Лингвистическое обеспечение системы ЭТАП-2. М. Наука, 1989.-295 С.
7. Апресян Ю.Д., Богуславский И.М., КрысинЛ.И., Лазурский A.B., Перцов П.В., Санников В.В. Лингвистическое обеспечение в системе автоматического перевода ЭТАП - 1// Разработка формальной модели естественного языка, Новосибирск. - 1981. -294 С.
8. Арапов М.В. Предвидимые изменения в информационной среде общества// НТИ.- сер.2. - N 1 1991. С.1-5.
9. Белоногов Г.Г., Зеленков Ю.Г. Алгоритм морфологического анализа русских слов//Воггросы информационной теории и практики. Москва.- 1989. С. 35 - 42.
10. БлюменауД.И. Неключевая лексика и ее функции в алгоритмических процедурах избирательного свертывания научно -технических текстов//НТИ. сер.2. -1988. - С.38-45.
11. Богданов В.В. Семантико-синтаксическая организация предложения. Л. ЛГУ -1977. -204 С.
12. Богданов В.В. Роль предикатов и непредикатов в семантике предложения/ Структурная и прикладная лингвистика. Вып.2. - 1983,- С.52-63.
13. Большаков И .А. Многофункциональный словарь-тезаурус для автоматизированной подготовки русских текстов//НТИ,- сер.2.1993. N7, С.24-26.
14. Бунова М.А. Лингвостатисгический анализ лексики классификации изобретений//НТИ, сер.2 N4.- 1983. - С. 15-23.
15. Буторов В.Д. Об одной грамматике валентностей/Лингвистические проблемы моделирования речевой деятельности. Вып.4 JI. ЛГУ.- 1979.- С.146-155.
16. Василевский А.Л. О некоторых особенностях патентной литературы в связи с проблемами автоматической обработки научно -технической информации/ Труды III Всесоюзной конференции по информационно- поисковым системам и автоматизированной обработки информации т.1. М.ЦНИИПИ. -1972.- 157 С.
17. Василевский А.Л. и др. Алгоритм автоматического перевода описаний изобретений с английского языка на русский. М. ЦНИИПИД972. - 157.
18. Вендлер 3. О слове good/ Новое в зарубежной лингвистике. Вып. 10 М. Прогресс, 1981.- С.531-554.
19. Вильчинский С.С. Семантические особенности патентной документации. // НТИ сер.2,-N 5.-1988.- С.18-20.
20. Гак В.Г. К проблеме семантической синтагматики/Проблемы структурной лингвистики. М.: Наука.- 1972. - С.367-395.
21. Герд А.С. Ассоциативные отношения в информационном тезаурусе и пути их вьщеления//НТИ сер. 2. N 5.- 1980.-С. 14-16.
22. Городецкий Б.Ю. Методы семантического анализа подязыка. М.:МГУ.-1971. -414 С.
23. Городецкий Б.Ю. Компьютерная лингвистика: моделирование языкового общения// Новоев зарубежной лингвистике. Вып.24, М.:Прогресс. -1989. СД-16.
24. Городецкий Б.Ю. Терминоведение и переводоведение. // Перевод и лингвистика текста: Перевод и Лингвистика Текста. - М.: Всероссийский Центр Переводов.- 1994. - С.54-63.
25. Дементьева Л.Б. Системы гиперзаписи информации//НТИ сер.2.- N 2. - 1990. -С.2-7.
26. Детских Р.В. Структурно-семантический и коммуникативный статус заголовков рефератов к патентам в системе автоматической переработки текста. Автореф на соиск. учен. ст. канд. филолог, наук. Минск. 1991. -24 С.
27. Дубовик O.K. Некоторые структурно-семантические и стилистические особенности английских научно -технических текстов (на материале журнальных статей и патентов) Автореф.на соиск. уч.ст. канд. филолог, наук. М.-1978. -18 С.
28. Зализняк A.A. Грамматический Словарь Русского Языка. Москва:Русский Язык. 1980.- 880 С.
29. Зубов A.B. О вероятностно-алгоритмическом подходе к порождению текста/ Экспериментальная фонетика и прикладная лингвистика. Минск.: МГПИИЯ -1980.- С. 126-238.
30. Зубов A.B. Системы автоматизации научных исследований в филологии/ Квантитативная лингвистика и автоматический анализ текстов. Ученые записки тартусского гос.ун-та. Вып.913. Тарту,- 1990-. С.34-54.
31. Зубов А.В.,Зубова И.И. Основы лингвистической информатики. у Компьютерная лингвистика. 4.2. Минск. МГПИИЯ- 1992.- 135 С.
32. Извлечение знаний из научного текста в полуавтоматическом режиме //Ш конференция по искусственному интеллекту КИИ-92. - Т.1. - Тверь: НИИ "Центрпрограммсистем". 1992. - С.98-100.
33. Инструкция по государственной научно -технической экспертизе изобретений. -1982. -263 С.
34. Казакевич O.A. Использование текстовых баз данных в лингвистических исследованиях. Обзор зарубежныхработ.//НТИ. сер.2. -1988.-N 6. - С.6-17,
35. Караулов Ю.Н. Методика исследования и машинный фонд русского языка./ Машинный фонд русского языка Идеи и суждения. М.: Наука.-- 1986.-С.13-25.
36. Карпилович Т.П. Семантико-синтаксические аспекты порождения простых предложений английского научно-технического текста. Дисс.... канд.филолог, наук. Л.: ЛГУ:-1984.-187 С.
37. Карпилович Т.П. и др. Англо-русский перевод заголовков патентов по материально-техническому снабжению/ Тезисы международной конференции "Теория и практика научно-технического первода"М.- 1985.-С.141.
38. Кибрик А.Б. Очерки по общим и прикладным вопросам языкознания. М. 1992. С. 184-186.
39. Ключко Н.В. Некоторые вопросы классификации патентных документов при проведении патентных исследований//Вопросы изобретательства N 12.-1983.-. С. 36-38.
40. Кокун Л. М. Семантические сети как средство представления информации/ Эвристические модели в психологии и социологии т. 3 Киев.- 1983. - С. 18-26.
41. Кузнецов А.М. Структурно-семантические параметры в лексике М.: Наука. -1980. -160 С.
42. Кулагина О.С. Исследования по машинному переводу. М.:НАУКА, - 1979. -319 С.
43. Лазурский A.A. Морфологический компонент для лингвистических процессоров./Материалы 2ой ежегодной конференции Ассоциации Искусственного Интеллекта СССР. Пересяавль-Залесский. 1990
44. Леонтьева H.H. Семантика связного текста и единицы информационного анализа. - НТИ, сер.2 1981, N 1.С.21-29.
45. Малков М.Г., Волкова И.А., Грацианова Т.Ю. Лингвистический процессор ТУЛИПС-2: морфологический компонент//Разработка и Применение Лингвистических Процессоров. Новосибирск, ВЦСО АН СССР-1983. С.34-42.
46. Мартыненко Г.Я. Некоторые лингвистические аспекты двойственной природы патентой документации.//НТИ сер. 2 1979, N 10, С. 11-15.
47. Марчук Ю.Н. Проблемы машинного перевода. М.: Наука, 1983.233 С. v
48. Мельчук И А Опыт теории лингвистических моделей "Смысл-Текст" М. Наука, 1974.
49. Могилевский В.М. Лингвистические особенности формулы изобретения на устройство.//Вопросы изобретательства, 1978, N 12, С.26-28.
50. Москальская О. И. Проблемы системного описания синтаксиса. М. Высшая школа: 1981.- 175 С.
51. Нелюбин Л.Л. Перевод и прикладная лингвистика. М.: Высшая школа, 1983. 208 С.
52. Олейникова Б.Е. Моделирование синтеза текста на основе фреймового подхода (на материале письменного коммерческого дискурса). Автореферат на соиск. ученой степени кандидата филлилог. наук. Москва.: МГУ.- 1995.-18 С.
53. Падучева Е.В. О семантике синтаксиса. Материалы к трансформационной грамматике русского языка. М.:Наука.-1974.-292 С.
54. Перлмуттер Д.М., Пост ал П.М. О формальном представлении структуры , предложения. / Новое в зарубежной лингвистике. Вып.П. М.: Прогресс,
1982, С.76-82.
55. Пешковский А.М. Русский синтаксис в научном освещении. М.: Учпедгиз, 1956.-511 С.
56. Пиотровский Р.Г.,Корнеев Л .А., Бычков В.А. Компьютер в преподавании ^ языка. Учебное пособие по специальному курсу. Новгород. Новгородский гос.ун-т. 1996.- 89 С.
57. Почепцов Г.Г. Конструктивный анализ структуры предложения. Киев: Вшца школа, 1971. - 191 С.
58. Севбо И.П. Структура связного текста и автоматизация реферирования.
Москва.Наука, 1969. - 135 С.
59. Серов В.Р.,Козлова И.В. Моделирование тематических структур предметных областей//НТИ сер .2.-N 7 1990.- С.22-26.
60. Сидоров Г.О. Разработка и реализация лингвистического обеспечения систем с морфологическим анализом/синтезом для русского языка. Автореферат диссерт. на соиск. уч.степ. канд. филол. наук. - М.: МГУ им. Ломоносова, 1995. 29 с.
61. Скороходько Э.Ф. Лингвистические проблемы обработки текстов в автоматизированных информационно-поисковых системах.//Вопросы информационной теории и практики. 1974. N25, С. 5-120.
62. Скороходько Э.Ф. Семантические сети и автоматическая обработка текста. Киев: Наукова думка, 1983. - 218 С.
& е
63. Соснинский А.Б. Штамповые грамматики и компьютерный перевод
математических текстов//НТИ. сер.2. N 1. - 1991. - С.22-27.
64. Степанова, М.Д., Хельбиг Г. Части речи и проблема валентности в современном немецком языке. М.: Высшая школа, 1978.
65. Стоколова И.А. Смысловыражающие средства информационных языков "стандартных фраз"//НТИ. - сер.2. N 6 - 1971. - С.15-17.
66. Ступкин В.В., Старизный А.Б., Казаринова М.Т. Средства индексирования, используемые при подготовке базы данных по гидрометеорологии// НТИ сер.2. N 5. -1990. - С.32-36.
67. Субботин М.М. Новая информационная технология: создание и обработка гипертекстов //НТИ сер.2. N 5. -1988. - С. 1-6.
68. Терещенко С.С. Проблемно -ориентированные базы и банки данных для научных исследований//НТИ сер.2 N 7. -1990. - С. 11-17.
69. Федосюк М.Ю. Синтаксические особенности научно -технических рефератов и формул изобретений. Автореф. на соиск. уч. ст. канд. филолог, наук. М. 1977.-24 С.
70. Филлмор Ч. Основные проблемы лексической семангики./Новое в зарубежной лингвистке. Вып.12.М.: радуга, 1983, С.74-122.
71. Фосгер Дж. Автоматический синтаксический анализ. М. Прогресс. -1975. - 71 С.
72. Хомский Н. Синтаксические сгруктуры./Новое в зарубежный лингвистике, т.2. М.: Иностранная литература, 1962, С.412-527.
73. Храковский В.С. Пассивные конструкции./Гипология пассивных конструкций. Диатезы и Залоги. Л.: Наука, Ленинград, 1974, С.5-45.
74. Цейтин Г.С. Черты естественного языка и формальной модели/Вопросы кибернетики. Общение с ЭВМ на естественном языке.МНаука, 1982, С.31-38.
75. Чарская Т.К. Статистическая структура текста патентного документа. Дисс.на соиск. уч. ст. канд.наук. ЛЛ983, -148 С.
76. Чейф У. Значение и структура языка. М.Прогресс, 1975 - 432 С.
77. Чижаковский В.А., Беляева Л.Н. Тезаурус в системах автоматической обработки текста. Кишинев: Штиинца, 1983. 163 С.
78. Шайкевич А.Я. Иванова Н.С. Лингвостатистический анализ патентных текстов и создание автоматизироанных систем обработки патентной документации.//Вопросы изобретательства. 1970. N8. С.46-48..
79. Шаляпина З.М. Семантические элементы, семантические отношения и их взаимосвязь в системе элементарных семантических единиц. - В кн.: Представление знаний и моделирование процесса понимания. ВЦ СО АН СССР, Новосибирск, 1980, с. 31-46.
80. Шевенко С.М. Лингвистические проблемы автоматической обработки \ информации (по материалам японских лингвистических журналов) М.ИНИОНД976. -143 С.
81. Шепелев Н.П., Кичкин И.И., Скорняков Э.П. Крегов Б.К Методика выявления изобретений. Кемерово, 1978. 143 С.
82. Шингарева Б А О двух направлениях представления семантики текста
(тезаурус и фрейм). - Научно-техническая информация, серия 2,1982, №2, ]/ с.58-64.
^ 83.79. Шрамм А,Н. Структурные типы лексических значений слова (на ^
материале качественных прилагательных) .//Филологические науки, 1981, N.2, С.58-64.
84. трейдер Ю.А. Машинный перевод на основе смыслового кодирования \ текстов. - Научно-техническая информация, 1963, №1, с.34-38.
85. Allen,J. >М.S .Hunnicutt and D.Klatt. From Text to Speech: The MITalk System.
9 Cambridge: Cambridge University Press. 1987.- 147 p.
86. Amsler R.A., and White J. Development of a computational methodology for deriving natural language semantic structures via analysis of machine-readable dictionaries. National Science Foundation, Tech. Rep. Mcs77-01315. 1979. - 78 p.
87. Antworth,E. PC-KIMMO: A Two-Level Processor for Morphological Analysis. In: Occasional Publications in Academic Computing 16, Summer Institute of Linguistics, Dallas. 1990. pp. 81-85.
88. Ashmanov I. Grammar and Style Checker for Russian Texts. In: Proceedings of Dialog'95 International Workshop on Computational Linguistics and its Applications. Kazan, Russia. 1995. pp.95-98.
89. Attardo D.H. Lexicographic Acquisition: A Theoreticatical and Computational Study of Linguistic Heuristics. Ph.D.thesis, Graduate Interdepartmental Program in Linguistics, Purdue University, West Lafayette, Indiana.- 156 p.
• 90. Baker D.C. The problem of implicit knowledge. Expert systems. - Vol.4. N 3. - 1987. -
pp. 144-151.
91. Bateman J.A. Basic Technology for Multilingual Theory and Practice: the KPML development environment. In: Proceedings of International Joint Conference on Artificial Intelligence Workshop on Multilingual Text Generation. Montreal 1995, pp. 1-12.
92. Bateman J.A., DegandL., and Teich E. Multilingual Textuality: Some Experiences from Multilingual Text Generation. In: Proceedings of the Forth European Workshop on Natural Language Generation, Pisa Italy, 28-30 April, 1993, pp.5-17.
93. Battin P.The electronic library. Collection Management. Vol.9. N 2-3. - 1987,- pp.133-141.
94. Beale S. and Nirenburg S. Dependency-Directed Text Planning. In: Proceedings of International Joint Conference on Artificial Intelligence. Workshop on Multilingual Text Generation. Montreal 1995, pp.13-21.
95. Bechel H. et al. On line patent searching - useful but still in its infancy. World Patent Information v.7. 1985,- pp.68-82.
96. Ben Ari D. et al. Translational Ambiguity Rephrased. In: Proceedings of the Second International conference on Theoretical and Methdological Issues in Machine Translation, Pittsburgh, PA. 1988. pp.34-41.
97. Boguraev B.K. and Briscoe, T., (eds.). Computational Lexicography for Natural Language Processing. Longman Group, Harlow, London, 1989. 98 p.
98. Bolshakov I. A. A Large Russian Morphological Vocabulary for IBM compatibles and methods of its compression. In: Proceedings of the 13th International Conference on Computational Linguistics COLING-90. Helsinki, Finland. 1990. pp. 102-104.
99. Boose J.H. A survey of knowledge acquisition techniques and tools. Knowledge acquisition. V.l. 1989. pp.3-37.
100.Bourbeau L., Kittredge R.Project d'automation aux brevets et inventions: traduction assiste par ordinateur (rapport final) Ministère de la Consommation et des Corporations Canada, Direction des Systèmes Automatises, Bureau de la propriété intellectuelle, 1988. -230 p.
101.Breton E.J. Indexing for invention.. Journal of the American society for information science.-1991- 42(3)pp.l73-177.
102.Brown P.F., Cocke, J., Delia Pietra, S.A., Delia Pietra V.J., Jelinek, F., Lafferty, J.D., Mercer, R.L. and Roossin, P.S. A statistical approach to machine translation. Computational Linguistics, v.16, N 2 June 1990. pp.79-85.
103.Byre D. Teaching the Passive. In: English Language Teaching, 1966, Vol.20, No 2 pp.127-130.
104.Carbonell J.G, Mitamura, T. and Nyberg, E. The KANT Perspective: A Critique of Pure Transfer (and Pure Interlingua, Pure Statistics,..). In: Proceedings of the Fourth International conference on Theoretical and Methodological issues of Machine translation.Montreal, 1992.- pp. 225-236.
105.Chomsky, N. 1965. Aspects of the Theory of Syntax. Cambridge, MA, MIT Press.
106.Chomsky, N. 1977. Essays on Form and Interpretation. Amsterdam, Elsevier North-Holland.
107.Church K.W. A stochastic parts program and noun phrase parser for unrestricted text. In: Proceedings of the Second Conference on Applied Natural Language Processing. ACL. Moristown, N.J., 1988. pp. 136-143.
108.Church K.W. and Hanks P. Word association norms, mutual information, and lexicography. Computational Linguistics, 16,1,1990, pp.22-29.
109.Clark H.H. Some Structural Properties of Simple Active and Passive sentences. Journal of verbal Learning and Verbal Behavior, 1965, Vol.4 No 4, pp.365-370.
110.Cline B.E. and Nutter J.T. Conceptual Revision for Natural Language Generation. In: Proceedings of the Student session of the 29th Annual Meeting of the ACL. 1991.
• pp. 67-69.
111.Cooke,N.J. Varieties of knowledge elicitation techniques. International Journal of Human-Computer Studies V.41.1994. pp. 89-175.
112.Connolly, J.H. and S.C.Dik (eds.) Functional Grammar and the Computer. Functional Grammar Series, No.10,. Amsterdam: Foris.
113.Copestake A. and Sparck Jones K. Natural language interfaces to databases. The • Knowledge Engineering Review 5, 4,1990. pp.225-249.
114.Cordingley,E.S. Knowledge elicitation techniques for knowledge-based systems. In: D.Diaper (ed.) Knowledge Elicitation: Principles, Technoques and Application, New York: Wiley and Sons. 1989. pp. 89-175.
! 15.Cowie J., and Lehnert W. Information Extration. Communications of the ACM. Vol 39, No.l, January 1996, pp.80-91.
116.Croft W.B., Turtle H.R. and Lewis D.D. The use of phrases and structred queries in information retrieval. In: Proceedings of the 14th Annual Internationa] ACM SIGIR Conference on Research and Development in Information Retrieval. ACM/SIGIR, New York, 1991. pp.32-45.
117.Dale, R. Generationg Referring Expressions: Constructing Descriptions in a Domain of Objects and Processes. Cambridge, MA: MIT Press. 1992.
118.DARPA. Proceedings of the 3d Message Understanding Conference (MUC-3). San Diego, Calif., Morgan Kaufmann. 1991,- 215 p.
119.DARPA. Proceedings of the 4th Message Understanding Confercnmce (MUC-4). Fredricksburg, Va., Morgan Kaufmann. 1993,- 187 P
120.DaSaiva G. and Dwiggins D. Toward a Prolog text grammar. In: SIGART 72 1980. pp. 23-31.
121.DeJong G.F. An overview of the FRUMP system. In: Strategies for Natural Language Processing. W.G.Lehnert and M.N.Ringle, eds. Erlbaum, Hillsdale, N.J. 1982,
pp.149-176.
122.Delannoy J.F.,Feng C., Matwinn S., and Szpakowicz, S. Knowledge extraction from text: Machine learning for text-to-rule translation. In: Proceedings of the Workshop on Machine Learning Techniques and Text Analysis, EcML93. Vienna. 1993. pp.11-17
123.Essays On and In Machine Translation by the Cambridge Language Research Unit. Cambridge (England). 1959.
124.Feiner, S. and K. McKeown. Coordinating Text and Graphics in Explanation Generation. In: Proceedings of the Speech and Natural Language Workshop. Cape COd, MA, October 1989.
125.Friedman C. Automatic Structuring of sublanguage information. In: Analysing language in restricted domains.London.-1986.- pp.85-102.
126.Gabriel,R. Deliberate writing. In: D.D.McDonald and L. Bole, editors, Natural Language Generation Systems. Springer-Verlag, New York, NY. 1988.-231 pp.
127.Gachot D. The SYSTRAN Renaissance. In: Proceedings of MT Summit, Munich, 1989.-pp. 60-66.
128.Gergely T., Finn V.K. On the theory of the plausible reasoning. Technical Report. Budapest. Applied Logic Laboratory.-1987.-32 p.
129.Greimas A.J. Semantic structurale. Recherche de methode. Paris: Larousse, 1966, - 262 p.
130.Grishman R., Kittredge R. (editors). Analysing Language in restricted domains. London, 1986,- 246 p.
131 .Grishman, R. Tipster Phase II Architecture Design Document, version 1.52. TIPSTER Architecture Working Group. 1995.- 54 p.
132.Guthrie L.,J.Pustejovsky, Y.Wilks, B.M.Slator. The Role of Lexicons in Nutural Language Processing. Communications of the ACM. Vol.30, No.l, January 1996. pp.63-72.
133.Hahn U. Automatic generation of hypertext knowledge bases. In: Proceedings of the Conference on Office Information Systems. Palo Alto. Calif., 1988 pp.71-73.
134.Hartley, A. and C. Paris. Supporting Multilingual Document Production: Machine Translation or Multilingual Generation? In: Proceedings of the IJCAI-95 Workshop on Multilingual Text Generation. Montreal, 1995, pp.34-41.
135.Hawkins D.T. Application of Artificial Intelligence and Expert Systems for Online Searching. Online Vol.l2N 1.- 1988.- pp.31-43.
136.Harris Z. Mathematical Structures of Language. London etc. Wiley & Sons. 1968.- 230 p.
137.Heinisz-Dostert R.,Macdonald R., and Zarechnak M., eds. Machine Translation, Mouton Publishers, The Hague, The Netherlands, 1979. - 197 p.
138.HirshmanL. et al. Grammatically based automatic word class formation. Information processing and management, Issuell, 1975. - pp. 39-57.
139.Hirshman L. Discovering Sublanguage Structures. In: Analyzing language in restricted domains.London.- p.211-216.
140.Hirst G., and Ryan M. Mixed-Depth Representations for Natural Language Text. In: Jakobs P.S. (ed.), Text-Based Intelligent Systems. Current research and Practice in Information Extraction and Retrieval. Hillsdale, N.J. 1992. pp.59-82.
141.HobbsG. Processing of Real-World Natural-Language Texts. In: Jakobs P.S. Ed., Text-Based Intelligent Systems. Current research and Practice in Information Extraction and Retrieval. Hillsdale. N.J. 1992. pp. 13-32.
142.Hoffman, R.R. Procedures for efficiency extracting the knowledge of experts. Technical Report for Contact No.F49620-85-C-00013. Air Force Office of Scientific Research. 1995.- 77 p.
143.Hovy E.H. Sentence Planning Requirements for Automated Explanation Generation. Diamod 23,1992. - 98 p.
144.Hovy E.H. Deepening Wisdom or Compromizing Principles ?-the Hybridiztion of Statistical and Symbolic MT Systems. In IEEE Extert. April 1996. pp. 13-16.
145.Hovy E.H., Lavid J., Maier E., Mittal V. and Paris C.L. Employing Knowledge Resources in a New Text Planner Architecture. In: R.Dale, E.H.Hovy, D.Rosner and O.Stock (eds.), Aspects of Automated Natural Language Generation. LNAI 587, Springer Verlag, 1992. pp.57-72.
146.Huang X. Mid Fiedler A. Generating Multilingual Proofs. In: Proceedings of International Joint Conference on Artificial Intelligence Workshop on Multilingual Text Generation. Montreal 1995. pp.54-63.
147.Hutchins W.J. Machine Translation: Past, Present, Future. Chichester, UK: Ellis Horwood, 1986.-382 p.
148.Hutchins W.J., and H.L.Somers. An Introduction to Machine Translation. Cambridge: Cambridge University Press. 1992. - 257 p.
149.Inui,K., Tokunaga,T.,and Tanaka,H.Text revision: a model and its implementation. In: Dale, R., Hovy,E., Roesner,D., and O.Stock (eds.), Aspects of Automated Natural Language generation. Springier-Verlag. 1992. pp. 215-230.
150.1sabelle, P. Machine Translation in the TAUM Group. In: M.King (ed.) Machine Translation Today. Edinburgh University Press, 1987.
151.1sabelle P. Bi-Textual Aids for Translators. In: Proceedings of the Eighth Annual Conference of the University of Waterloo Centre for the New OED and Text Research, University of Waterloo, Waterloo, Ontario, Canada, 1992. pp.23-29.
152.Jacobs P.S. (ed.), Text-Based Intelligent Systems. Current Research and Practice in Information Extraction and Retrieval. Hillsdale, N.J. 1992. - 281 p.
153.Jacobs P.S. Introduction: Text Power and Intelligent Systems. In: Jacobs P.S. (ed.), Text-Based Intelligent Systems. Current Research and Practice in Information Extraction and Retrieval. Hillsdale, N.J. 1992. pp.1-12.
154.Johnson M.C. Syntactic position and rated meaning. Journal of verbal Learning and Verbal Behavior, 1967, Vol.6, No2. pp.240-246.
155.KajiH. HICATS/JE A Japanese to English Machine Translation System Based on Semantics. In: Machine Translation Summit (Proceedings of MT Summit I, Hakone, Japan,1987) Tokyo: Ohmsha, 1989, p.101-106.
156.Karttunen L. KIMMO: a general morphological processor. In: Dalrymple et al., eds., Technical Report, Center for Study of Language and Information. Standford University. 1983.- 87 p.
157.Kay M. The Proper Place of Men and Machines in Language Translation. Research report CSL-80-11. Xerox Palo Alto Rsearch Center, Palo Alto, California, 1980. 112 p.
158.Kay M. the MIND system. In: Natural Language Processing, New York: Algorithmic Press., 1973. - p. 155-188.
159.Kee M.L. et al. Source Text Analysis. In: The KMBT-89 Project: A Case Study in Knowledge based Machine Translation. San Mateo: Morgan Kaufmann, 1991. - pp. 165-188.
160.Kittredge,K., Polguere,A., and Goldberg,E. Synthersizing Weather Forecasts from Formatted data. In: Proceedings of the 11th International Conference on Computational Linguistics. COLING. 1986. pp. 563-565.
161.KittredgeR., Iordanskaja L., Polguere A. Multilingual Text generation and the Meaning-Text Theory. In: Proceedings of the Conference on Theoretical and Methodological Issues in Machine Translation of Natural Languages, Carnegie Mellon University, Pittsburgh, PA, June 1988. pp.134-139.
162.Koskenniemi,K. A General computational model for word form recognotion and production. In: Proceedings of COLING-84. Stanford. 1984,- pp. 115-121.
163.Kosseim L. and Lapalme G. Content and rethorical Status Selection in Instructional Texts. In: Proceedings of the Seventh International Workshop on Natural Language Generation. Kennebunkport, Maine, 1994. pp.53-60.
164.Krovetz R. and Croft W.B. Lexical Ambiguity and Informaton Retrieval. ACM Transactions on Information Systems, 10,2. 1992. pp. 1 i 5-141.
165.Kukich K. Knowledge-Based Report Generation: a Knowledge Engineering Approach to Natural Language Report Generation. Ph.D.thesis, University of Pittsburgh. 1983. -179 p.
166.LawsonV. The language of patents. A typology of patents with particular reference to machine translation. Lebender Sprachen. n 2.- 1983.- pp.58-62.
167.Lewis D.D. and Sparck Jones K.. Natural Language processing for Information Retrieval. Communications of the ACM. 1996. January, Vol.39. No.l. pp.92-101.
168.Linden, K. Vander. Speaking of Actions: Choosing Rhetorical Status and Grammatical Form in Instructional Text Generation. Ph.D. Thesis, University of Colorado. 1993.
169.Linden K.Vander, Scott D. Raising the Interlingua Ceiling with Multilingual Text Generation. 1995. - 131 p.
170.Majumder D.D. A Unified Approach to artificial Intelligence, Pattern Recognition, Image Processing and Computer Vision in Fifth Generation Computer Systems. Information Science Vol.45. N3.- 1988. - pp.391-431.
171.Mann W. An Overview of the PENMAN Text Generation System. Technical Report ISI/ RR-83-114,ISI, Marina del Rey, CA, 1983. - 79 p.
172.Mann W. and Matthissen C.M. A demonstration of the Nigel Text Generation Computer Program. In: R.Benson and J .Greaves, (eds.), Systemic Perspectives on Discourse: Selected Papers from the Ninth International Systemic Workshop, Ablex, London, 1985, pp.50-83.
173.Mahesh,K. Ontology Development for Machine Translation: Ideology and Methodology. NMSU CRL MCCS 95-287. 1995. - 54 p.
174.Mahesh,K. and L,Wilson. Ontology Acquisition: Guidelines and Technology. NMSU CRL MCCS 95-292.1995. - 69 p.
175.Mahesh,K. and Nirenburg.S. A situated ontology for practical NLG. In: Proceedings of the Workshop on Basic Ontological Issues in Knowledge Sharing, International Joint Conference on Artificial Intelligence (IJCAI-95), Montreal, Canada, August 1995. pp. 24-28.
176.Martine? C.,Lucey J.JLinderE. An Expert System for Machine-aided Indexing. Journal of Chemical Information and Computer Sciences Vol.27. - 1987. - pp. 158-162.
177.Matwin S. and SzpakoviczS. Text Analysis:How Can Machine Learning help? In: Proceedings of the 1st Conference of the Pacific Association for Computational Linguistics (PACLING). Vancouver, Canada. 1993. pp.33-42.
178.McDonald,D. Issues in the Choice of a Source for Natural Language Generation. Computational Linguistics (19)1. March 1993. pp.191-197.
179.McLean I.J.Example-Based Machine Translation using Connectionist Matching. In: Proceedings of the Fourth International Conference on Theoretical and Methodological Issues in Machine Translation. Montreal, 1992. - pp.35-43.
180.MeIby A.K. 1982. Multy-level translation aids in a distributed system» In: Proceedings of Coling'82(Prague) 1982. pp.215-220.
181.Meteer,M.W. The generation gap: the problem of expressibility in text planning. Ph.D.thesis, University of Massachussets at Amherst. 1990.-156 p.
182.Meteer, M.W. The implications of revisions for natural language generation. In: Paros,C.,Swartout,W.,and Mann,C., (eds.), Natural Language Generation in Artificial Intelligence and Computational Linguistics. Kluwer Academic Publishers, Boston. 1991. pp.91-115.
183.Meteer M.W. Bridging the Generation Gap between Text Planning and Linguistic Realization. Computational Intelligence, 7(4), 1991. pp. 41 -49.
184.Mikheev A. and Liubushkina L. Russian Morphology: An Engineering Approach. Natural Language Egineering 1(3). 1995. pp.235-260.
185.Musen,M.A. An Overview of Knowledge Aquisition. Standford University Knowledge Systems Laboratory Report KSL-92-58, updated February 1993. - 75 p.
186.Nagao M. A Framework of a Mechanical Translation between Japaneese and English by Analogy Principle. In: Artificial and Human intelligence. Amsterdam:North Holland. 1984. - pp. 173-180.
187.NirenburgS.,Beale S. andK. MaheshThe Mikrokosmos Semantic Analyzer. In: Proceedings of the International Conference on Computational Linguistics, Bangkok,Tailand. 1995. pp. 115-119.
188.Nirenburg S. Machine Translation. In: Encyclopedia of Computer Science and Technology (A.Kent and G.Williams, editors), v.23, supplement 8, Marcel Dekker, INC. New York and Basel, 1990. pp.179-197.
189.Nirenburg S., Carbonell J., TomitaM., Goodman K. Machine Translation: A knowledge-Based Approach. San Mateo, California, 1992. - 251 p.
190.Nirenburg S. The inflexible fickleness of fashion. IEEE EXPERT Vol.11, N 2. April 1996. pp.15 -16.
191.Nirenburg S., Beale S., Helmreich S., Mahesh K., Viegas E., Zajac R. Two Principles and Six Techniques for Rapid MT Development. In: Proceedings of the Second Conference of the Association for Machine Translation in the Americas, Canada. Montreal, 2-5 October, 1996, pp.96-105.
192.Nirenburg, S. and V. Raskin. 10 Choices for Lexical Semantics. NMSU CRL Technical Report MCCS-96-294. 39pp.
193.0nyshkevych,B.,and Nirenburg,S. The Lexicon in the Scheme of KBMT Things. Technical Report MCCS-94-227. Computing Research Laboratory. New Mexico State University. 1994. 65 p.
194.Pajon P. Edition electronique. Ver de nouvelles regies du jen. Documentaliste Vol.24 N.4-5. - 1987. - pp. 159-163.
195.Paris C., Vander Linden, K., Fisher M., Hartley A., Pemberton L., Power R.and Scott D.A Support Tool for writing Multilingual Instructions. In: Proceedings of IJCAJ-95.V.2, pp. 1398-1404. Montreal. 1995.
196.Parsay K., Chignell M., Khoshafian S. and Wong H. Intelligent Databases. Willey, New York. 1989.- 187 p.
197.Pentheroudakis,J.E. and D.W.Higinbotham. Morphogen: A Morphology Grammar Builder and Dictionary Interface Tool. In: Proceedings of thel991 Meeting of the Desert Language and Linguistics Society. 1991. pp. 158-162.
198.Peter, G and D. Rosner. User-Model-Driven Generation of Instructions. In: User Modeling and User-Adapted Interaction, Vol.3,1994, pp.289-319.
199.Piotrowski R.G. Psycholinguistic basis of linguistic automation. International Journal of Psycholinguistics. V 10. N 1.1994. pp. 15-32.
200.Piotrowski R.G. Mathematical Linguistics and Linguistic Automation. Mathematical Linguistics and related topics. Bucarest. EAR. 1995. pp. 283-298.
201.Pustejovsky J. The Generative Lexicon. Computational Linguistics, 17,4,1991. pp.409-441.
202.Quillian MR. The Teachable Language Comprehender: A Simulation Programme and Theory of Language. In: Communications for the ACM. 1969, Vol.12, No 8. pp.459-475.
203.Quine W.V.O. Two dogmas of empiricism from a logical point of view. Cambridge, Mass.: Harvard University Press, 1953. pp.20-46.
204.Raskin V. What is Therein Linguistic Semantics for Natural Language Processing? In: Proceedings of 1987 Natural Language Planning Workshop, September 20-23 1987. Blue Mountain Lake, NY. 1987. pp.78-96.
205.Raskin V. and Nirenburg S. Lexical Semantics of Adjectives. A Microtheory of Adjectival Meaning. Technical Report MCCS-95-288, CRL, NMSU, 1995. 63 p.
206.Ratridge D. The Scope and Limitation of First Generation Expert Systems. Future Generations of Computer Systems. N 3.1987. pp. 1 -7.
207.Raymond D.R.,Tompa F.W.M. Hypertext and Oxford English Dictionary. Communications of ACM Vol.31 N 7.1988. pp.871-879.
208.ReiterE.B. Has a consensus natural language generation architecture appeared and is it psycholiguistically plausible? In: Proceedings of the 7th International Workshop on Natural Language Generation. June 1994. pp. 163-170.
209.ReiterE.B., Mellish C. andLevine L. Automatic Generation of Technical Documentation. In: Applied Artificial Intelligence, Nol, 1995. pp. 563-572.
210.Results of Survey on Trends in Expert Systems in Japan. Future Generations of Computer Systems N 3. 1987. pp.17-36.
211.Ritchie,G.D.,A.W.Black, S.G.Pulman and G.J.Russell. The Edinburgh/Cambridge Morphological Analyzer and Dictionary System. Version 3.0. Unpublished MS. 1991. -43 p.
212.Robin,J. Revision-Based Generation of Natural Languages Summaries Providing Historical Background. Corpus-Based Analysis, Design, Implementation and Evaluation. Technical Report CUCS-34-94. Columbia University. 1994. - 203 p.
213.Rosner D. andStede M. Towards the Automatic Production of Multilingual Technical Documents. Technical Report FAW-R-91022, Research Institute for Applied Knowledge Processing (FAW), Ulm, Germany. 1991.-117 p.
214.Rosner D. and Stede M. Generating Multilingual Documents from a Knowledge Base: theTECHDOC project. In: Proceedings of the 15 International Conference on Computational Linguistics (COLING 94), Kyoto, Japan, v.l, 1994. pp.339-346.
215.SagerN. Sublanguage Linguistic Phenomenon, Computational tool. In: Analysing language in restricted domains. London. 1986. pp. 1-18.
216.Salton G. Another Look at Automatic Text-Retrieval Systems. Communications of ACM, 1986. Vol.29. No 7. pp. 648-656.
217.Salton G. and Buckley C. Improving retrieval performance by relevance feedback. Journal of American Society for Information Science, 1990. Vol.41, No 4. pp.288-297.
218.Sanders M. The Rosetta Translation System. Technical Report, Philips Reseach Laboratories, Eindhoven, The Netherlamnds. 1988. - 51 p.
219.Sanfilippo A. et al. Translation equivalence and Lexicalization in the ACQUILEX LKB. In: Proceedings of the International Conference on Theoretical and Methdological issues of Machine Translation, Montreal. 1992.- pp. 1-20.
220.Schank R. Semantics in Conceptual Analysis. Lingua, 1972, Vol.30 Nos 3/4, pp. 101-140.
221.Schank R., Goldman N., Reiger C. Riesbeck C. Inference andParaphrase by Computer. In Journal of the ACM, 1975, Vol.22, No 3, pp.309-328.
222.Scott D.R. Generating Multilingual Instructions. Contribution to the panel on "Instructions: Language and Behavior". In: Proceedings of the International Joint Conference on Artificial Intelligence (IJCAI-93). Chambery, France. 1993. - pp. 112-113.
223.Sharoff S. and Sokolova L. Analysis of Rethorical Structures in Technical Manuals and Their Multiligual Generation. In: Proceedings of International Joint Conference on Artificial Intelligence on Multilingual Text Generation. Montreal 1995, pp. 119-128.
224.Shaw D, Readability of Documentation for User Searchers. Online Revue. Vol.13. N 1., 1989, pp. 119-128.
225.Simard M. et al. Using Cognates to Align Sentences in Bilingual Corpora. In: Proceedings of die Fourth International Conference on Theoretical and Methodological Issues of Machine Translation, Montreal, 1992, pp.67-81.
226.Simmons R., Slocum J. Generating English Discource from Semantic Networks. Communications for the ACM, 1972, Vol.15 No 10pp. 891-905.
227.Simmons E.S., Kaback S.M. Online patent information: doubleheader. World patent Information. Vol. 10.- 1988.-pp.204-206.
228.Slocum, J. A Survey of machine Translation: Its History, Current Status, and Future Prospects. Computational Linguistics, Vol. 11, 1985, pp. 1 -17.
229.Smadia F.A. From n-grams to collocations: An evaluation of Xtract. In: Proceedings of the 29th Annual Meeting of the Association for Computational Linguistics. June 18-21 Berkeley, Calif. ACL, Morristown, N.J.,1991 pp.279-284.
230.Sowizral H.A. Expert Systems. Annual Revue of Information Science and Technology. Vol.20.1985. pp. 179-199.
231.Sparck Jones K. Search term relevance weighting-some recent results. Journal of Information Science. 1980. Vol.1 pp.325-332.
232.Sparck Jones, K. Information Retrieval Experiment. Butterworth, London, 1981. -154 p.
233.Sproat R. Morphology and Computation. MIT Press. Cambridge. Massachusetts. 1992. -295 p.
234.Teich E.Towards a Methdology for the Construction of Multilingual Resources for Multilingual Generation. In: Proceedings of International Joint Conference on Artificial Intelligence on Multilingual Text Generation. Montreal 1995, pp. 137-148.
235.Toedt D.C. Reengineering the Inventor Interview. Journal of the Patent and Trademark Office Society. Vol.78, No 1. 1996, pp. 31-50.
236.Toma P. Systran As a Multi-Lingual Machine Translation System. In: Commission of European Communities: Overcoming the Language Barrier. Dokumentation Verlag, Munich. 1977. pp.129-160.
237.Tzoukerman, E. and M. Liberman. A Finite-State Morphological Processor for Spanish. In: Proceedings of COLING-90, Helsinki, 1990.
238.Uchida, H. ATLAS-II: A Machine Translation System Using Conceptual Structure as Interlingua. In: M.Nagao (ed.), Machine Translation Summit. Tokyo: Ohmsha, 1989.
239.Valkonen, P. An expert system for patent classification. World Patent Information, v. 13, n.3.-1991.- pp.143-148.
240.Vasconcellos M, Leon M. SPANAM and ENGSPAN: Machine Translation at the Pan American Health Organization. Computational Linguistics, 1985. - v.l 1 pp. 122-136.
241. Vaughn M. and McDonald D.D. A Model of Revision in Natural Language Generation. In: Proceedings of the 23rd Annual Meeting of the ACL, Columbia University, New York, 1986. ACL. pp. 227-234.
242.Vauquois B. et al. Autimated translation at Grenoble University. Computational Linguistics v. 11. 1985. pp.28-36.
243.Vermier D. et al. Applying AI techniques for patent information retrieval. World Patent Information. v.10.-1988. pp.26-36.
244.Wahlster, W., E. Andre, W. Finkler, H.-J. Profitlich, T. Rist. Plan-Based Integration of Natural Language and Graphics Generation. Artificial Intelligence 63, 1993, pp. 387-427.
245.WaIker D.E. et al. The Use of Machine Readable Dictionaries in Sublanguage Analysis. In: Analyzing language in restricted domains. London. 1986. pp.69-83.
246.Walker D., Zampolli A.,and Calzolari N., (eds.). Automating the Lexicon. Oxford University Press, Oxford, England, 1993.- 186 p.
247.Weaver W. Translation. In Machine Translation of Languages, In: W.Locke and A. Booth, eds., MIT Press, Cambridge, Mass., 1955.
248.WehrIi, E. Design and Implementation of a Lexical Data Base. In: Proceedings fo the Second European Meeting of ACL, 1985.
249.WilksY., Guthrie L., Guthrie J., Cowie, J.. Combining Weak Methods inLarge-ScaleText Processing. In: Jakobs P.S. Ed., Text-Based Intelligent Systems. Current research and Practice in Information Extraction and Retrieval. Hillsdale, N.J. 1992. pp.35-58.
250.Wilks Y. A.., Slator B.M. and Guthrie L. Electric Words: Dictionaries, Computers, and Meanings. MIT Press, Cambridge, Mass., 1995. - 267 p.
251.Wilks Y. Introduction to the Special Issue on NPL In Communications of the ACM. Vol.30, No.l, January 1996a. p.62.
252.Wilks Y. Machine Translation: a Hybrid View. IEEE EXPERT. April 1996b. p.10-13.
253.Willet P., (ed.). Document Rewtrieval Systems. Taylor Graham, London, 1988. - 227 p.
254.Wong W.K.C. and Simmons R.F. A Blackboard Model for text production with Revision. In: Proceedings of the AAA! worshop on Text-Planning and Realization. St-Paul, MN, 1988. pp. 75-77.
255.Yazdani M. Reviewing as a Component of the Text Generation Process. In: G.Kempen, (ed.), Natural Language Generation: New Results in Artificial Intelligence, Psychology and Linguistics. Martinus Ninjhoff Publishers, 1987. pp. 181-192.
256. Yngve V.N. a Model and a Hypothesis for Language Structure. In: Proceedings of American Philisiphical Society. Vol.104, No 5,1960. pp.444-446.
257.Young S.R. and Hayes P.J. Automatic Classification and Summarization of Banking Telexes. In: Proceedings of the Second Conference on Artificial Intelligence Applications. Dec.l 1-13, Miami Beach, Fla. IEEE Computer Society Press, Los Alamitos, Calif.,1985 pp.402-408.
258.Zarechnak M. The History of machine translation. Machine translation trends in linguistics: Studies and monograghs, V.XI, The Hague: Mouton, 1979. - 314 p.
259.Zernik U., (ed.). Lexical Acquisition: Exploiting On-line Resources to build a Lexicon. Erlbaum, Hillsdale, N.J. 1991.-101 p.
260.Zernik U. Corpus-Based Thematic Analysis. In: Jacobs P.S. Ed., Text-Based Intelligent Systems. Current research and Practice in Information Extraction and Retrieval. Hillsdale, N.J. 1992. pp.101-121.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.