Компрессия научного текста: методы и модели тема диссертации и автореферата по ВАК РФ 10.02.21, кандидат наук Дубинина, Екатерина Юрьевна

  • Дубинина, Екатерина Юрьевна
  • кандидат науккандидат наук
  • 2013, Санкт-Петербург
  • Специальность ВАК РФ10.02.21
  • Количество страниц 276
Дубинина, Екатерина Юрьевна. Компрессия научного текста: методы и модели: дис. кандидат наук: 10.02.21 - Прикладная и математическая лингвистика. Санкт-Петербург. 2013. 276 с.

Оглавление диссертации кандидат наук Дубинина, Екатерина Юрьевна

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ

ГЛАВА 1 РЕФЕРИРОВАНИЕ КАК ОСОБЫЙ ВИД

АНАЛИТИКО-СИНТЕТИЧЕСКОЙ ПЕРЕРАБОТКИ ТЕКСТА

1.1 Научный текст как объект реферирования

1.1.1 Первичные и вторичные документы

1.1.2 Текст и текстуальность

1.1.3 Лингвистическая специфика научной статьи

1.1.4 Структура научной статьи и возможность ее использования для построения реферата

1.2 Реферат как вид вторичного документа

1.2.1 Реферат и его функции

1.2.2. Критерии классификации рефератов

1.2.3 Методы интеллектуального реферирования

1.3 Методы и системы автоматической компрессии текстов

1.3.1 Системы автоматического индексирования

1.3.2 Типология систем и методов автоматического реферирования

1.3.3 Статистические методы автоматического реферирования

1.3.4 Позиционные методы автоматического реферирования

1.3.5 Современные системы автоматического реферирования

1.4 Учет «сильных» позиций научной статьи в процессе реферирования

Выводы к Главе

ГЛАВА 2 РАЗРАБОТКА БАЗОВЫХ ПРИНЦИПОВ КОМПРЕССИИ НА ОСНОВЕ СОПОСТАВИТЕЛЬНОГО АНАЛИЗА РЕФЕРАТОВ

И НАУЧНЫХ СТАТЕЙ

2.1 Процедура создания и характеристика структуры массива текстов авторских рефератов и научных статей

2.1.1 Процедура создания исследовательского массива текстов

2.1.2 Характеристика внешней структуры исследовательского массива текстов

2.1.3 Характеристика внутренней структуры исследовательского массива текстов

2.1.4 Характеристика текстов авторских рефератов и заглавий

2.2 Процедура выделения ключевых лексических единиц из заглавия

и авторского реферата

2.2.1 Создание сводного словаря антипризнаков

2.2.2 Выделение простых именных групп из заглавия

и авторского реферата

2.3 Характеристика именных групп, выделенных из заглавия и авторского реферата

2.3.1 Анализ именных групп, выделенных из заглавий научных статей

2.3.2 Анализ именных групп, выделенных из рефератов научных статей

2.4 Использование именных групп, выделенных из заглавия и авторского реферата, в тексте статьи

2.4.1 Анализ распределения именных групп разной длины в тексте статьи

2.4.2 Анализ распределения именных групп с разной степенью распространенности в тексте статьи

2.5 Выявление закономерностей распределения именных групп в тексте научной статьи

2.5.1 Анализ распределения именных групп по структурным разделам статьи

2.5.2 Оценка информативности именных групп

Выводы к Главе

ГЛАВА 3 РАЗРАБОТКА И АПРОБАЦИЯ АЛГОРИТМИЧЕСКОЙ МОДЕЛИ

РЕФЕРИРОВАНИЯ НАУЧНОГО ТЕКСТА

3.1 Понятие лингвистической модели компрессии и принципы

ее разработки

3.1.1 Лингвистические проблемы моделирования процесса компрессии

3.1.2 Базовые компоненты модели процесса реферирования

3.1.3 Пример подсчета веса предложений

3.2 Программная реализация модели и оценка полученных результатов

3.2.1 Тестирование системы

3.2.2 Оценка качества автоматических рефератов

Выводы к Главе

ЗАКЛЮЧЕНИЕ

СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ

СПИСОК ЛИТЕРАТУРЫ

СПИСОК ИЛЛЮСТРАТИВНОГО МАТЕРИАЛА

ПРИЛОЖЕНИЕ 1. Общая характеристика массива статей англоязычных

авторов

ПРИЛОЖЕНИЕ 2. Общая характеристика массива статей

российских авторов

ПРИЛОЖЕНИЕ 3. Частотный словарь служебной лексики

ПРИЛОЖЕНИЕ 4. Алфавитный словарь общей и общенаучной лексики

ПРИЛОЖЕНИЕ 5. Словарь антипризнаков

ПРИЛОЖЕНИЕ 6. Количественный состав именных групп

в заглавиях статей англоязычных авторов

ПРИЛОЖЕНИЕ 7. Количественный состав именных групп

в заглавиях статей российских авторов

ПРИЛОЖЕНИЕ 8. Количественный состав именных групп в рефератах статей англоязычных авторов

ПРИЛОЖЕНИЕ 9. Количественный состав именных групп

в рефератах статей российских авторов

ПРИЛОЖЕНИЕ 10. Ключевые лексические единицы, выделенные при сопоставлении реферата, заглавия и статьи

в массиве текстов англоязычных авторов

ПРИЛОЖЕНИЕ 11. Ключевые лексические единицы, выделенные при сопоставлении реферата, заглавия и статьи в массиве текстов российских

авторов

ПРИЛОЖЕНИЕ 12. Количественные характеристики PIT в массиве текстов

российских авторов

ПРИЛОЖЕНИЕ 13. Примеры сводных словарей малокомпонентных и многокомпонентных именных групп к массиву текстов

англоязычных авторов

ПРИЛОЖЕНИЕ 14. Словарь типизированных конструкций

ПРИЛОЖЕНИЕ 15. Примеры результатов работы программы автоматического реферирования

Рекомендованный список диссертаций по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК

Введение диссертации (часть автореферата) на тему «Компрессия научного текста: методы и модели»

ВВЕДЕНИЕ

Актуальность данного исследования обусловлена постоянно растущими потребностями современного информационного общества, основанного на экономике знаний, в совершенствовании систем автоматической переработки текстовой информации, в частности систем компрессии информации, извлекаемой из текстов различной природы и состава; кроме того, возрастание роли английского языка в процессе межкультурной и межнациональной коммуникации, а также рост объемов специальных текстов определяют необходимость создания специализированных систем для компрессии и перевода текстов с английского языка и на него.

Работы в области автоматизации свертывания текстовой информации ведутся с 1950-х годов и связаны с именами таких исследователей, как X. Лун, У. Хан, Г. Эдмундсон, П. Баксендейл, Г. Г. Белоногов, В. Е. Берзон, В. П. Захаров, Т. П. Карпилович, Н. Н. Леонтьева, Н. А. Пащенко, Л. В. Сахарный, Э. Ф. Скороходько, Е. А. Шингарева, В. А. Яцко и др. За это время был создан ряд экспериментальных и практических систем, в которых доля участия человека постепенно уменьшается. В аналитическом обзоре У. Хана и И. Мани указывается, что сегодня существует два подхода к решению проблемы компрессии текста [131].

Первый подход предусматривает создание реферата за счет формирования нового текста. Этот подход базируется на семантическом анализе текста на основе информационных языков и предполагает создание и использование базы знаний [131, с. 30].

Второй подход предполагает выделение наиболее информативных фрагментов исходного текста (как правило, предложений) и известен как метод извлечения предложений. После установления набора таких фрагментов

из них составляется реферат, в котором предложения расположены в порядке их появления в тексте.

Второй подход, как утверждает С. Орасан, используется в настоящее время чаще, так как он требует меньшего объема предварительных исследований, что связано с применением различных формальных методов отбора наиболее информативных фрагментов исходного текста [138]. Так, например, в рамках этого подхода можно выделить статистические и позиционные методы автоматического реферирования.

В работе П. И. Браславского подчеркивается, что статистические методы предусматривают выделение из текста слов и/или словосочетаний с наибольшей частотой встречаемости, которые считаются ключевыми [23]. Чем больше таких ключевых слов или словосочетаний присутствует в предложении, тем выше степень его информативности.

В свою очередь, позиционные методы основаны на предположении о том, что наиболее информативными, как отмечает И. В. Арнольд, являются слова и/или словосочетания, которые расположены в определенных, фиксированных фрагментах текста (например заглавие, подзаголовки, введение, выводы) [7].

По мере совершенствования компьютерных технологий к автоматическим системам компрессии текста предъявляются все более высокие требования, прежде всего, как считает Т. П. Карпилович, -интеллектуальности, т. е. компенсации концептуальных различий между процессами построения текста человеком и компьютерной системой [55, с. 19]. Эти требования, в свою очередь, обусловливают необходимость поиска более совершенных подходов к созданию систем компрессии. В связи с этим исследование соотношения текстов рефератов, созданных человеком -автором статьи - и порожденных компьютерной системой является актуальным.

При решении задачи компрессии важно установить, как происходит актуализация основных понятий в научном тексте, в частности в тексте научной статьи. В данном исследовании такими основными понятиями, являющимися главным средством передачи семантической информации о некоторой предметной области, служат именные группы. При этом важно учитывать структуру научной статьи, т. е. такие ее компоненты как заглавие, введение, основная часть, выводы, и особенности именных групп в этой структуре.

Если предположить, что именные группы, номинируя основные понятия статьи, несут основную смысловую нагрузку, то и фрагменты текста, в которых встречаются именные группы, являются наиболее значимыми с точки зрения их информативности. Такие информационно значимые фрагменты текста, передающие в совокупности его основное содержание, могут быть использованы в процессе создания реферата с помощью компьютерной системы. На основании вышеизложенного можно сделать вывод о том, что изучение композиционной структуры научной статьи и особенностей именных групп в данной структуре позволит сузить сферу поиска необходимой информации в тексте в процессе его компрессии.

Таким образом, изучение распределения именных групп в тексте и установление базовых принципов компрессии находится в неразрывной связи с одной из самых актуальных задач в области автоматизации свертывания текстовой информации - проблемой выделения основного содержания текста.

Теоретической основой исследования являются следующие теории и положения.

1. Согласно теории «сильных» позиций текста, наиболее важная информация размещается автором в тех позициях текста, где она будет замечена читателем: в заглавии, первом и последнем предложении, во вводной и заключительной части текста (И. В. Арнольд, Т. П. Карпилович, О. И. Москальская, Г. Г. Москальчук, А. И. Новиков, В. Endres-Niggemeyer).

2. Именные группы являются главными текстообразующими компонентами и передают основную часть семантической информации, содержащейся в научном тексте (Л. Н. Беляева, Г. Г. Белоногов, Р. Г. Пиотровский).

3. Основное содержание текста определяется соответствующим списком ключевых лексических единиц, которые встречаются в тексте и отражают его тему (В. П. Захаров, Н. Н. Леонтьева, Л. В. Сахарный, Н. Ъи1т).

4. Научные статьи имеют определенный, свойственный им порядок расположения компонентов текста и, соответственно, стандартный набор языковых средств для перехода от одного компонента к другому (И. Р. Гальперин, О. И. Москальская, 3. Я. Тураева, В. Е. Чернявская).

5. Составляющими процесса компрессии является анализ первичного текста, его последовательное преобразование и синтез вторичного текста (Т. П. Карпилович, В. А. Яцко, В. Endres-Niggemeyer).

6. Общение человека с компьютерной системой может осуществляться при условии, что в память компьютера будет введена определенная модель, которая представляет собой краткое описание естественного языка (В. Е. Берзон, Р. Г. Пиотровский).

Объект исследования - простые именные группы в авторском реферате и заглавии статьи и их актуализация в тексте научной статьи.

Предмет исследования - соотношение компонентов научной статьи: заглавие - авторский реферат — текст.

Цель исследования - разработка базовых принципов выделения информативных фрагментов текста научной статьи и модели компрессии текста научной статьи на основе исследования соотношения ее компонентов: заглавие — авторский реферат — текст.

Поставленная цель достигается последовательным решением задач: • изучение реферата как особого вида вторичного документа;

• исследование методов реферирования текста и типологии систем реферирования текста;

• создание специального массива научных текстов и его анализ на основе количественных методов;

• выявление простых именных групп в авторском реферате и заглавии научной статьи и исследование их актуализации в тексте статьи;

• установление базовых принципов компрессии текста научной статьи;

• разработка и апробация модели компрессии текста научной статьи.

В соответствии с целью и задачами исследования в работе применяются следующие методы: метод количественного анализа, метод моделирования, метод сопоставительного анализа. Методологической базой работы являются принципы и методы прикладной лингвистики.

Материалом исследования послужили 100 текстов авторских рефератов и соответствующих им научных статей по судостроению, извлеченные из материалов научной конференции «International Conference Fast Sea Transportation», а также журналов «Marine Technology», «International Journal of Small Craft Technology», «Journal of Marine Science and Technology». В анализируемом массиве представлены тексты, которые относятся к двум группам: тексты, написанные на стандартном английском языке (авторы из Великобритании, США, Канады и Австралии), тексты, написанные на «русском» английском языке (авторы из России).

Гипотеза исследования — в тексте научной статьи можно выделить лексические единицы, которые свидетельствуют об уровне информативности отдельных фрагментов текста; в процессе создания реферата компьютерной системой эти лексические единицы могут служить индикаторами для отбора наиболее информативных фрагментов исходного текста.

Научная новизна работы состоит в интегративном исследовании двух самостоятельных, но неразрывно связанных областей переработки текстовой информации: создание реферата человеком - автором статьи, с одной стороны,

и компьютерной системой - с другой. Установлено, что основную роль в процессе компрессии играют простые именные группы; наиболее информативными из них являются именные группы, расположенные в заглавии, введении и выводах. Выявлены закономерности распределения основной информации в тексте статьи, что позволяет установить пути оптимального поиска наиболее информативных фрагментов текста в процессе создания реферата.

Новизну результатов лингвистического исследования составляет создание алгоритмической модели реферирования текста. В этой модели отбор наиболее важной информации происходит на основе базовых принципов компрессии, которые были выработаны в результате сопоставительного анализа представительного массива текстов научных статей и авторских рефератов.

На защиту выносятся следующие положения:

1. Сопоставительный анализ текстов заглавий, авторских рефератов и научных статей позволяет выработать базовые принципы компрессии, которые могут быть использованы при разработке модели реферирования.

2. Получение адекватного реферата научной статьи может основываться на анализе таких ее компонентов как заглавие, введение и выводы.

3. В авторских рефератах основная компрессия осуществляется за счет формирования многокомпонентных именных групп (состоящих их четырех и более компонентов), которые в тексте научной статьи представлены в виде одно-, двух- и трехкомпонентных коллокаций. Именно эти малокомпонентные именные группы целесообразно использовать при автоматизации реферирования.

4. Именные группы, выделенные из заглавия и авторского реферата текста научной статьи, отражают основное содержание исходного текста и могут рассматриваться как ключевые лексические единицы.

5. Установление в тексте статьи ключевых лексических единиц позволяет выделить информационно-значимые фрагменты текста, в совокупности представляющие собой изложение основного содержания текста в компрессированной форме.

Теоретическая значимость результатов исследования определяется созданием модели процесса реферирования, учитывающей основы этого процесса, а также закономерности организации научной статьи. В разработанной модели реферирования учтены все данные, полученные в результате сопоставительного анализа авторских рефератов и научных статей. Проведенное исследование уточняет особенности функционирования именных групп в рефератах и текстах и определяет возможность создания универсальной части лингвистической базы данных для процедуры автоматической компрессии текстов.

Практическая значимость результатов исследования определяется возможностью учета в системах автоматического реферирования стратегий, которыми руководствуется человек при создании реферата; разработкой и апробацией программы автоматического реферирования научного текста, которая при внедрении в промышленные системы будет способствовать ускорению доступа специалистов к необходимой им информации.

Рекомендации об использовании результатов диссертационного исследования. Результаты исследования могут быть использованы для совершенствования систем автоматической переработки текста, при решении задач автоматического реферирования. Основные положения и результаты исследования могут также быть включены в теоретические курсы, практические и семинарские занятия по лингвистике текста, теоретической и практической грамматике английского языка, они могут быть также использованы для обучения построению вторичных текстов.

Апробация работы. Основные положения диссертации были представлены в докладах на международных конференциях «Прикладная

лингвистика в науке и образовании» (март 2010, апрель 2012) и «Гуманитарные науки и современность» (июль 2011), а также на заседаниях кафедры прикладной лингвистики РГПУ им. А. И. Герцена. По теме диссертации опубликовано 6 работ общим объемом 1,79 п. л.

Объем и структура работы. Диссертация состоит из введения, трех глав, заключения, списка литературы, включающего 150 наименований, в том числе 33 на английском языке, списка сокращений, списка иллюстративного материала (5 рисунков и 28 таблиц) и 15 приложений. В приложениях представлены ресурсы лингвистической базы знаний (словари антипризнаков и типизированных конструкций), фрагменты таблиц, отражающих результаты количественного анализа массива текстов, примеры работы программы. Общий объем работы составляет 276 страниц печатного текста: основное содержание изложено на 180 страницах, 96 страниц занимают приложения.

Во введении обосновывается выбор темы исследования, отмечается ряд актуальных проблем в области автоматической переработки текста, определяются объект, предмет, цель, задачи, гипотеза, теоретическая основа и методы исследования, раскрыта его научная новизна, сформулированы положения, выносимые на защиту, аргументируется теоретическая и практическая значимость, даны рекомендации по использованию результатов исследования, отражена апробация работы.

В первой главе диссертации «Реферирование как особый вид аналитико-синтетической переработки текста» дается описание основных видов документов, которые формируются в процессе компрессии текста, определяется понятие реферата и анализируются его функции в системе научной коммуникации, выявляются критерии классификации рефератов. Кроме того, в этой главе описываются системы автоматической компрессии текста, прежде всего, системы автоматического реферирования, проводится анализ основных методов автоматического реферирования текстов. В этой главе также рассматривается специфика научного текста в целом и текста

научной статьи как особого типа текста в частности; при исследовании структуры научной статьи особое внимание уделяется выделению таких ее компонентов как заглавие, введение, основная часть, выводы. Обосновывается необходимость изучения повтора именных групп для исследования базовых принципов компрессии.

Во второй главе диссертации «Разработка базовых принципов компрессии на основе сопоставительного анализа рефератов и научных статей» проводится сопоставительный анализ текстов заглавий и авторских рефератов и соответствующих им научных статей. Этот анализ позволил разработать основные принципы реферирования. Кроме того, в этой главе описывается разработка модели процесса реферирования, которая создана с учетом всех особенностей, выявленных при сопоставлении авторских рефератов и научных статей, дается описание эксперимента по созданию рефератов с использованием разработанной модели, производится оценка качества полученных в ходе эксперимента рефератов.

В третьей главе диссертации «Разработка и апробация алгоритмической модели реферирования научного текста» определяется понятие лингвистической модели компрессии, отмечается ряд проблем в области моделирования процесса компрессии, рассматриваются базовые компоненты модели реферирования, описывается программная реализация разработанной модели, производится оценка качества полученных в ходе эксперимента рефератов.

ГЛАВА 1

РЕФЕРИРОВАНИЕ КАК ОСОБЫЙ ВИД АНАЛИТИКО-СИНТЕТИЧЕСКОЙ ПЕРЕРАБОТКИ ТЕКСТА

1.1 Научный текст как объект реферирования 1.1.1 Первичные и вторичные документы

В условиях усложнения и расширения научной коммуникации наблюдается постоянное возрастание объема информации и знаний. В современном обществе возникает явление, известное как информационный взрыв или информационная перегрузка, когда человек (потребитель) оказывается не в состоянии воспринимать и перерабатывать огромные массивы документов. Темпы количественного роста научных документов можно проследить по возрастанию числа научных журналов в мире, поскольку они, как утверждает С. Орасан, дают до 70% всей научной информации, используемой специалистами [138].

В последнее время с быстрым ростом сети Интернет проблема возрастания объема информации стала еще более острой. В связи с этим специалисту становится все сложнее следить за новой информацией в необходимой ему области знаний или находить информацию, которая была произведена ранее. Ускорить процесс обработки информации и тем самым улучшить информационное обслуживание специалиста позволяет аналитико-синтетическая переработка текста, которая, как отмечает В. Е. Чернявская, сопровождается уменьшением физического объема документа с сохранением его информативности (компрессия текста) [112].

К процессам аналитико-синтетической переработки текста относятся: индексирование, создание библиографического описания, подготовка обзоров, рецензирование, реферирование (аннотирование).

В зависимости от потребностей пользователя первичный документ может свертываться в той или иной степени, при этом образуются различные виды документов, которые по отношению к первичному документу являются вторичными. К ним относятся:

• обзор;

• рецензия;

• библиографическое описание;

• реферат (аннотация);

• поисковый образ.

Рассмотрим каждый из этих видов вторичных документов подробно.

Под обзором, как считает Д. И. Блюменау, понимается текст, содержащий сводную характеристику состояния какого-либо вопроса, со степенью свертывания, являющейся необходимой и достаточной для ориентации определенной категории потребителей информации в документальном или информационном потоке [19, с. 96]. Обзор является результатом свертывания не одного первичного документа, а их определенной совокупности.

Рецензия является вторичным научным текстом, отражающим результат критического переосмысления первичного произведения на основе научной компетенции другого субъекта познания. Главным идентифицирующим признаком рецензии является оценочность. Основное отличие рецензии от других вторичных текстов в научной коммуникации состоит в том, что она не является заместителем вторичного текста, не выполняет дублирующей функции. Рецензия - это ответная реплика интерпретатора в диалоге с другим автором. По мнению В. Е. Чернявской, специфика рецензии проявляется в ее

большей субъектной определенности по сравнению с другими вторичными текстами [111, с. 15].

Следующим видом вторичных документов является библиографическое описание. Согласно ГОСТу 7.1-2003, с. 3, «Библиографическое описание содержит библиографические сведения о документе, приведенные по определенным правилам, устанавливающим наполнение и порядок следования областей и элементов и предназначенное для идентификации и общей характеристики документа» [40, с. 3]. Библиографическое описание включает в себя фамилию автора, заглавие публикации, название издания, его выходные данные, указание на страницы, которые занимает публикация и некоторые другие сведения. В библиографическом описании приводится минимальное количество сведений о первичном документе, необходимых для того, чтобы получить представление о его теме, а также получить адрес для его отыскания. Знаменательные слова заглавия можно использовать в качестве поисковых признаков в системах информационного поиска.

В свою очередь, поисковый образ документа, как отмечает В. П. Захаров, является результатом индексирования - записи содержания документа на специальном информационно-поисковом языке и представляет собой, как правило, список ключевых слов и словосочетаний [51, с. 8].

Среди этих вторичных документов реферат (аннотация) занимает особое место, так как он позволяет осуществлять сжатие (компрессию) документа на максимально объективном уровне свертывания. Остальные вторичные документы, хотя и сжимают в той или иной степени первичный документ, но не отражают так полно и объективно его основное содержание.

Как подчеркивается в работах С. В. Ионовой [54], Н. Л. Сунцовой [96], одним из важнейших качеств вторичного документа, в том числе и реферата, является обязательное наличие определенного прототипа - первичного текста, или прототекста, с которым вторичный документ находится в тесной связи и на основе которого строится. Вторичный текст должен отвечать всем

свойствам текстуальности и воспроизводить основные этапы текстопорождения.

1.1.2 Текст и текстуальность

В качестве объекта реферирования (компрессии) в данной работе исследуются научные тексты. Качественные характеристики текстов, их структура определяют специфические требования к рефератам, полученным в результате компрессии первичного текста. К таким требованиям относятся, прежде всего, семантическая адекватность реферата основному содержанию первичного текста, меньший по сравнению с ним текстовый объем.

В работах последних десятилетий интерес к тексту как к сложному структурно-многоуровневому и многоплановому продукту речевой деятельности возрос в связи с применением формализованных (машинных) методов переработки текстовой информации, используемых, в частности, в системах автоматического реферирования (подробно см. 1.3.2.).

В исследованиях С. П. Анохиной [5, с. 15], М. Я. Дымарского [49, с. 21] отмечается, что современная лингвистика, в которой проблема изучения текста выдвинулась на первый план, ставит перед собой задачу установления наиболее общих закономерностей порождения текстов и их системного описания. Установление закономерностей порождения текстов необходимо и при изучении механизма реферирования.

Текст как сложный продукт речевой деятельности обладает рядом характеристик - обязательных существенных черт, делающих текст текстом. В современной лингвистике совокупность таких текстовых свойств связывается с понятием текстуальность, под которым, как считает В. Е. Чернявская, подразумевается способность конкретного текста обнаруживать ряд специфических свойств, присущих тексту как особому лингвистическому явлению [112, с. 14]. Понятие «текстуальность» и «критерии текстуальности»

были введены Р. Бограндом и В. Дресслером [121]. Критерии текстуальности, т. е. свойства, присущие тексту, позволяют различать текст и «не-текст»: чем большему количеству критериев удовлетворяет текст, тем в большей степени он является текстом. Такими критериями являются: интенциональность, воспринимаемость, информативность, ситуативность, интертекстуальность, когезия, когерентность [121]. Рассмотрение текста с точки зрения перечисленных выше критериев текстуальности дает возможность выработать базовые принципы его компрессии.

Рассмотрим эти критерии подробно.

Интециональность отражает намерение автора создать связный и цельный текст, который оказывает определенное воздействие на читателя.

Воспринимаемость обозначает ожидание читателя получить и воспринять связный и содержательный текст, который является для него нужным или важным (например для приобретения знаний).

Информативность текста складывается, с одной стороны, из количества новой, до этого неизвестной информации, содержащейся в тексте, а с другой стороны, из некоторого количества известной информации. Из этих компонентов для данного исследования наибольший интерес представляет первый компонент - новая информация.

Под ситуативностью, как отмечено в работах М. А. Торгашевой [100] и В.Е.Чернявской [112], понимаются те факторы, которые делают текст релевантным для конкретной коммуникативной ситуации, актуальной или реконструируемой.

Интертекстуальность выражает связь данного текста с другими текстами, в некоторых случаях известными читателю. В исследованиях Л. С. Тихомировой [100], Б. Эндрес-Ниггемейер [129] указывается, что эта связь может быть выражена в виде цитат, косвенной речи, примечаний, сносок ит. д.

Следует отметить, что основными критериями текстуальности являются когезия и когерентность, так как именно они обеспечивают целостность и связность текста, т. е. органическое сцепление его частей.

Под когезией понимаются особые виды связи, обеспечивающие логическую последовательность и взаимозависимость отдельных частей текста. Как отмечается в работах М. Хэллидея [132], а также Б. Эндрес-Ниггемейер [129] когезия не выявляет, что сообщает текст, она выявляет, как текст организован в единое целое. Когезия, по мнению Е. А. Давыдовой, определяет формальную (линейную) связность текста посредством различных языковых средств [44]. Для научных текстов формальная связность играет особенно важную роль, поскольку она, как указывает И. Р. Гальперин, обеспечивает логичность и точность изложения, а также однозначную интерпретацию содержания [33].

Похожие диссертационные работы по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК

Список литературы диссертационного исследования кандидат наук Дубинина, Екатерина Юрьевна, 2013 год

СПИСОК ЛИТЕРАТУРЫ

1. Абрамова, Н. Н. Автоматическое составление обзорных рефератов новостных сюжетов / Н. Н. Абрамова, В. Е. Абрамов // Интернет-математика 2007 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. П. И. Браславский]. — Екатеринбург : Изд-во Урал, ун-та, 2007. — С. 515.

2. Проблемы автоматизации индексирования и реферирования / Н. А. Пащенко, Л. В. Кнорина, Т. В. Молчанова и др. // Автоматизация индексирования и реферирования документов : сб. ст. / под ред.

B. И. Горьковой. — М. : ВИНИТИ, 1983. — С. 7-164.

3. Агранович, Н. Б. Вторичные тексты в коммуникативно-когнитивном аспекте : автореф. дис. ... канд. филол. наук : 10.02.19 / Агранович Надежда Борисовна ; [Ин-т языкознания РАН]. — М., 2006. — 23 с.

4. Англо-русский морской словарь / [ред. В. Ю. Грибовский]. — СПб. : Литера, 2004. — 480 с.

5. Анохина, С. П. Тексты вторичной информативности (коммуникативно-прагматический аспект) : на примере англ. и нем. яз. /

C. П. Анохина, Ф. X. Ниссен, Т. В. Стариннова ; под общ. ред. С. П. Анохиной. — Тольятти : Изд-во Моск. гос. ун-та сервиса, 2000. — 174 с.

6. Апресян, Ю. Д. Идеи и методы современной структурной лингвистики / Ю. Д. Апресян. — М. : Наука, 1966. — 305 с.

7. Арнольд, И. В. Значение сильной позиции для интерпретации художественного текста / И. В. Арнольд // Семантика. Стилистика. Интертекстуальность : сб. ст. / науч. ред. П. Е. Бухаркин. — СПб. : Изд-во С.-Петерб. ун-та, 1999. — С. 223-238.

8. Артемьева, И. Л. Исследование задач для одного класса систем логических соотношений / И. Л. Артемьева, В. В. Суров. — Владивосток : ИАПУ, 1999. —36 с.

9. Бабаева, И. А. Обучение реферированию научно-технического текста / И. А. Бабаева // Вестник Томского государственного педагогического университета. — 2010. — № 1. — С. 53-58.

10. Бабина, О. И. Построение модели извлечения информации из технических текстов : автореф. дис. ... канд. филол. наук : 10.02.21 / Бабина Ольга Ивановна; [Тюмен. гос. ун-т]. — Тюмень, 2006. — 23 с.

11. Базанова, А. Е. Основы реферирования публицистических и научных текстов : учебно-методическое пособие / А. Е. Базанова. — М. : Изд-во РУДН, 2006. — 31 с.

12. Баулина, И. В. Субстантивные словосочетания усложненной структуры в научном стиле речи : на материале текстов по экономике : автореф. дис. ... канд. филол. наук : 10.02.01 / Баулина Ирина Владимировна ; [Рос. ун-т дружбы народов]. — М., 1994. — 15 с.

13. Белоногов, Г. Г. Компьютерная лингвистика и перспективные информационные технологии: теория и практика построения систем автоматической обработки текстовой информации / Г. Г. Белоногов, Ю. П. Калинин, А. А. Хорошилов. — М.: Русский мир, 2004. — 246 с.

14. Беляева, Л. Н. Лингвистические автоматы в современных информационных технологиях : монография / Л. Н. Беляева. — СПб. : Изд-во РГПУ им. А. И. Герцена, 2001. — 130 с.

15. Беляева, Л. Н. Исследование семантико-синтаксической структуры английской именной группы в системном и функциональном аспекте : отчет о НИР / Л. Н. Беляева, О. Н. Камшилова, Г. И. Филимонова. — СПб. : Рос. гос. пед. ун-т им. А.И. Герцена, 2003. — 222 с. — № ГР 01.2.0 310077. — Инв. № ЗН-13/03.

16. Берзон, В. Е. Классификация коннекторов и диалоговые системы автоматического реферирования / В. Е. Берзон, А. Б. Брайловский // НТИ. Сер. 2. Информационные процессы и системы. — 1979. — №11. — С. 19-23.

17. Берзон, В. Е. Синтаксические сверхфразовые связи в английском языке : учеб. пособие / В. Е. Берзон. —Хабаровск : [Б. и.], 1987. — 68 с.

18. Блехман, М. С. Инженерно-лингвистическое моделирование категории определенности при автоматической обработке связного текста : автореф. дис. ... канд. филол. наук : 10.02.21 / Блехман Михаил Самойлович ; [ЛГУ им. А. А. Жданова]. — Л., 1985. — 21 с.

19. Блюменау, Д. И. Информационный анализ / синтез для формирования вторичного потока документов : учебно-практ. пособие / Д. И. Блюменау. — СПб.: Профессия, 2002. — 240 с.

20. Богданов, В. В. Реферирование / В. В. Богданов // Прикладное языкознание : учебник / отв. ред.: А. С. Герд. — СПб. : Изд-во С.-Петербург, ун-та, 1996. — С. 389-398.

21. Богословская, И. В. Денотатная структура содержания текста / И. В. Богословская // Вестник ВЭГУ. — 2011. — № 5. — С. 60-66.

22. Бородина, О. А. Текст научных рефератов как объект лингвистического исследования / О. А. Бородина. — СПб. : Инфо-да, 2005. — 74 с.

23. Браславский, П. И. Автоматическое извлечение терминологии с использованием поисковых машин Интернета / П. И. Браславский, Е. А. Соколов // Компьютерная лингвистика и интеллектуальные технологии : труды Междунар. конф. «Диалог 2007», Бекасово, 30 мая-3 июня 2007 г. / [ред. Л. Л. Иомдин и др.]. — М.: Изд-во РГГУ, 2007. — С. 89-94.

24. Браславский, П. И., Колычев, И. С. Автоматическое реферирование веб-документов с учетом запроса / П. И. Браславский, И. С. Колычев // Интернет-математика 2005 : сб. работ участников конкурса науч. проектов по информ. поиску / [отв. ред. И. В. Сегалович, М. Ю. Маслов, Ю. Г. Зеленков]. — М. : Яндекс, 2005. — С. 485-501.

25. Бронникова, Д. Л. Сопоставительный анализ терминологических единиц лексического корпуса по частотному признаку // Вестник Московского

Государственного областного университета. Серия «Лингвистика». — 2007. — №1. —С. 217-222.

26. Бусел, Т. В. Лингвистические аспекты автоматического порождения англоязычных деловых электронных писем : дис. ... канд. филол. наук : 10.02.21 / Бусел Татьяна Викторовна ; [Мин. гос.лингв. ун-т]. — Минск, 2011. — 113 с.

27. Ванников, Ю. В. Типы научных и технических текстов и их лингвистические особенности : метод, пособие / Ю. В. Ванников. — М. : ВЦП, 1984. —50 с.

28. Виландеберк, А. А. Принципы и методы гармонизации терминологии на основе корпуса специальных параллельных текстов : на материале документов ООН : дис. ... канд. филол. наук : 10.02.21 / Виландеберг Анна Арнольдовна ; [Рос. гос. пед. ун-т им. А.И. Герцена]. — СПб., 2005. —266 с.

29. Виноградов, С. Н. К проблеме интерпретации структуры текста / С. Н. Виноградов // Вестник Нижегородского университета им. Н. И. Лобачевского. — 2010. — № 5 (1) - С. 346-350.

30. Виноградов, С. Н. Термин как средство и объект описания : на материале рус. лингвист, терминологии : монография / С. Н. Виноградов. — Н. Новгород : Изд-во Нижегородского ун-та, 2005. — 229 с.

31. Вишнякова, С. А. Теоретические основы обучения моделированию научного текста (русский язык как иностранный, основной этап обучения) / С. А. Вишнякова. — СПб. : Европ. дом, 2001. — 255 с.

32. Вышегородская, Е. Д. Структура научно-технического текста : на основе текстов по машиностроению : автореф. дис. ... канд. филол. наук : 10.02.01 / Вышегородская Елена Дмитриевна ; [ЛГУ им. А. А. Жданова]. — Л., 1989. — 16 с.

33. Гальперин, И. Р. Текст как объект лингвистического исследования / И. Р. Гальперин. — 5-е изд., стер. — M. : URSS : КомКнига, 2007. — 137 с.

34. Гарипов, Р. К. Структурно-семантические функции субъектных элементов в синтаксической организации предложения и текста / Р. К. Гарипов // Вестник ВЭГУ. — 2008. — № 4. — С. 11-19.

35. Герд, А. С. Введение в изучение языков для специальных целей : учеб. пособие / А. С. Герд. — СПб.: Изд-во С.-Петерб. ун-та, 2007. — 58 с.

36. Гиндин, С. И. Задачи и общее строение системы автоматического индексирования с использованием информационного языка словосочетаний / С. И. Гиндин, Н. Н. Леонтьева // ВИНИТИ, Вопросы информационной теории и практики. — 1975. — № 27. — С. 88-93.

37. Гиренко, Л. С. Плотность научного текста: комплексный подход к ее изучению : автореф. дис. ... канд. филол. наук : 10.02.21 / Гиренко Лариса Сергеевна; [Перм. гос.ун-т]. —Пермь, 2006. — 26 с.

38. Гончаренко, В. В. Фреймы для распознавания смысла текста / В. В. Гончаренко, Е. А. Шингарева ; отв. ред. Р. Г. Пиотровский. — Кишинев : Штиинца, 1984. — 198 с.

39. Гордукалов, И. А. Естественные статистические группировки слов текста с позиции законов их распределения / И. А. Гордукалов // НТИ. Сер. 2. — 2005.—№ 1. —С. 27-35.

40. ГОСТ 7.1-2003. Система стандартов по информации, библиотечному делу. Библиографическая запись. Библиографическое описание. Общие требования и правила составления. — Взамен ГОСТ 7.1- 84; введ.01.07.04. —М.: Изд-во стандартов, 2004. — 48 с.

41. ГОСТ 7.60-2003. Система стандартов по информации, библиотечному и издательскому делу. Издания. Основные виды. Термины и определения. — Взамен ГОСТ 7.60-90; введ.01.07.04. — М. : Изд-во стандартов, 2004. — 36 с.

42. ГОСТ 7.9-95. Реферат и аннотация. Общие требования. — Взамен ГОСТ 7.9- 77; введ.01.07.97. — Минск : Изд-во стандартов, 1996. — 7 с.

43. ГубинМ. В. Эффективный алгоритм формирования контекстно-зависимых аннотаций / М. В. Губин, А. И. Меркулов // Компьютерная лингвистика и интеллектуальные технологии : труды Междунар. конф. «Диалог 2005», Звенигород, 1-6 июня 2005 / [отв. ред.: И. М. Кобозева и др.].

— М.: Наука, 2005. — С. 116-120.

44. Давыдова, Е. А. Участие повтора и перифраза в создании композиционно-смысловой структуры диктем публицистического текста / Е. А. Давыдова // Вестник Московского государственного областного университета. — 2010. — № 5. — С. 18-21.

45. Детскина, Р. В. Структурно-семантический и коммуникативный статус заголовков рефератов к патентам в системе автоматической переработки текста : автореф. дис. ... канд. филол. наук : 10.02.19 / Детскина Раиса Владимировна ; [Мин. гос. пед. ин-т иностр. яз]. —Минск, 1991. — 24 с.

46. Джиоева, А. А. Синтаксизация имени и номинативность английского языка / А. А. Джиоева. — М. : Моск. ассоциация лингвистов-практиков, 1995. — 96 с.

47. Доброхотова, И. Ю. Моделирование соотношения тезауруса и текста при решении некоторых задач прикладной лингвистики : автореф. дис. ... канд. филол. наук : 10.02.21 / Доброхотова Ирина Юрьевна ; [МГУ им. М. В. Ломоносова]. — М., 1983. — 25 с.

48. Добрускина, Э. М. Синтаксические сверхфразовые связи и их инженерно-лингвистическое моделирование / Э. М. Добрускина, В. Е. Берзон.

— Кишинев : Штиинца, 1986. — 167 с.

49. Дымарский, М. Я. Проблемы текстообразования и художественный текст. На материале русской прозы XIX — XX вв. / М. Я. Дымарский. — 2-е изд. — М.: Эдиториал УРСС, 2001. — 328 с.

50. Ефремова, Е. М. Структурно-семантические и функциональные особенности многокомпонентных композитов в современном английском

языке : автореф. дис. ... канд. филол. наук : 10.02.04 / Ефремова Екатерина Михайловна ; [Моск. пед. гос. ун-т]. — М., 2012. — 21 с.

51. Захаров, В. П. Корпусная лингвистика : учебно-методическое пособие / В. П. Захаров. — СПб. : С.-Петербург, гос. ун-т, 2005. — 95 с.

52. Зникина, Л. С. Композиционные и содержательные аспекты процесса формализации научно-технического текста / Л. С. Зникина, Н. А. Заостровская // Вестник Челябинского государственного педагогического университета. — 2009. — № 11. — С. 244-252.

53. Иванова, М. Ю. Общеязыковой статус именных словосочетаний и лексико-семантические парадигмы в научно-техническом тексте / М. Ю. Иванова // Функционирование лексических единиц и грамматических категорий в русском языке : Материалы ежегод. науч. семинара аспирантов / Калинингр. гос. ун-т ; под ред. С. С. Ваулиной. — Калининград : Изд-во КГУ, 2003. —С. 41-46.

54. Ионова, С. В. О двух моделях построения вторичных текстов / С. В. Ионова // Вестник Волгоградского государственного университета. Серия 2, Языкознание. — 2006. — № 5. — С. 69-76.

55. Карпилович, Т. П. Моделирование процесса смысловой компрессии текста: когнитивно-дискурсивный подход : монография / Т. П. Карпилович. — Минск : МГЛУ, 2003. — 226 с.

56. Кияк, Т. Р. Лингвистические аспекты терминоведения : учеб. пособие / Т. Р. Кияк. — Киев : УМКВО, 1989. — 103 с.

57. Комарова, А. И. Функциональная стилистика: научная речь: язык для специальных целей (Ь8Р) / А. И. Комарова. — М. : Эдиториал УРСС, 2004. — 192 с.

58. Кудинова, Т. А. Структурно-семантические особенности многокомпонентных терминов в подъязыке биотехнологий : автореф. дис. ... канд. филол. наук : 10.02.19 / Кудинова Татьяна Анатольевна ; [Орловск. гос. ун-т ]. — Орел, 2006. — 21 с.

59. Кудрявцева, И. Г. Особенности формальной структуры и семантические характеристики терминологических словосочетаний : на материале английской и русской специальной лексики научно-технической области «Интернет» : дис. ... канд. филол. наук : 10.02.20 / Кудрявцева Ирина Геннадьевна ; [Моск. гос. обл. ун-т]. — М., 2010. — 209 с.

60. Кулакова, К. А. Грамматическая категория в аспекте фреймового анализа : на материале научных тезисов : дис. ... канд. филол. наук : 10.02.21 / Кулакова Карина Анатольевна ; [Рос. гос. пед. ун-т им. А.И. Герцена]. — СПб., 2004. — 164 с.

61. Лахути, Д. Г. Автоматизированные документально-фактографические информационно-поисковые системы / Д. Г. Лахути // Итоги науки и техники. Сер. Информатика. — М. ВИНИТИ. — 1983. — т. 12. — С. 7-111.

62. Лейчик, В. М. Терминоведение: предмет, методы, структура / В. М. Лейчик. — 3-е изд. — M. : URSS : ЖИ, 2007. — 254 с.

63. Леонтьева, H. Н. Автоматическое понимание текстов: системы, модели, ресурсы : учеб. пособие / H. Н. Леонтьева. — М. : Академия, 2006. — 304 с.

64. Лосев, А. Ф. Введение в общую теорию языковых моделей / А. Ф. Лосев. — 2-е изд., стер. — М. : Эдиториал УРСС, 2004. — 293 с.

65. Лузина, Л. М. Распределение информации в тексте: когнитивный и прагмастилистеческий аспекты / Л. М. Лузина. — М. : ИНИОН РАН, 1996. — 155 с.

66. Милевская, Т. В. Связность как категория дискурса и текста : (Когнитивно-функциональные и коммуникативно-прагматические аспекты / Т. В. Милевская. — Ростов на Д / : РГУ, 2003. — 336 с.

67. Минский, М. Фреймы для представления знаний / М. Минский ; Пер. с англ. О. Н. Гринбаума ; под ред. Ф. М. Кулакова. — М. : Энергия, 1979. — 151 с.

68. Михаилян, А. Некоторые методы автоматического анализа естественного языка, используемые в промышленных продуктах [Электронный ресурс] / А. Михаилян. — Режим доступа : http://citforum.ru/programming/ digest/avtestlang.shtml. — Дата доступа : 01.02.2013.

69. Морской энциклопедический словарь / [ред. В. В. Дмитриев]. — Л. : Судостроение, 1991. — 504 с.

70. Москальская, О. И. Грамматика текста : пособие по грамматике нем. яз. для ин-тов и фак. иностр. яз. / О. И. Москальская. — М. : Высш. шк., 1981. — 183 с.

71. Москальчук, Г. Г. Структура текста как синергетический процесс / Г. Г. Москальчук. — М. : УРСС, 2003. — 294 с.

72. Москвитина, Т. Н. Ключевые слова и их функции в научном тексте / Т. Н. Москвитина // Вестник Челябинского государственного педагогического университета. — 2009. — № 11. — С. 270-283.

73. Мурзин, Л. Н. Текст и его восприятие / Л. Н. Мурзин, А. С. Штерн. — Свердловск : Урал, ун-т, 1991. — 172 с.

74. Науменко, Е. Э. Особенности аннотации как типа текста : на материале современного английского языка : автореф. дис. ... канд. филол. наук : 10.02.04 / Науменко Елена Эдгаровна ; [Пятигорск, гос. пед. ин-т иностр. яз.]. — Пятигорск, 1988. — 17 с.

75. Новиков, А. И. Семантика текста и ее формализация / А. И. Новиков. — М. : Наука, 1983. — 215 с.

76. Новиков, А. И. Реферативный перевод научно-технических текстов / А. И. Новиков. — М.: Наука, 1991. — 146 с.

77. Остапенко, В. Е. Лексико-грамматическая классификация языковых единиц при помощи квантитативных моделей : автореф. дис. ... канд. филол. наук : 10.02.21 / Остапенко Владимир Ефимович ; [ЛГУ им. А. А. Жданова]. — Л., 1987. — 17 с.

78. Панкрац, Ю. Г. Семантическая сеть / Ю. Г. Панкрац // Краткий словарь когнитивных терминов / под общ. редакцией Е. С. Кубряковой. — М. : МГУ, 1996. —С. 169-170.

79. Паршин, А. Н. Теория и практика перевода / А. Н. Паршин. — М. : Русский язык, 2000. — 161 с.

80. Пачковская, С. В. Формирование контента реферата при автоматическом реферировании научного текста : автореф. дис. ... канд. техн. наук : 05.13.11 / Пачковская Светлана Валерьевна ; [Вост.-Сиб. гос. технол. унт]. — Красноярск, 2010. — 15 с.

81. Перевозчикова, К. В. Формализованное дифференцированное свертывание (аннотирование и реферирование) научно-технических документов : автореф. дис. ... канд. пед. наук : 05.25.03 / Перевозчикова Капиталина Викторовна ; [Ленингр. гос. ин-т культуры им. Н.К. Крупской]. — Л., 1986. —16 с.

82. Переселяк, И. В. Именные словосочетания в структуре английского научного текста : автореф. дис. ... канд. филол. наук : 10.02.19 / Переселяк Ирина Васильевна ; [Мин. гос. лингв, ун-т]. — Минск, 1994. — 24 с.

83. Пиотровский, Р. Г. Лингвистический автомат и его речемыслительное обоснование : учеб. пособие / Р. Г. Пиотровский. — Минск : Минск, лингвист, ун-т, 1999. — 195 с.

84. Пиотровский, Р. Г. Лингвистическая синергетика: исходные положения, первые результаты, перспективы / Р. Г. Пиотровский. — СПб. : Филологический факультет СПбГУ, 2006а. — 160 с.

85. Пиотровский, Р. Г. Доказательно-экспериментальные черты новой парадигмы / Р. Г. Пиотровский // Третья Междунар. науч. конф. «Прикладная лингвистика в науке и образовании», 16—17 марта 2006, Санкт-Петербург / [редкол.: Л. Н. Беляева, О. Н. Камшилова, Е. Ю. Северинова]. — СПб. : РГПУ им. А. И. Герцена, 20066. — С. 133-134.

86. Попов, Э. В. Общение с ЭВМ на естественном языке / Э. В. Попов.

— М.: Наука, 1982. — 360 с.

87. Пумпянский, А. Л. Введение в практику перевода научной и технической литературы на английский язык / А. Л. Пумпянский. — 2-е изд., доп. — М.: Наука, 1981. — 344 с.

88. Сахарный, Л. В. Психолингвистические аспекты теории словообразования : учеб. пособие / Л. В. Сахарный. — Л. : ЛГУ, 1985. — 97 с.

89. Сахарный, Л. В. Предметизация в системе информационного поиска: природа, состояние, проблемы, перспективы / Л. В. Сахарный // Предметный поиск в традиционных и нетрадиционных информационно-поисковых системах : сб. науч. тр. / ред.: Л. В. Сахарный, В. П. Суворова. — Л. : ВИНИТИ, 1990. — С. 14-26.

90. Сахарный, Л. В. Набор ключевых слов как тип текста / Л. В. Сахарный, А. С. Штерн // Лексические аспекты в системе профессионально-ориентированного обучения иноязычной речевой деятельности : Межвуз. сб. науч. тр. / [редкол.: Т. С. Серова (отв. ред.) и др.].

— Пермь : Пермский политехнический ун-т, 1988. — С. 34-51.

91. Скороходько, Э. Ф. Семантические сети и автоматическая обработка текста / Э. Ф. Скороходько. — Киев : Наукова думка, 1983. — 218 с.

92. Соколова, И. С. Научно-информационная деятельность как фактор формирования изданий по естественным наукам / И. С. Соколова // Культурная жизнь Юга России. — 2011. — № 2 (40). — С. 9-12.

93. Соловьев, В. И. Жанры информационной литературы: обзор, реферат / В. И. Соловьев. — М. : Книга, 1983. — 319 с.

94. Сороковых, Г. В. Компрессия текста с помощью ЭВМ как средство обучения студентов неязыковых факультетов реферированию и аннотированию научно-технической литературы : автореф. дис. ... канд. пед. наук : 13.00.02 / Сороковых Галина Викторовна ; [Курс. гос. ун-т]. — М., 1993.

— 16 с.

95. Суминова, Т. Н. Аннотирование, реферирование и обзорно-аналитическая деятельность : метод, пособие / Т. Н. Суминова. — М. : МГУКИ, 2001. —91 с.

96. Сунцова, Н. JI. Лингвистическая модель порождения вторичного текста : автореф. дис. ... канд. филол. наук : 10.02.19 / Сунцова Нина Леонидовна ; [Ин-т языкознания]. — М., 1995. — 22 с.

97. Тарасов, С. Д. Метод тематического связанного ранжирования для задач автоматического сводного реферирования научно-технических информационных сообщений : автореф. дис. ... канд. техн. наук : 05.13.01 / Тарасов Сергей Дмитриевич ; [Балт. гос. техн. ун-т "Военмех" им. Д. Ф. Устинова]. — СПб., 2011. — 21 с.

98. Татевосов, С. Г. Семантика составляющих именной группы : кванторные слова / С. Г. Татевосов. — М. : Ин-т мировой лит. им. A.M. Горького, 2002. — 236 с.

99. Тихомирова, Л. С. Интертекстуальность как предпосылка нового знания в научном тексте / Л. С. Тихомирова // Вестник Пермского университета, Российская и зарубежная филология. — 2009. — С. 19-24.

100. Торгашева, М. А. Формальные корреляты текстовых категорий в семантическом пространстве американского короткого рассказа : автореф. дис. ... канд. филол. наук : 10.02.04 / Торгашева Марина Александровна ; [Самар. гос. пед. ун-т]. — Самара, 2007. — 22 с.

101. Тревгода, С. А. Методы и алгоритмы автоматического реферирования текста на основе анализа функциональных отношений : автореф. дис. ... канд. техн. наук : 05.13.01 / Тревгода Сергей Александрович ; [С.-Петерб. гос. электротехн. ун-т]. — СПб., 2009. — 18 с.

102. Троянская, Е. С. Общая характеристика лексики стиля немецкой научной речи / Е. С. Троянская // Лингвостилистические особенности научного текста : сб. ст. / АН СССР, Каф. иностр. яз. ; отв. ред. М. Я. Цвиллинг. — М. : Наука, 1981. —С. 13-39.

103. Трубникова, Ю. В. Текст и его заголовок: проблема структурного и семантического взаимодействия / Ю. В. Трубникова // Известия Алтайского государственного университета. — № 2. — 2010. — С. 121-126.

104. Тураева, 3. Я. Лингвистика текста (Текст: структура и семантика) / 3. Я. Тураева. —М.: Просвещение, 1986. — 126 с.

105. Уолл, Л. Программирование на Perl / Л. Уолл, Т. Кристиансен, Дж. Орвант. —М.: Символ-Плюс, 2008. — 1145 с.

106. Фаворов, В. П. Большой англо-русский морской словарь / В. П. Фаворов. — М.: НОВ АЛИС, 2002. — 952 с.

107. Филимонов, О. И. Скрепа-фраза как средство выражения синтаксических связей между предикативными единицами в тексте : дис. ... канд. филол. наук : 10.02.01 / Филимонов Олег Игоревич ; [Ставроп. гос. ун-т]. — Ставрополь, 2003. — 191 с.

108. Хомутова, Т. Н. Вариативность грамматической структуры научного текста / Т. Н. Хомутова // Анализ научного текста : сб. науч. тр. / отв. ред. Т. Н. Хомутова. — Челябинск : ЧГТУ, 1993. — С. 106-118.

109. Хомутова, Т. Н. Научный текст: интегральный анализ лексики / Т. Н. Хомутова //Язык и культура. — 2010. — № 4 (12). — С. 77-98.

110. Хэллидей, М. Лингвистическая функция и литературный стиль / М. Хэллидей // Лингвостилистика : сб. ст. / сост. И. Р. Гальперин. — М.: Прогресс, 1980. —С. 116-147.

111. Чернявская, В. Е. Интертекстуальность как текстообразующая категория вторичного текста в научной коммуникации / В. Е. Чернявская. — Ульяновск : Изд-во СВНЦ, 1996. — 108 с.

112. Чернявская, В. Е. Интерпретация научного текста : учеб. пособие / В. Е. Чернявская. — 2-е изд. — М. : Ком Книга, 2006. — 128 с.

113. Шенк, Р. Обработка концептуальной информации / Р. Шенк. — М. : Энергия, 1980. —361 с.

114. Штайн, JI. Д. Разработка сетевых программ на Perl / Л. Д. Штайн.

— М. : Вильяме, 2001. — 751 с.

115. Ягунова, Е. В. Набор опорных слов как вид свертки текста (в сопоставлении с набором ключевых слов) / Е. В. Ягунова // Компьютерная лингвистика и интеллектуальные технологии : по материалам Междунар. конф. «Диалог 2008», Бекасово, 30 мая-3 июня 2007 г. — М. : Изд-во РГГУ, 2008. — С. 588-594.

116. Языкова, Е. В. Англоязычная терминология электронного обучения: структура, семантика, особенности функционирования : автореф. дис. ... канд. филол. наук : 10.02.04, 10.02.19 / Языкова Елена Владимировна ; [Юж. федер. ун-т]. — Ростов н / Д., 2010.

117. Яцко, В. А. Логико-лингвистические проблемы анализа и реферирования научного текста / В. А. Яцко. — Абакан : Изд-во Хакасского гос. ун-та, 1996. — 128 с.

118. Alterman, R. A. Some Computational Experiments in Summarization / R. Alterman, A. Lawrence // Discourse Processes. — 1990. — 13(2). — P. 143— 174.

119. Ballan, L. A. Event detection and recognition for semantic annotation of video / L. Ballan, M. Bertini, A. Bimbo // Multimedia Tools and Applications. — 2011. —51 (5) - P. 279-302.

120. Baxendale, P. Mashine-Made Index for Technical Literature - An Experiment / P. Baxendale // IBM Journal of Research and Development. — 1958.

— 2(4).—P. 354-361.

121. Beaugrande, R. A. de Introduction to Text Linguistics = [Einfuhrung in die Textlinguistik] / R. A. de Beaugrande, W. U. Dressier. — London : Longman, 1981. —270 p.

122. Blair-Goldensohn, S. Integrating Rhetorical-Semantic Relation Models for Query-Focused Summarization / S. Blair-Goldensohn, K. McKeown // Document Understanding Workshop. — New York, 2006. — P. 69-73.

123. Borko, H. Abstracting Concepts and Methods / H. Borko, C. Bernier.

— New York : Academic Press, 1975. — 250 p.

124. Brandow, R. Automatic condensation of electronic publications by sentence selection / R. Brandow, K. Mitze, L. F. Rau // Information Processing & Management. — 31 (5). — 1995 - P. 675-685.

125. Camastra, F. Machine Learning for Audio, Image and Video Analysis: Theory and Applications / F. Camastra, A. Vinciarelli. — Berlin. : Springer, 2007.

— 483 p.

126. Cleveland, B. D. Introduction to Indexing and Abstracting / B. D. Cleveland, A. D. Cleveland. — Greenwood Village : Libr. unlimited, 2001. — 283 p.

127. Edmundson, H. New Methods in Automatic Extracting / H. Edmundson // Journal of the Association for Computing Machinery. — 1969. — Vol. 16 (2). — P. 264-285.

128. Edmundson, H. Automatic abstracting and indexing - survey and recommendations / H. Edmundson, R. Wyllys // Communications of The ACM. — 1961. — Vol. 4 (5). —P. 226-234.

129. Endres/Niggemeyer, B. Summarizing Information / B. Endres-Niggemeyer. — Berlin : Springer, 1998. — 360 p.

130. Endres-Niggemeyer, B. Human-Style WWW Summarization / B. Endres-Niggemeyer // Department of Information and Communication [Electronic resource].

— 2000. — Mode of access : http://endres-niggemeyer.fh-hannover.de/paps/Human-styleSummaNew.pdf. — Date of access : 14.02.2013.

131. Hahn, U. The Challenges of Automatic Summarization / U. Hahn, I. Mani // Computer. — 2000. — Vol. 33 (11). — P. 29-36.

132. Halliday, M. Cohesion in English / M. Halliday, R. Hasan. — London : Longman, 1975. — 374 p.

133. Hutchins, J. Summarization: Some problems and methods / J. Hutchins // Proceedings Informatics 9: Meaning the frontier of Informatics. — London : Aslib, 1987. —P. 151-173.

134. Kupiec, J. A Trainable Document Summarizer / J. Kupiec, J. Pederson,

F.Chen // Proceedings of the 18th International ACM/SIGIR Conference on Research and Development in Information Retrieval. — Seattle, 1995. — P. 69-73.

135. Lewis, D. D. An evaluation of phrasal and clustered representations on a text categorization task / D. D. Lewis // Proceedings of the 15th International ACM/SIGIR Conference on Research and Development in Information Retrieval. — Copenhagen, 1992. — P. 37-50.

136. Luhn, H. The Automatic Creation of Literature Abstracts / H. Luhn // IBM Journal of Research and Development. — 1958. — 2 (2). — P. 159-165.

137. Maybury, M. Multimedia Information Extraction: Advances in Video, Audio, and Imagery Analysis for Search, Data Mining, Surveillance and Authoring / M. Maybury. — New Jersey : Wiley - IEEE Computer Society Press, 2011. — 474 p.

138. Orasan, C. Comparative Evaluation of Modular Summarisation Systems Using CAST / C. Orasan // University of Wolverhampton [Electronic resource] . — 2006. — Mode of access: http://doi.ieeecomputersociety.Org/10.1109/2.881692. — Date of access : 14.02.2013.

139. Rau, L. F. Information extraction and text summarisation using linguistic knowledge acquisition / L. F. Rau // Information Processing & Management. — 1989. — 25 (4). — P. 419^428.

140. Saltón, G. Term-weighting approaches in automatic text retrieval /

G. Saltón, C. Buckley // Information Processing & Management. — 1988. — 24 (5).

— P. 513-523.

141. Sparck Jones, K. A statistical interpretation of term specificity and its application in term retrieval / K. Sparck Jones // Journal of Documentation. — 1972.

— 28(1). —P. 11-21.

142. Sparck Jones, K. Automatic summarizing: factors and directions / K. Sparck Jones // Advances in automatic text summarization / Ed. I. Mani, M. Maybury. — Cambridge : MIT Press. — 1999. — P. 1-12.

143. Sparck Jones, K. Factorial summary evaluation / K. Sparck Jones // Proceedings of the Workshop on Text Summarization. — New Orleans, 2001. —P. 5-17.

144. Steinberger, R. Language Engineering Technoligies and their use for TF-UCLAF / R. Steinberger // Institute for Systems, Informatics and Safety. — [Electronic resource]. — 1998. — Mode of access: http://www.jrc.org/isis/atia. — Date of access : 14.02.2013.

145. Tucker, R. Automatic summarising and the CLASP system / R. Tucker // University of Cambridge Computer Laboratory [Electronic resource]. — 1999. — Mode of access: http://www.cl.cam.ac.uk/techreports/UCAM-CL-TR-632.pdf. — Date of access : 14.02.2013.

146. White, R. W. A task-oriented study on the influencing effects of query-biased summarization in web searching / R. W. White, J. M. Jose, I. G. Ruthven // Information Processing & Management. — 2003. — 39 (5). — P. 707-733.

147. Yang, Ch. C. Fractal Summarization for Mobile Devices to Access Large Documents on the Web / Ch. C. Yang, F. L. Wang // Proceedings of the WWW 2003. — Budapest, 2003. — P. 134-139.

148. Zechner, K. Automatic Text Abstracting by Selecting Relevant Passages / K. Zechner. — Edinburgh : University of Edinburgh, 1995. — 287 p.

149. Zechner, K. Fast generation of abstracts from general domain text corpora by extracting relevant sentences / K. Zechner // The 16th International Conference on Computational Linguistics. — Copenhagen, 1996. — P. 986-989.

150. Zervanou, K. A Corpus Based Approach to Text Summarisation / K. Zervanou // University of Manchester Institute of Science & Technology. — [Electronic resource]. — 1998. — Mode of access: http://ilk.uvt.nl/~kzervanou/pub.html. — Date of access : 14.02.2013.

СПИСОК ИЛЛЮСТРАТИВНОГО МАТЕРИАЛА

Таблица 1. Общая характеристика массива статей англоязычных авторов

(фрагмент)..................................................................................................................76

Таблица 2. Общая характеристика массива статей российских авторов

(фрагмент)..................................................................................................................78

Таблица 3. Частотный словарь служебной лексики (фрагмент)..........................87

Таблица 4. Алфавитный словарь общей и общенаучной лексики

(фрагмент)..................................................................................................................88

Таблица 5. Количественный состав именных групп в заглавиях статей

англоязычных авторов (фрагмент)..........................................................................93

Таблица 6. Частотные характеристики именных групп разной длины

в заглавиях статей англоязычных авторов.............................................................94

Таблица 7. Количественный состав именных групп в заглавиях статей

российских авторов (фрагмент)..............................................................................96

Таблица 8. Частотные характеристики именных групп разной длины

в заглавиях статей российских авторов..................................................................97

Таблица 9. Количественный состав именных групп в рефератах статей

англоязычных авторов..............................................................................................98

Таблица 10. Частотные характеристики именных групп разной длины

в рефератах статей англоязычных авторов............................................................99

Таблица 11. Количественный состав именных групп в рефератах статей

российских авторов (фрагмент)............................................................................100

Таблица 12. Частотные характеристики именных групп разной длины

в рефератах статей российских авторов...............................................................100

Таблица 13.Ключевые лексические единицы, выделенные при сопоставлении реферата, заглавия и статьи в массиве текстов англоязычных авторов (фрагмент)................................................................................................................103

Таблица 14. Частота ИГ различной длины в текстах массива англоязычных

авторов (фрагмент).................................................................................................104

Таблица 15. Количественные характеристики ИГ в массиве текстов

англоязычных авторов (фрагмент)........................................................................105

Таблица 16. Характеристика распределения ИГ разной длины

в массиве текстов англоязычных авторов............................................................107

Таблица 17. Число ИГ с разной степенью распространенности

в массиве текстов англоязычных авторов............................................................109

Таблица 18. Характеристика распределения ИГ разной длины

в массиве текстов российских авторов.................................................................112

Таблица 19. Распределение ключевых JIE, выделенных

из заглавия и авторского реферата, в основной части текста статьи................115

Таблица 20. Сопоставление использования ключевых лексических единиц

в реферате и научной статье (фрагмент)..............................................................120

Таблица 21. Суммарная частота ключевых JIE (фрагмент)...............................138

Таблица 22. Результаты подсчета базового веса предложений к статье The Effects of Bulbous Bows, Stern Flaps and a Wave-Piercing Bow

on the Resistance of a Series 64 Hull Form (фрагмент).........................................139

Таблица 23. Результаты подсчета дополнительного веса предложений к статье The Effects of Bulbous Bows, Stern Flaps and a Wave-Piercing Bow

on the Resistance of a Series 64 Hull Form (фрагмент).........................................140

Таблица 24. Результаты подсчета дополнительного веса предложений к статье The Effects of Bulbous Bows, Stern Flaps and a Wave-Piercing Bow

on the Resistance of a Series 64 Hull Form (фрагмент).........................................141

Таблица 25. Результаты подсчета дополнительного веса предложений к статье The Effects of Bulbous Bows, Stern Flaps and a Wave-Piercing Bow on the Resistance of a Series 64 Hull Form (фрагмент).........................................142

Таблица 26. Результаты подсчета дополнительного веса предложений к статье The Effects of Bulbous Bows, Stern Flaps and a Wave-Piercing Bow

on the Resistance of a Series 64 Hull Form (фрагмент).........................................143

Таблица 27. Результаты подсчета суммарного веса предложений к статье The Effects of Bulbous Bows, Stern Flaps and a Wave-Piercing Bow

on the Resistance of a Series 64 Hull Form (фрагмент).........................................143

Таблица 28. Экспертные оценки качества рефератов.........................................153

Рисунок 1. Общий алгоритм работы модели автоматического

реферирования........................................................................................................131

Рисунок 2. Пример размещения рабочих файлов и файла программы

на жестком диске пользователя.............................................................................146

Рисунок 3. Начальный этап работы программы..................................................149

Рисунок 4. Промежуточный этап работы программы........................................150

Рисунок 5. Конечный результат работы программы..........................................151

ПРИЛОЖЕНИЕ 1. Общая характеристика массива статей англоязычных авторов

Объемы в с/у

№ текста Название статьи Тип автора Введение Основная часть Выводы Общий объем

1 2 3 4 5 6 7

1 IMPROVEMENT OF SEAKEEPING PREDICTION METHODS FOR HIGH SPEED VESSELS WITH A TRANSOM STERN Великобритания 106 584 52 742

2 WATER SURFACE DISTURBANCE NEAR THE BOW OF HIGH SPEED, HARD CHINE HULL FORMS США 203 671 58 932

3 ON THE ASSESSMENT OF MOTIONS AND STRUCTURAL LOADS OF A HIGH-SPEED CATAMARAN США 207 944 61 1212

4 A HYDROGEN FUELLED GAS TURBINE POWERED HIGH-SPEED CONTAINER SHIP: A TECHNICAL & ECONOMIC INVESTIGATION Великобритания 213 1502 68 1783

1 2 3 4 5 6 7

5 A STUDY OF THE POTENTIAL REPLACEMENTS OF A VESSEL FOR THE PORT OF LONDON AUTHORITY Великобритания 229 1546 98 1873

6 WIND HEELING MOMENTS ON MULTIHULL VESSELS Великобритания 231 1714 119 2064

7 PODDED PROPULSORS FOR FAST AND LARGE COMMERCIAL VESSELS (FASTPOD PROJECT) Великобритания 248 1880 123 2251

8 OPTIMIZATION OF A SPLIT-CUSHION SURFACE-EFFECT SHIP США 260 1915 131 2306

9 PREDICTION OF THREE-DIMENSIONAL SEAKEEPING CHARACTERISTICS OF FAST HULL FORMS: INFLUENCE OF THE LINE INTEGRAL TERMS Великобритания 266 2068 139 2473

10 THE POTENTIAL FOR THE USE OF A NOVEL CRAFT, PACSCAT, IN INLAND EUROPEAN WATERWAYS Великобритания 297 2149 141 2587

11 EFFECTS OF ACTUATOR DYNAMICS ON STABILIZATION OF HIGH-SPEED PLANING VESSELS WITH CONTROLLABLE TRANSOM FLAPS США 390 2580 142 3112

1 2 3 4 5 6 7

12 AIR CUSHION VEHICLE (ACV) DEVELOPMENTS IN THE U.S. США 525 2605 159 3289

13 AN INVESTIGATION INTO THE HYDRODYNAMIC CHARACTERISTICSOF A HIGH-SPEED PARTIAL AIR CUSHION SUPPORTED CATAMARAN (PACSCAT) Великобритания 538 2612 181 3331

14 BULBOUS BOW RESISTANCE REDUCTION OF SEMI-PLANING VESSELS США 564 2683 185 3432

15 RANS SIMULATIONS FOR HIGH SPEED SHIPS IN DEEP AND SHALLOW WATER США 576 2858 258 3692

16 THE EFFECTS OF BULBOUS BOWS, STERN FLAPS AND A WAVE-PIERCING BOW ON THE RESISTANCE OF A SERIES 64 HULL FORM США 594 3232 285 4111

17 ON THE DEVELOPMENT OF A HULL FORM WITH MINIMUM WETTED SURFACE FOR HIGH-SPEED CATAMARANS AND TRIMARANS США 712 3242 293 4247

1 2 3 4 5 6 7

18 THE INTEGRATION OF LIFTING FOILS INTO RIDE CONTROL SYSTEMS FOR FAST FERRIES США 1063 3450 305 4818

19 INFLUENCE OF BUBBLE SIZE ON MICRO-BUBBLE DRAG REDUCTION США 1322 3527 356 5205

20 URANS SIMULATIONS FOR A HIGHSPEED TRANSOM-STERN SHIP WITH BREAKING WAVES США 1378 4051 430 5859

21 THE DEVELOPMENT OF VESSEL WAVE WAKE CRITERIA FOR THE NOOSA AND BRISBANE RIVERS IN SOUTHEAST QUEENSLAND Австралия 286 4183 106 4575

22 THE BORE PRODUCED BETWEEN THE HULLS OF A HIGH-SPEED CATAMARAN IN SHALLOW WATER Австралия 216 2135 245 2596

23 PREDICTION OF MOORING LINE LOADS ON CAPE SIZE VESSELS BERTHED AT CAPE LAMBERT Австралия 285 1883 338 2506

24 BERTHED SHIP - PASSING SHIP INTERACTION: A CASE STUDY FOR THE PORT OF NEWCASTLE Австралия 278 1333 130 1741

25 NUMERICAL STUDY OF BANK EFFECTS ON A SHIP TRAVELING IN A CHANNEL Австралия 712 2035 160 2907

00

1 2 3 4 5 6 7

26 THE HYDRODYNAMICS OF BERTH DESIGN Австралия 63 2117 87 2267

27 AN INVESTIGATION INTO THE EFFECT OF PROPULSION ON SHIP SQUAT Австралия 155 1417 142 1714

28 INVESTIGATION INTO FLOAT-OVER INSTALLATIONS OF MINIMAL PLATFORMS Австралия 222 1313 156 1691

29 GLOBAL LOADS DERIVATION OF LARGE HIGH SPEED VESSELS Австралия 190 3017 142 3349

30 THE PERFORMANCE AND CONTROLLABILITY OF YACHTS SAILING DOWNWIND IN WAVES Австралия 645 2437 197 3279

31 AN INVESTIGATION INTO THE WHIPPING OF LARGE HIGH-SPEED CATAMARANS Австралия 533 3503 293 4329

32 THE WHIPPING VIBRATION OF LARGE HIGH-SPEED CATAMARANS Австралия 601 4512 306 5419

33 EFFECT OF STERN WEDGES AND ADVANCED SPRAY RAIL SYSTEM ON CALM WATER RESISTANCE Австралия 342 1023 366 1731

1 2 3 4 5 6 7

34 THEORETICAL AND EXPERIMENTAL STUDY OF SEAKEEPING CHARACTERISTICS OF HIGH-SPEED DISPLACEMENT HULL FORMS Австралия 150 598 181 929

35 WAVE RESISTANCE PREDICTION OF HARD-CHINE CATAMARANS THROUGH REGRESSION ANALYSIS Австралия 215 1699 101 2015

36 WAVE RESISTANCE OF SEMI-DISPLACEMENT HIGH-SPEED CATAMARANS THROUGH CFD AND REGRESSION ANALYSIS Австралия 365 2489 216 3070

37 A STUDY ON STERN WEDGES AND ADVANCED SPRAY RAIL SYSTEM ON CALM WATER RESISTANCE Австралия 458 1005 362 1825

38 EXPERIMENTAL AND CFD RESISTANCE CALCULATION OF A SMALL FAST CATAMARAN Австралия 237 1277 125 1639

39 THEORETICAL AND EXPERIMENTAL STUDY OF MOTION CHARACTERISTICS OF HIGH-SPEED CATAMARAN HULL FORMS Австралия 92 1811 122 2025

40 ADDED MASS OF WHIPPING MODES FOR SHIPS AT HIGH FROUDE NUMBER BY A FREE SURFACE BOUNDARY ELEMENT METHOD Австралия 343 1468 86 1897

41 BOUNDARY ELEMENT METHODS IN THE PREDICTION OF THE ACOUSTIC DAMPING OF SHIP WHIPPING VIBRATIONS Австралия 400 1056 66 1522

00 Ov

1 2 3 4 5 6 7

42 RIGID BODY DYNAMIC HULL BENDING MOMENTS, SHEAR FORCES AND PCM IN FAST CATAMARANS Австралия 237 2494 197 2928

43 TRANSIENT DYNAMIC SLAM RESPONSE OF LARGE HIGH SPEED CATAMARANS Австралия 695 2532 163 3390

44 ON THE ADDED RESISTANCE OF CATAMARANS IN WAVES Австралия 91 2247 226 2564

45 GLOBAL & SLAM LOADS FOR A LARGE WAVEPIERCING CATAMARAN DESIGN Австралия 833 3190 324 4347

46 VALIDATION OF NON-LINEAR WAVE LOADS PREDICTED BY TIME DOMAIN METHOD IN SEA TRIALS OF AN 86m CATAMARAN Австралия 385 2361 139 2885

47 TRANSOM-STERN FLOW FOR HIGHSPEED CRAFT Австралия 710 2245 300 3255

48 THE WAVES GENERATED BY A TRIMARAN Австралия 324 2254 156 2734

49 THE INFLUENCE OF SLAMMING AND WHIPPING ON THE FATIGUE LIFE OF A HIGH-SPEED CATAMARAN Австралия 752 2382 169 3303

1 2 3 4 5 6 7

50 AN EXPERIMENTAL INVESTIGATION OF THE PHYSICAL CHARACTERISTICS OF FAST FERRY WASH Великобритания 391 3294 332 4017

51 HYDRODYNAMIC PRESSURE AND STRUCTURAL LOADING OF HIGHSPEED CATAMARAN AND SES США 183 3587 190 3960

52 AN INTEGRATED RELIABILITY, RISK ANALYSIS, AND COST MODEL FOR PRELIMINARY STRUCTURAL DESIGN: A MODULE OF THE SAFETY@SPEED DESIGN METHODOLOGY Великобритания 247 4074 321 4642

53 SAFETY MANAGEMENT OF HIGH SPEED CRAFT Великобритания 443 2642 126 3211

54 HIGH SPEED NAVAL COMBATANT -PROPULSION ENABLERS. Великобритания 173 2868 181 3222

55 CLASSIFICATION OF ENGINEERING SYSTEMS FOR WING IN GROUND EFFECT CRAFT Великобритания 601 4443 135 5179

56 HOVERCRAFT ARE HERE TO STAY Великобритания 455 3055 193 3703

57 INTERNATIONAL REGULATIONS FOR HIGH-SPEED CRAFT AN OVERVIEW Великобритания 248 3874 89 4211

1 2 3 4 5 6 7

58 CORRELATION OF PROTOTYPE AND MODEL SCALE WAVE WAKE CHARACTERISTICS FOR VESSELS OPERATING AT LOW FROUDE NUMBERS Австралия 455 5261 248 5964

59 AN INTRODUCTION TO THE DEVELOPMENT OF RATIONAL CRITERIA FOR ASSESSING VESSEL WASH WITHIN SHELTERED WATERWAYS Австралия 114 7259 206 7579

60 WATER STILLING FOR TOWING TANK EXPERIMENTS OF HIGH PERFORMANCE CRAFT Австралия 267 2310 396 2973

61 SHIP VIBRATION AND NOISE: SOME TOPICAL ASPECTS Великобритания 355 3773 95 4223

62 NRC HULL FORM SERIES FOR SURFACE SHIPS Великобритания 320 5020 219 5559

63 CORRELATION OF PROTOTYPE AND MODEL-SCALE WAVE WAKE CHARACTERISTICS OF A CATAMARAN Австралия 334 5844 257 6435

64 ULTRA-LARGE CONTAINER SHIPS (ULCS) DESIGNING TO THE LIMIT OF CURRENT AND PROJECTED TERMINAL INFRASTRUCTURE CAPABILITIES Великобритания 184 4989 91 5264

1 2 3 4 5 6 7

65 STRUCTURAL LOADS INDUCED IN A CONTAINERSHIP BY ABNORMAL WAVE CONDITIONS Великобритания 985 4892 370 6247

66 INVESTIGATION OF TURBULENT FLOWS IN A WATERJET INTAKE DUCT USING STEREOSCOPIC PTV MEASUREMENTS Великобритания 599 2636 233 3468

67 PREDICTION OF CAPSIZING PROBABILITY FOR A SHIP WITH TRAPPED WATER ON DECK Великобритания 554 2833 206 3593

68 COMPUTATIONAL PREDICTIONS OF SHIP-SPEED PERFORMANCE Великобритания 431 3563 191 4185

69 UNSTEADY FINITE-DEPTH EFFECTS DURING RESISTANCE TESTS ON A SHIP MODEL IN A TOWING TANK Великобритания 527 4043 375 4945

70 DYNAMIC DRAUGHT OF CONTAINER SHIPS IN SHALLOW WATER Австралия 668 2930 255 3853

ПРИЛОЖЕНИЕ 2. Общая характеристика массива статей российских авторов

Объемы в с/у

№ текста Название статьи Введение Основная часть Выводы Общий объем

1 2 3 4 5 6

1 PERSPECTIVES OF APPLICATION IN ARCTICS REGIONS OF THE NEWESTAMPHIBIAN VEHICLES UTILIZING GROUND EFFECT 288 4611 295 5194

2 COMPUTATION OF PROPELLER WAKE ON PODED PROPULSORS OF FAST SHIPS 299 2632 201 3132

3 IMPROVEMENT OF HIGH-SPEED CRAFT PROPULSION BY USING OF PROPELLERS WITH SHIFTED BLADE CONNECTION ON THE HUB 99 1311 59 1469

4 HYDRODYNAMICS OF FAST BOATS IN TRANSIENT SPEED REGION 237 3601 334 4172

5 HIGH-SPEED AMPHIBIAN ACV OF NEW GENERATION - THE VESSELS WITH AN OPTIMAL AEROHYDRODYNAMICAL LIFTING COMPLEX 477 2331 1189 3997

6 APPLICATION OF VORTEX METHODS TO THE DESIGN OF VESSELS OPERATING ITIONAL AND PLANING FROUDE NUMBERS 444 3292 97 3833

7 DESIGNING THE HIGH-SPEED SUPERCAVITATING VEHICLES 237 3092 100 3429

1 2 3 4 5 6

8 PROSPECTS OF ARTIFICIAL CAVITIES IN RESISTANCE REDUCTION FOR PLANING CATAMARANS WITH ASYMMETRIC DEMIHULLS 737 1980 190 2907

9 NUMERICAL MODELING OF CAVITATING FLOWS 454 4837 96 5387

10 NAVAL AND MERCHANT SHIP STRENGTH: ACHIEVEMENTS AND PROSPECTS 210 2845 637 3692

11 APPLICATION OF COMPUTER-AIDED MODELING FOR OPTIMIZATION OF CATHODIC PROTECTION OF SHIPS AND MARINE INSTALLATIONS 594 2167 309 3070

12 RESEARCH OF PRESSURE DRAG FORMING FEATURES OF TRANSPORT SHIPS WITH FULL FORM ON SCHEMATICAL MODELS IN A WIND TUNNEL 402 1766 323 2491

13 PERSPECTIVES ARTIFICIAL CAVITY APPLICATION AIMED ON RESISTANCE REDUCTION OF OCEAN/RIVER SHIPS 480 2550 55 3085

14 OPTIMIZED DESIGN OF HIGH SPEED CATAMARANS WITH LIMITING THE WASH WAVES 491 2222 42 2755

15 THE PROBLEM OF FINAL THICKNESS JET 261 693 102 1056

16 SEA TRIALS OF HIGH SPEED CRAFTS DATA PROCESSING AND MODEL IDENTIFICATION 289 908 108 1305

1 2 3 4 5 6

17 SOME FEATURES OF WATER RESISTANCE DETERMINATION FOR PLANING AND SEMI-PLANING SHIPS 748 1291 149 2188

18 SPECIFIC FEATURES OF GLOBAL VIBRATION ANALYSIS FOR PLANING BOATS AND SHIPS OPERATING IN TRANSIENT CONDITIONS 178 2003 189 2370

19 EXPERIENCE AND PROSPECT OF USING ALUMINUM ALLOYS FOR CONSTRUCTION OF FAST SHIPS 1342 1774 326 3442

20 EXPERIENCE WITH THE ANALYSIS OF CONTROLLABLE PITCH PROPELLERS AT OFF-DESIGN CONDITIONS USING A BOUNDARY ELEMENT METHOD 204 4730 147 5081

21 ASSURANCE OF DIGITAL CONTROL ACCURACY AT NON-CENTRALIZED STOHASTIC ACTIONS 544 2375 111 3030

22 THE HIGH SPEED CRAFT STEERING AT OFF DESIGN MOTION REGIME 255 2303 111 2669

23 WORKSPACE ANALYSIS TO GENERATE A COLLISION-FREE TORCH PATH FOR A SHIP WELDING ROBOT 328 3064 191 3583

1 2 3 4 5 6

24 DESIGN OF PROPELLER GEOMETRY USING STREAMLINE-ADAPTED BLADE SECTIONS 229 1830 362 2421

25 THREE-DIMENSIONAL NUMERICAL ANALYSIS OF SHIPPING WATER ONTO A MOVING SHIP USING A PARTICLE METHOD 493 3596 272 4361

26 INCORPORATED PROBABILITY THAT A FLEET MEETS A GIVEN PERMISSIBLE VALUE FOR THE HULL GIRDER SECTION MODULUS LOSS 186 2191 401 2778

27 VIBRATION ANALYSIS OF MAIN ENGINE SHAFT SYSTEM BY BUILDING BLOCK APPROACH 184 1117 126 1427

28 DESIGN PRACTICE FOR THE STERN HULL FORM OF A TWIN-SKEG SHIP 595 3435 321 4351

29 NEW METHOD FOR SHIP FINITE ELEMENT METHOD PREPROCESSING BASED ON A 3D PARAMETRIC TECHNIQUE 504 4419 191 5114

30 EXPERIMENTAL AND NUMERICAL INVESTIGATION OF FATIGUE DAMAGE DUE TO WAVE-INDUCED VIBRATIONS IN A CONTAINERS HIP IN HEAD SEAS 894 7615 538 9047

ПРИЛОЖЕНИЕ 3 Частотный словарь служебной лексики

Ранг Частота Словоформа

1 55929 the

2 24370 of

3 16611 and

4 13534 in

5 12868 to

6 12048 a

7 10748 is

8 8139 for

9 4956 with

10 4682 that

11 4659 be

12 4603 are

13 4375 as

14 4373 on

15 3954 by

16 3830 this

17 3757 at

18 3449 was

19 2733 from

20 2472 it

21 2095 an

22 2036 were

23 1941 which

24 1912 can

25 1440 not

26 1358 has

27 1308 have

28 1302 these

29 1230 between

30 1181 or

31 1164 been

32 1087 also

33 1026 than

34 994 each

35 974 when

Ранг Частота Словоформа

36 873 such

37 845 will

38 834 we

39 811 more

40 800 where

41 775 may

42 755 there

43 748 into

44 725 other

45 696 both

46 670 however

47 661 but

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.