Лингвистические принципы построения и использование корпуса текстов для исследования официально-делового стиля современного немецкого языка: На материале электронного корпуса "DER" тема диссертации и автореферата по ВАК РФ 10.02.04, кандидат филологических наук Вадяев, Сергей Евгеньевич

  • Вадяев, Сергей Евгеньевич
  • кандидат филологических науккандидат филологических наук
  • 2005, Самара
  • Специальность ВАК РФ10.02.04
  • Количество страниц 160
Вадяев, Сергей Евгеньевич. Лингвистические принципы построения и использование корпуса текстов для исследования официально-делового стиля современного немецкого языка: На материале электронного корпуса "DER": дис. кандидат филологических наук: 10.02.04 - Германские языки. Самара. 2005. 160 с.

Оглавление диссертации кандидат филологических наук Вадяев, Сергей Евгеньевич

Введение.

Глава 1. Корпус текстов - новый тип источника лингвистического исследования.

1.1. Электронный текст как основа корпуса.

1.1.1. Свойства электронного текста и его создание.

1.1.2. Информационный поиск и количественный анализ.

1.2. Корпусы текстов: принципы построения и репрезентативность.

1.2.1. Определение понятия «корпус».

1.2.2. Типы корпусов и их назначение.

Выводы к главе 1.

Глава 2. Разработка и построение электронного корпуса текстов «DER».

2.1. Проблемы составления и использования параллельных корпусов текстов и их субкорпусов.

2.2. Репрезентативность параллельных корпусов текстов.

2.3. Подбор текстов для ПКТ «DER».

2.4. Членение текстов ПКТ «DER» и определение границ их структурных элементов.

2.4.1. Единицы текста и их определение. 2.4.2. Автоматическое распознавание границ предложения при стыковке текстов.

2.5. Подготовка текстов ПКТ «DER».

2.5.1. Общие требования к формату текстов.

2.5.2. Применение языка разметки XML и рекомендаций TEI для разметки текстов.

2.6. Стыковка параллельных текстов ПКТ «DER».

2.6.1. Автоматическая стыковка параллельных текстов.

2.6.2. Лингвистический подход к стыковке параллельных текстов.

2.6.3. Статистическо-вероятностный подход к стыковке параллельных текстов.

2.6.4. Стыковка параллельных текстов ПКТ «DER».

2.7. Программная оболочка ПКТ «DER» и её возможности.

Выводы к главе 2.

Глава 3. Использование ПКТ «DER» для исследования особенностей официально-деловых текстов (на материале документов ООН).

3.1. Использование квантитативных методов в современной стилистике.

3.2. Актуальные проблемы исследования текстов официально-делового стиля.

3.3. Документы ООН как особый тип текстов официально-делового стиля

3.4. Модальность и основные способы её выражения в текстах официально-делового стиля.

3.5. Особенности частотно-распределительных характеристик модальных глаголов.

3.5.1. Особенности употребления глаголов sollen и mussen.

3.5.2. Особенности употребления глаголов konnen и durfen.

3.5.3. Особенности употребление глаголов wollen и mogen.

Выводы к главе 3.

Рекомендованный список диссертаций по специальности «Германские языки», 10.02.04 шифр ВАК

Введение диссертации (часть автореферата) на тему «Лингвистические принципы построения и использование корпуса текстов для исследования официально-делового стиля современного немецкого языка: На материале электронного корпуса "DER"»

В последние годы особое внимание лингвистов, и германистов в частности, уделяется исследованию характеристик устойчивых текстовых форм. Это обусловлено, с одной стороны, развитием стилистических изысканий, направленных на решение проблем разграничения стилей, на выделение стилеобразую-щих признаков, с другой стороны, задачами практической стилистики, совре-0 менной риторики и культуру речи [Домашнев 1989: 148-149].

Немецкие лингвисты для характеристики устойчивых текстовых форм и их конкретной реализации применяют термины тип текста (Textsorte) и экземпляр текста (Textexemplar). Под типом текста (далее ТТ) при этом понимается форма текста, в которой реализуется коммуникативное намерение говорящего/пишущего и которая строится по определенным правилам и нормам. Каждый конкретный текст (Textexemplar) обладает определенным набором лингвистических и экстралингвистических признаков, по которым его можно отнести к ф определенному типу текста (Textsorte) [Eisenberg, Gelhaus и др. 1998: 842-845;

Steger, Deutrich и др. 1974: 95].

В немецкой стилистике при классификации ТТ принято выделять группу политических текстов [Brinker 1983; Rolf 1993], большинство из которых является текстами официально-делового стиля. В последнее время наблюдается особый интерес германистов именно к изучению политических ТТ. Это обусловлено политизацией и ростом влияния СМИ, а также значительными изменениями характеристик данной группы ТТ, вызванными существенными преобразова-щ ниями структуры политических учреждений и политической системы в ФРГ в конце XX века [Klein 2000; Straufi 1986]. Но большинство подобных исследований построено на материале внутриполитических типов текстов (конституция, парламентские документы, законы и т.п.) и мало затрагивают ТТ, относящиеся к внешнеполитической деятельности (международные договоры, документы Европейского союза или ООН).

До настоящего времени не проводилось развернутых исследований, рассматривающих стилистические особенности подобных текстов, где на основе их репрезентативной подборки осуществлялся бы не только квалитативный анализ отдельных, типичных для данного ТТ явлений, но и комплексная квантитативная оценка их частотности. Только такой подход может обеспечить достоверное выявление функционально-коммуникативных особенностей данного ТТ и его актуальных характеристик в немецком литературном языке последних десятилетий.

Для сравнения квантифицируемых признаков текстов (например, для выявления их принадлежности к функциональному стилю или к типу текстов), а также для определения и сравнения лексического многообразия текстов в современной стилистике активно используются квантитативные методы. Их применение для стилистического анализа текстов имеет уже долгую традицию [Schmitz 2000: 196-198]. Как правило, в качестве основы для таких исследований служит корпус, репрезентативная выборка текстов, составленная с учетом таких факторов, как функционально-стилистические особенности, письменная или устная форма существования, содержание. Объем выборки должен быть достаточно большим для того, чтобы достоверно определить стилистические закономерности, отделив их от случайных или нетипичных случаев употребления. Количественные данные, полученные на основе такой выборки, служат в качестве «симптомов» квалитативных характеристик и представляют собой основу для последующей интерпретации [Ризель, Шендельс 1975: 49]. Использование квантитативных методов предполагает исследование обширных массивов текстов, поэтому для их применения большое значение приобретает подготовка репрезентативных выборок текстовых данных и разработка средств доступа к ним на основе новых электронных технологий.

Для лингвистических исследований всё чаще используются именно электронные {машинные) корпусы текстов. Они позволяют более эффективно и широко применять квантитативные методы, в частности для выявления стилистических особенностей входящих в их состав текстов. Особое внимание уделяется выявлению тенденций частотности и дистрибуции отдельных языковых единиц и их групп, стохастических зависимостей между ними, а также соотношений между внутренними характеристиками текста и внешними по отношению к нему факторами [Bergenholtz, Schaeder 1979; Pieper 1979; Schmitz 2000].

В рамках данной работы был разработан оригинальный двуязычный электронный корпус текстов «DER» (Deutsch-Russisches Parallelkorpus), послуживший текстовой и инструментальной базой для выявления особенностей функционирования модальных глаголов в текстах официально-делового стиля. Корпус «DER» представляет собой параллельный корпус текстов (далее ПКТ), включающий в себя немецко- и русскоязычные варианты документов ООН общим объёмом в 300 000 словоупотреблений. Использование ПКТ, помимо преимуществ одноязычного корпуса при изучении отдельного языка (на основе одного из субкорпусов), дает реальные возможности для проведения контра-стивных исследований, исследования проблем передачи различных языковых явлений в разных языках, поиска использующихся в переводческой практике

Ф эквивалентов, для составления и пополнения переводных словарей и обучения иностранному языку.

Итогом данной работы являются два практически и теоретически значимых результата, первый из которых состоит в обосновании необходимости использования ПКТ «DER» и разработке принципов его создания, а второй — в выявлении модальной специфики немецких официально-деловых текстов и особенностей функционирования в них модальных глаголов.

Актуальность данного диссертационного исследования определяется, с одной стороны, необходимостью дальнейшего изучения и выявления закономерностей функционирования модальных глаголов в текстах различных функциональных стилей, а, с другой стороны, ограниченным количеством параллельных корпусов текстов вообще и для пары языков немецкий и русский в частности, а также недостаточной разработкой концепции их составления и технологии обработки.

Научная новизна предлагаемой диссертации состоит в том, что в ней впервые детально описана лингвистическая концепция и на её основе разработана технология построения немецко-русского параллельного корпуса текстов, а также наглядно представлены возможности использования немецкоязычного субкорпуса ПКТ для исследований в области стилистики. В рамках работы детально представлена методика автоматической стыковки параллельных текстов на немецком и русском языках, что не служило ранее предметом рассмотрения 0 в лингвистических исследованиях, а также осуществлено практическое приложение немецкого субкорпуса ПКТ «DER» для выявления специфики употребления модальных глаголов в текстах официально-делового стиля современного немецкого языка, относящихся к внешнеполитической сфере (деятельность ООН).

Теоретическая значимость исследования состоит в обосновании зависимости между частотностью средств реализации категории модальности (на примере модальных глаголов немецкого языка) и основной коммуникативной ф функции текстов официально-делового стиля (на примере документов ООН).

Кроме того, в диссертации подробно разрабатывается теоретическая база для моделирования ПКТ, а также обосновываются возможности применения ПКТ «DER» для комплексного анализа стилистических характеристик конкретных типов текстов. В данной работе рассматривается также широкий круг проблем, касающихся определения особенностей официально-делового стиля в современном немецком языке, места документов ООН как самостоятельного типа текстов в динамичной системе функциональных стилей современного немецкого литературного языка. Несмотря на то, что официально-деловой стиль является многоплановым феноменом, а в спектре политических ТТ проявляет в последние десятилетия значительную динамику, связанную в частности с расши рением международной функции немецкого языка [Домашнев 1989: 129-130], 'Л за последнее время появилось не так много работ, посвященных этой тематике1.

Материалом исследования послужила выборка электронных документов ООН (www.un.org) на немецком и русском языках. Основу корпуса составляют шесть докладов о работе ООН за 1997-2001 гг., с которыми ежегодно выступает её Генеральный Секретарь перед Генеральной Ассамблеей. Общий объём текстов корпуса составил около 900 страниц и включает примерно 300 тыс. слово* употреблений (на каждый из языков корпуса приходится примерно 150 тыс. словоупотреблений).

Цель данного исследования заключается в выявлении модальной специфики немецких текстов официально-делового стиля и особенностей функционирования в них модальных глаголов на примере репрезентативного корпуса текстов. Для решения поставленной задачи на основании лингвистических принципов была разработана технология составления немецко-русского ПКТ и определены возможности и параметры его применения для выявления базисных стилистических особенностей текстов официально-делового стиля.

На первом этапе работы ставилась задача разработать технологию автоматической обработки текстов для ПКТ, а также средств их представления и анализа. На втором этапе планировалось выявить на основе данных квантитативного и квалитативного стилистического анализа немецкого субкорпуса ПКТ «DER» закономерности частотно-распределительных характеристик немецких модальных глаголов и их зависимость от общей коммуникативно-функциональной направленности представленного в ПКТ «DER» типа текстов

• (ежегодные доклады Генсекретаря о работе ООН).

1 См., в частности, диссертационные исследования: Комлева Е.В. Лингвистические особенности выражения побудительности в текстах официально-деловой прозы (на материале современного немецкого языка), АКД. -СПб.: РГПУ им. Герцена, 2003; Исакова Л.Д. Соотношение типологических тенденций и особенностей проявления функционального стиля в современных германских языках, АДЦ,- М.: МГЛУ, 2001.

Для реализации поставленных целей необходимо было решить следующие общие задачи:

• изучить существующие подходы к составлению параллельных корпусов текстов и сформулировать оптимальные принципы составления ПКТ «DER»;

• оценить объем существующих параллельных текстов для немецкого и русского языков, возможности их использования и выработать стратегию дальнейшего отбора текстов для ПКТ «DER»;

• на основе существующих определений «абзаца» и «предложения» разработать концепцию автоматического определения границ данных структурных элементов для последующей стыковки;

• на основе существующих теоретических концепций и методов разработать методику автоматического выявления параллельных сегментов для текстов ПКТ;

• разработать программную оболочку для наглядного представления текстов ПКТ и осуществления эффективного поиска в них изучаемых языковых явлений.

После выполнения перечисленных общих технологических задач была сделана попытка найти пути решения следующих лингвистических проблем:

• раскрытие основных возможностей использования квантитативных методов для стилистического анализа репрезентативного корпуса официально-деловых текстов',

• обоснование зависимости между общей коммуникативно-функциональной направленностью типа текста и основными средствами выражения модальности (на примере модальных глаголов в текстах официально-делового стиля на немецком языке);

• выявление особенностей частотно-распределительных характеристик немецких модальных глаголов в текстах официально-делового стиля (на примере текстов ООН, входящих в ПКТ «DER»);

• определение значений модальных глаголов, наиболее частотных в текстах официально-делового стиля (на примере текстов ООН, входящих в ПКТ «DER») и выявления преобладающего речевого фона их употребления;

• сравнение полученных на основе немецкого субкорпуса ПКТ «DER» (специализированный корпус, где представлен один тип текстов) данных о частотности употребления модальных глаголов с данными одноязычного корпуса «Der deutsche Wortschatz» (общий корпус, где представлены разнообразные типы текстов) для выявления закономерностей употребления модальных глаголов в текстах с различной функционально-стилевой принадлежностью.

Практическая ценность исследования: ПКТ «DER» может служить в качестве основы и инструментария для дальнейших стилистических, лексикологических, грамматических и контрастивных исследований, в частности, он позволяет:

• проводить сравнительный анализ особенностей немецкого и русского языков, относящихся к лексическому составу, морфологии и синтаксису (статистический анализ и сравнительный анализ лексических структур и синтаксических конструкций в параллельных текстах);

• осуществлять поиск эквивалентов для слов и коллокаций, а также примеров употребления лексических единиц и их перевода на другой язык в зависимости от контекста употребления;

• проводить исследования в области стилистики (рассмотрение способов передачи стилистических особенностей в текстах на разных языках, а также определение приемов и стилистических средств, при помощи которых переводчик передает в языке перевода содержание оригинального текста);

• разрабатывать и совершенствовать программные средства для проведения стыковки текстов, автоматического поиска и извлечения эквивалентов для отдельных лексем и коллокаций.

Кроме того, ПКТ «DER» может служить не только в качестве источника статистических данных или для поиска эквивалентов, но и в качестве базиса для дальнейших исследований разнообразных явлений одного из языков корпуса. Например, немецкие тексты ПКТ «DER» по разнообразным параметрам могут служить в качестве самостоятельного объекта исследования, что наглядно продемонстрировано в рамках данной работы.

На основе ПКТ «DER» нами было проведено исследование функционирования модальных глаголов в текстах официально-делового стиля в современном немецком языке, при этом квантитативные методы исследования сочетались с квалитативным анализом полученных на их основе данных. Такой подход обеспечивает достоверное выявление зависимостей между основной коммуникативной функцией представленного в корпусе типа текстов и частотно-распределительными характеристиками модальных глаголов, являющихся в немецком языке одним из основных средств выражения модальности.

В качестве инструментария исследовательской работы были избраны следующие методы исследования: квантитативный метод для выявления на основе ПКТ «DER» тенденций частотности и дистрибуции квантифицируемых языковых единиц и соотношений между внутренними характеристиками текста и внешними по отношению к нему факторами; квалитативный метод для интерпретации полученных статистических данных, для семантического и грамматического анализа употреблений исследуемых языковых единиц в текстах ГОСТ; методы и технологии корпусной лингвистики для реализации и обработки ПКТ «DER».

Положения, выносимые на защиту:

1. Важнейшим лингвистическим принципом построения корпуса текстов, является обеспечение его репрезентативности. Значительное увеличение объема исследуемого корпуса не означает пропорционального роста количества уникальных лексем в нём (т.е. автоматического повышения репрезентативности). Динамика роста количества словоформ уменьшается вместе с ростом количества словоупотреблений в корпусе, поэтому ре* презентативность корпуса должна обеспечиваться не столько за счет увеличения его объёма, сколько за счет более тщательной выборки текстов.

2. Статистические данные о структурных элементах текста могут служить надежной основой для выявления параллельных сегментов в текстах на немецком и русском языках и использоваться при разработке параллельных корпусов текстов.

3. Документы ООН занимают особое место среди политических типов текстов в составе официально-делового стиля современного немецкого литературного языка, что обусловлено их внешнеполитическим характером, особым статусом их эмитента, усиливающейся интернационализацией немецкого языка.

4. Между общей коммуникативно-функциональной направленностью текста и основными средствами выражения модальности существует непосредственная зависимость, выражающаяся для модальных глаголов немецкого языка в изменении их частотно-распределительных характеристик в зависимости от функционально-стилевой принадлежности текста.

5. Речевой фон употребления отдельных модальных глаголов немецкого языка, частотность и выбор синтаксических конструкций для их употребления тесно связаны с общей коммуникативно-функциональной направленностью текстов.

Апробация результатов исследования: основные положения работы были представлены в виде докладов на Международных научных конференциях Л

Korpuslinguistik deutsch: synchron — diachron - kontrastiv» (2003 г.) и «Europa-tag» (2004 г.) в университете г. Вюрцбург (ФРГ), «Компаративистика: современная теория и практика» (2004 г.) в Самарском государственном педагогическом университете и на конференции «Русско-немецкие культурно-исторические контакты» в Тольяттинском государственном университете (2004 г.), а также обсуждались на заседаниях кафедры немецкой филологии СамГУ.

Структура и объем диссертации: диссертация состоит из введения, трех глав, заключения, списка использованной научной литературы и словарей, списка входящих в ПКТ «DER» текстов, глоссария терминов и приложения (CD-ROM с электронной версией ПКТ «DER» для Windows).

Похожие диссертационные работы по специальности «Германские языки», 10.02.04 шифр ВАК

Заключение диссертации по теме «Германские языки», Вадяев, Сергей Евгеньевич

Выводы к главе 3

В последние десятилетия особое внимание лингвистов уделяется изучению • политических ТТ, и отмечается тенденция изменения данной группы ТТ в рамках ОДС, обусловленная значительными преобразованиями во конце XX века структуры политических учреждений и политической системы в целом, в частности в ФРГ. Большинство таких исследований построено на материале внутриполитических ТТ (конституция, парламентские документы, законы и т.п.) и практически не затрагивают ТТ, относящиеся к внешнеполитической деятельности (международные договоры, документы Европейского союза и ООН). В современных условиях постоянно расширяющихся международных политиче-ф ских контактов и усиливающейся глобализации изучение текстов официальноделового стиля (ОДС), регулирующих правовые и политические отношения субъектов международного права, приобретает особую актуальность. До настоящего времени исследования, рассматривающие стилистические особенности подобных текстов, где на основе их репрезентативной подборки проводился W бы квантитативная оценка частотности и квалитативный анализ типичных для данного ТТ явлений, являются малочисленными.

Документы ООН занимают особое место среди политических ТТ, что обусловлено особой ролью эмитента этих текстов и их внешнеполитическим характером. Статус международной организации и задачи, заложенные в уставе ООН, во многом, определяют прагматическую перспективу ТТ, представленного в ПКТ «DER». В отличие от резолюций ООН, для которых основной является директивно-регулятивная функция, доклады Генсекретаря имеют менее категоричный характер, поскольку его положения в правовом смысле не являются обязательными для выполнения. Для данного ТТ основными коммуникативными функциями являются аппелятивная и ориентирующая, а директивно-регулятивная выполняет скорее вспомогательное значение. Это составляет специфику данного ТТ и во многом определяет его композиционные и стилистические особенности.

Используя тексты ООН, входящие в ПКТ «DER», и его инструментарий можно выявить языковые средства, типичные для данного ТТ, и дать подробную картину их употребления в текстах указанного типа (Доклады Генсекретаря ООН). ПКТ «DER» даёт возможность быстро и надёжно получить разнообразные результаты обработки большого массива текстов, что, в свою очередь, обеспечивает получение точных статистических данных.

На основе сопоставительного анализа частотно-распределительных характеристик модальных глаголов в немецкой части ПКТ «DER» и в одноязычном корпусе «DDW» было выявлено, что частотно-распределительные характеристики некоторых модальных глаголов в них значительно отличаются. На наш взгляд это связано с тем, что они содержат ТТ с различной коммуникативно-функциональной направленностью. Изменения в частотности употребления модальных глаголов являются отражением этих различий.

Несмотря на то, что прагматическая функция долженствования играет важную роль в документах ООН, её выражение в них носит не категоричный, а рекомендательный характер. Это косвенно подтверждается преобладанием количества употреблений глагола sollen над количеством употреблений глагола mtissen. Статус ООН и язык дипломатических документов обусловливают общую тенденцию снижения категоричности выраженного модальными глаголами долженствования при одновременном сохранении коммуникативной функции долженствования и предписывающего, нормативного характера данных текстов. Большинство употреблений глагола кдппеп относится к телеологическому речевому фону и служит для ориентации высказывания на определенную цель, а также для выражения возможности её достижения, что вполне соотносится с общей интенцией представленных в ПКТ «DER» текстов ООН. Воли-тивный речевой фон играет в текстах ООН скорее второстепенную роль, так как он не соответствует общей функционально-коммуникативной направленности официально-делового стиля. Этим фактором обусловлена довольно низкая частотность глаголов wollen и mogen.

Каждый из модальных глаголов реализует целый спектр модальных значений. В каждом конкретном употреблении актуализируется одно из этих значений. При этом значение модального глагола обусловливается речевым фоном высказывания. Анализ употреблений модальных глаголов в немецких текстах ПКТ «DER» показывает, что различные значения модальных глаголов отчетливо проявляются в текстах на русском языке, что может служить в качестве дополнительного дифференцирующего признака, отражающего речевой фон данного употребления и позволяющего оценить его зависимость от общей интенции текстов, представленных в ПКТ «DER».

Заключение

В рамках данного исследования был разработан электронный корпус текстов «DER», послуживший текстовой и инструментальной основой для выявления особенностей функционирования модальных глаголов в немецких текстах официально-делового стиля как отражения их стилистического своеобразия.

Решение поставленной задачи осуществлялось в два этапа. На первом этапе были сформулированы лингвистические принципы построения ПКТ «DER», разработана технология автоматической обработки текстов корпуса, а также средства их представления и анализа.

Для составления ПКТ «DER» была произведена оценка объема существующих электронных параллельных текстов для немецкого и русского языков и возможностей их использования в корпусе. Учитывая фактор межкультурных связей, можно констатировать существование значительного количества параллельных текстов на русском и немецком языках, однако для составления сбалансированного русско-немецко-немецко-русского ПКТ не всегда возможно найти тексты, аналогичные по тематикам и жанрам и относящиеся к одному периоду времени. Хотя «в обе стороны» переводится довольно большое количество текстов, различия в культурных традициях приводят к сильному дисбалансу в структуре переводных текстов на немецком и русском языках. Таким образом, получить «зеркальные» субкорпуса оригинальных и переводных текстов любого типа представляется проблематичным.

Для подготовки текстов ПКТ «DER» была разработана оптимальная для целей исследования методика автоматического определения структурных элементов текста (абзацев и предложений) на основании их формальных признаков (знаков пунктуации, элементов графического оформления и т.п.), а также технология выявления параллельных сегментов в текстах ПКТ с использованием статистических данных об их объеме (статистико-вероятностный метод).

На основе существующих в лингвистике определений структуры текстов и имеющихся в них уровнях членения, а также с учетом особенностей автоматической обработки текста была разработана концепция автоматического определения границ структурных элементов в тексте, предназначенных для последующей стыковки. Данная концепция базируется, во-первых, на признании важной роли знаков пунктуации при членении письменного текста и, во-вторых, на постулате о невозможности автоматического определения границ элементов текста без учета их формальных признаков. Поскольку при автоматической обработке электронный текст воспринимается как последовательность байтов, а не как смысловое единство, то автоматическое определение границ предложений и абзацев в тексте может осуществляться только с учетом «физических» признаков этих структурных элементов. Такими признаками могут являться знаки пунктуации, элементы графического оформления текста, строчные/прописные буквы.

С учетом существующих теоретических концепций [В. Гейл, К. Черч] была разработана оригинальная методика автоматического выявления параллельных сегментов в текстах на немецком и русском языках. Результаты данной работы подтверждают возможность автоматического выявления параллельных сегментов в электронных текстах на немецком и русском языках. Наиболее эффективным методом выявления параллельных сегментов в текстах на немецком и русском языках оказался статистическо-вероятностный подход, основанный на определении и сравнении количественных характеристик (числа знаков) структурных элементов текста (предложений и абзацев). Результаты исследования показали, что решающее значение при автоматической стыковке параллельных текстов играет величина предельного отклонения сравниваемых сегментов, складывающаяся из величины относительного и абсолютного отклонения.

В рамках данной работы была также успешно разработана и опробована программная оболочка для наглядного представления текстов ПКТ «DER» и осуществления эффективного поиска в них. Она позволила получать различные статистические данные, эффективно управлять содержащейся в корпусе информацией, а также её представлением для исследователя. С её помощью было установлено, что значительное увеличение объема корпуса не ведет к прямо пропорциональному росту количества уникальных лексем в корпусе. При увеличении объема (т.е. количества словоупотреблений) немецкой части ПКТ «DER» более чем в 8 раз количество словоформ увеличивается примерно в 3,5 раза. Даже при существенном увеличении объема корпуса количество словоформ во всем корпусе повышается лишь незначительно. Это позволяет сделать вывод о том, что даже значительное повышение объема корпуса не ведет к пропорциональному росту количества уникальных лексем в текстах корпуса. Таким образом, тщательная выборка первоначальных текстов позволила на основе достаточно компактного корпуса получить достоверные данные для всех текстов данного типа, отвечающих заданным параметрам отбора.

На втором этапе исследования на основе данных квантитативного и квалитативного стилистического анализа немецкого субкорпуса ПКТ «DER» были выявлены закономерности частотно-распределительных характеристик немецких модальных глаголов и их зависимость от общей коммуникативно-функциональной направленности представленного в ПКТ «DER» типа текстов (ежегодные доклады Генсекретаря о работе ООН).

На основе ПКТ «DER» было проведено исследование функционирования модальных глаголов в текстах официально-делового стиля в современном немецком языке (на примере текстов ООН), в котором квантитативные методы исследования сочетались с квалитативным анализом полученных на их основе данных. Такой подход позволил выявить зависимости между основной коммуникативной функцией представленного в корпусе типа текстов и частотно-распределительными характеристиками модальных глаголов, являющихся в немецком языке одним из основных средств выражения модальности. На основе немецких текстов ПКТ «DER» были рассмотрены особенности частотно-распределительных характеристик модальных глаголов и определены наиболее употребительные значения модальных глаголов в текстах ООН.

Значения возможности, необходимости, разрешения, запрета и желания выражаются в немецком языке в основном при помощи модальных глаголов. Они являются одной из существенных частей системы модальности в немецком языке, а именно той частью, которая вносит весомый вклад в формирование общей интенции всего текста, и играют важную роль в выражении его функционально-коммуникативных параметров. Они также имеют особое значение для реализации в текстах официально-делового стиля на немецком языке прагматической функции долженствования и выражения их предписывающе-оценочного характера. Как показали результаты исследования, частотно-распределительные характеристики модальных глаголов можно отнести к числу характеристик, свойственных определенному типу текстов (доклады Генсек-ретаря ООН, относящиеся к официально-деловому функциональному стилю).

Как показывает частотность употребления модальных глаголов в немецких текстах ПКТ «DER», глаголы dtirfen, mogen и wollen встречаются в представленных текстах значительно реже, чем кбппеп, mtissen и sollen. Такая частотность употребления модальных глаголов в целом сохраняется в каждом отдельном тексте. Это означает, что данный признак является отличительной чертой представленного в корпусе типа текстов и практически не изменяется в зависимости от экземпляра текста.

Несмотря на то, что прагматическая функция долженствования играет важную роль в документах ООН, её выражение носит менее категоричный, рекомендательный характер. Это косвенно подтверждается преобладанием количества употреблений глагола sollen (29% всех употреблений модальных глаголов) над количеством употреблений mtissen (20% всех употреблений модальных глаголов). Статус ООН и язык её дипломатических документов обусловливают общую для них тенденцию снижения категоричности выраженного модальными глаголами долженствовании, при одновременном сохранении коммуникативной функции долженствования и предписывающего, нормативного характера данных текстов (доклад Генсекретаря).

Как показал анализ употреблений глагола кдппеп, большинство из них отно

• сится к телеологическому речевому фону и служит для ориентации высказывания на определенную цель, а также для выражения возможности её достижения, что вполне соотносится с общей интенцией представленных в ПКТ «DER» текстов. Анализ употреблений глагола durfen даёт основание утверждать, что этот модальный глагол практически не используется в текстах ПКТ «DER» в своём основном значении для выражения «категоричного разрешения». Большинство

• употреблений представляет собой сочетание модального глагола с отрицанием, что по своей сути является конструкцией, синонимичной основному значению глагола sollen. Преобладание в немецких текстах ООН данного значения может быть объяснено характером текстов: все высказывания с использованием глагола durfen либо относятся к регламентированию деятельности самой организации, либо выражают рекомендации для мирового сообщества. Этот факт объясняет то, что практически все употребления данного модального глагола относятся к нормативному речевому фону. щ Как показывает статистика употреблений глаголов wollen и mogen в немецкой части ПКТ «DER», их частотность (наряду с dtirfen) является одной из самых низких среди всех модальных глаголов. На wollen приходится 3% от всех употреблений модальных глаголов, а на mogen — 2%. Данные глаголы употребляются в основном в волитивном речевом фоне, который не является в целом типичным для текстов официально-делового стиля вообще и документов ООН в частности.

Сравнение частотно-распределительных характеристик модальных глаголов ф в немецких текстах ПКТ «DER» и в текстах корпуса общего типа «Der deutsche

Wortschatz» («DDW», www.wortschatz.uni-leipzig.de), включающих в себя спектр текстов различных типов, отчетливо показывает, что частотно-распределительные характеристики некоторых модальных глаголов в корпусах текстов значительно отличаются. Это можно объяснить тем, что они содержат разные типы текстов с отличающейся коммуникативно-функциональной направленностью, а изменения в структуре употребления модальных глаголов являются отражением этих различий. Учитывая эти предположения, были интерпретированы статистические данные, полученные на основе этих двух корпусов. Различия частотно-распределительных характеристик модальных глаголов во многом подтверждают предположения о том, что их колебания во многом обусловлены особенностями функционально-стилевой принадлежности текстов, представленных в ПКТ «DER» и в корпусе «DDW».

Результаты анализа употреблений модальных глаголов в немецком субкорпусе ПКТ «DER» показали, что некоторые из них (sollen и konnen) используются в ряде типичных синтаксических конструкций (придаточных предложений). Примерно половина всех употреблений sollen приходится на определительные придаточные предложения (-28% всех употреблений sollen), условные придаточные предложения с союзом wenn (-14%), придаточные предложения с местоименным наречием wodurch или с предлогом durch + существительное/местоимение (-7%). Примерно треть всех его употреблений konnen приходится на придаточные предложения с союзами dass/dafi (15%), damit (5%) и wie (10%).

Анализ употреблений модальных глаголов в немецких текстах ПКТ «DER» также показал, что различные значения модальных глаголов отчетливо передаются при переводе в текстах на русском языке, что может служить в качестве дополнительного дифференцирующего признака, отражающего речевой фон данного употребления и позволяющего оценить его зависимость от общей интенции текстов, представленных в ПКТ «DER».

В качестве продолжения данной работы планируется постепенное пополнение корпуса новыми текстами, относящимися к различным функциональным стилям и более полно отражающими соотношение лексических единиц в письменных текстах. Постепенное увеличение объема используемых в корпусе текстов будет обеспечивать более высокую степень репрезентативности и содержать большее количество лексических единиц. ПКТ «DER» состоит из двух подкорпусов для немецкого/русского языков. Каждый из данных массивов текстов может использоваться как самостоятельная единица и служить для проведения различных исследований, касающихся данного конкретного языка.

Способы использования ПКТ «DER» ограничены лишь его техническими возможностями и набором входящих в него текстов, поэтому в дальнейшем предполагается не только увеличивать число текстов в корпусе, но и расширять его функциональные возможности. При наличии необходимого инструментария можно вносить в тексты корпуса дополнительную лингвистическую мета-информацию - например, о грамматической форме слова, синтаксической структуре предложения и т.п. Поступательное наполнение текстов корпуса дополнительной метаинформацией позволит значительно расширить возможные области применения ПКТ «DER» в германистике.

Список литературы диссертационного исследования кандидат филологических наук Вадяев, Сергей Евгеньевич, 2005 год

1. Абрамов Б.А. Теоретическая грамматика немецкого языка. - М.: Гуманитарный издательский центр ВЛАДОС, 1999. - 286 с.

2. Абрамов Б.А., Семенюк Н.Н. Немецкий язык // Языки мира: Герм.яз. Кельт.яз. М.: Academia, 2000. - С. 216-271.

3. Аверина С.А., Азарова И.В., Алексеева Е.Л. Прикладное языкознание. -СПб.: Изд-во Санкт-Петербург, ун-та, 1996. 525 с.

4. Адмони В.Г. Введение в синтаксис современного немецкого языка. М.: Издательство литературы на иностранных языках, 1955. - 392 с.

5. Адмони В.Г. Система форм речевого высказывания. СПб.: Наука, 1994. -151 с.

6. Андрющенко В.М. Автоматическая обработка текста // Лингвистический энциклопедический словарь / Гл.ред. В.Н. Ярцева. М.: Советская энциклопедия, 1990. - С. 14-15.

7. Андрющенко В.М. Концепция и архитектура машинного фонда русского языка. М.: Наука, 1989. - 200с.

8. Аношкина Ж.Г. Лингвистический программно-источниковый пакет UNILEX+. Тексто-ориентированная компонента UNILEX-T. // Бюллетень Машинного фонда русского языка. 1992. - Вып. 2. - С. 3-7.

9. Апресян Ю.Д. Идеи и методы современной структурной лингвистики. -М.: Просвещение, 1966. 300 с.

10. Балли Ш. Общая лингвистика и вопросы французского языка. -2.изд.,стер. М.: Эдиториал УРСС, 2001. - 416 с.

11. Баранов А.Н. Введение в прикладную лингвистику. М.: Эдиториал УРСС, 2001.-358 с.

12. Баранов А.Н. Проблема репрезентативности корпуса текстов // Труды Международного семинара Диалог-2001 по компьютерной лингвистике и её приложениям. М.: РГГУ, 2001. - С. 35-42.

13. Беляева Л.Н., Герд А.С., Убин И.И. Автоматизация в лексикографии // Прикладное языкознание. СПб.: Изд-во СПб-ского ун-та, 1996. - С. 318333.

14. Беляева Л.Н., Откупщикова М.И. Автоматический (машинный) перевод // Прикладная лингвистика. СПб.: Изд-во СПб-ского ун-та, 1996. - С. 4352.

15. Бернард Л., Шперберг Мак-Куин С.М. Введение в TEI Lite - Русская редакция, 1995. http://www.tei-c.org.uk/Lite/teiu5 ru.rtf

16. Богуславский И.М. и др. Аннотированный корпус русских текстов: концепция, инструменты разметки, типы информации // Труды Международного семинара «Диалог 2000 по компьютерной лингвистике и ее приложениям». М.: РГГУ, 2000. - Т. 2. - С. 41-47.17

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.