Совершенствование методических основ определения и механизма применения особых пошлин в целях защиты экономических интересов государства тема диссертации и автореферата по ВАК РФ 08.00.05, кандидат экономических наук Девочкина, Юлия Эдуардовна
- Специальность ВАК РФ08.00.05
- Количество страниц 245
Оглавление диссертации кандидат экономических наук Девочкина, Юлия Эдуардовна
Введение.
Глава 1. Теоретические основания лексикографического описания в Ил^Ке!.
1.1 Структурная организация лексики.
1.1.1 Полевая организация лексики.
1.1.1.1 Концепции поля в языкознании.
1.1.1.2 Понятие лексико-семантической группы в Кг^Ые!.
1.1.2 Семантические деревья ЛСГ в КиБвКе!.
1.2 Теория валентности в лингвистике и ее применение к лексико-семантическому описанию.
1.2.1 Становление и развитие теории валентности.
1.2.1.1 Введение.
1.2.1.2 Становление теории валентности.
1.2.1.3 Теория валентности в немецкой традиции.
1.2.1.4 Теория валентности в отечественном языковедении.
1.2.1.5 Выводы по разделу «Становление и развитие теории валентности».
1.2.2 Трактовка рамок валентностей в ИгтЫе!.
Глава 2. Лексико-семантическая группа глаголов положения в пространстве:.
• 2.1 Границы ЛСГ глаголов положения в пространстве.
2.2 Отбор материала и составление списка исследуемых значений-.
2.3 Валентности ЛСГ глаголов положения в пространстве.
2.4 Семантическая структура ЛСГ глаголов положения в пространстве.
2.4.1 Дифференциальные семы ЛСГ глаголов положения в пространстве как основание внутренней классификации ЛСГ.
2.4.2 Иерархическая структура ЛСГ глаголов положения в пространстве.
2.4.3 Полевая организация ЛСГ глаголов положения в пространстве.
2.4.4 Экспликация сем в контекстах.
2.5 Выводы.
Глава 3. Лексико-семантическая группа глаголов мышления.
3.1. Отбор материала и составление списка исследуемых значений.
3.2 Валентности ЛСГ глаголов мышления.
3.3 Семантическая структура ЛСГ глаголов мышления.
3.3.1 Дифференциальные семы ЛСГ глаголов мышления.
3.3.2 Иерархическая структура ЛСГ глаголов мышления.
3.4 Выводы.
Глава 4. Формальный анализ дистрибуций ЛСГ глаголов положения в пространстве.
4.1 Статистико-комбинаторные методы описания значений глаголов.
4.1.1 Введение.
4.1.2 Дистрибутивный метод.
4.1.3 Метод дистрибутивно-статистического анализа текстов.
4.1.4 Методы автоматической классификации лингвистических данных.
4.1.5 Использование локального контекста для автоматического анализа лексики.
4.2 Применение процедуры автоматического анализа для исследования структуры ЛСГ глаголов положения в пространстве.
4.2.1 Методика и цели исследования.
4.2.2 Эксперимент 1: кластерный анализ для ядерной области (17 WM).
4.2.3 Эксперимент 2: присоединение предъядерной области (кластерный анализ для-37 \¥М).
4.2.4 Эксперимент 3: сокращение ядерной совокупности.
4.2.5 Выводы по разделу «Применение процедуры автоматического анализа для исследования структуры ЛСГ глаголов положения в пространстве».
Рекомендованный список диссертаций по специальности «Экономика и управление народным хозяйством: теория управления экономическими системами; макроэкономика; экономика, организация и управление предприятиями, отраслями, комплексами; управление инновациями; региональная экономика; логистика; экономика труда», 08.00.05 шифр ВАК
Фаунонимические глаголы современного немецкого языка2003 год, кандидат филологических наук Фролова, Вера Александровна
Формализованное описание структуры лексико-семантического поля глаголов деятельности для компьютерного идеографического словаря типа WordNet: на материале русского языка2007 год, кандидат филологических наук Ушакова, Анастасия Александровна
К вопросу о соотношении широкого и узкого значения слова: на материале глагола run в английском языке и глаголов laufen, rennen в немецком языке1979 год, кандидат филологических наук Аралов, Александр Михайлович
Глаголы и глагольные конструкции попытки к совершению действия в современном английском языке2003 год, кандидат филологических наук Мельникова, Елена Николаевна
Семантика и валентность глаголов лексико-семантического поля lieben2003 год, кандидат филологических наук Эберт, Татьяна Викторовна
Введение диссертации (часть автореферата) на тему «Совершенствование методических основ определения и механизма применения особых пошлин в целях защиты экономических интересов государства»
Одним из перспективных и актуальных направлений в сфере компьютерной лингвистики является создание лингвистических баз, призванных возможно более точно воспроизвести структурные связи (особенно семантические), существующие в естественном языке. Это предполагает как обработку больших объемов фактического языкового материала, так и глубокую разработку методологических принципов, определяющих построение таких моделей. Одной из структур такого типа является компьютерный словарь Кл^Ке^ который, как и аналогичные тезаурусы, созданные в других странах, строится на принципах, которые легли в основу разработанного в Принстон-ском институте США компьютерного словаря \УогШЧе1:.
ШогсНМе! создавался с 1985 по 1995 год под руководством известного психолингвиста-когнитолога Дж. Миллера. Основное отличие его от существовавших тезаурусов состояло в том, что в качестве первоочередной задачи создатели ставили воссоздание лексической системы естественного языка. Дж. Миллер и его коллеги отказались от алфавитного способа упорядочения лексики, традиционно применяемого в, толковых словарях, так как такое представление, по их мнению, не соответствует когнитивной структуре в сознании носителя языка. Вместе с тем, большая часть грамматической и прочей информации, содержащихся в подобных словарях, безусловно, представляет важность и в том или ином виде содержится в сознании человека, владеющего языком, и поэтому ее необходимо сохранить [Азарова, Митрофанова 2002: 3-4].
За основу в WordNet были взяты семантические связи между словами знаменательных частей речи. В качестве базовой структурной единицы словаря выступил синсет (синонимический ряд) — группа слов,- выражающая определенное значение. Объединение лексем в синсет происходило на основе некоторого значения — семантической доминанты ряда, а их упорядочение в ряду производилось по нескольким признакам, таким как точность выражения семантической доминанты, стилистическая окраска, употребительность лексем и т. п. [Азарова 1996: 236]. Синсеты в структуре WordNet были распределены по четырем базам данных — блокам существительных, глаголов, прилагательных и наречий. Каждый синсет при этом мыслился как лексика-лизованное понятие. В случае многозначности слова оно могло встречаться более чем в одном синсете; омонимия также приравнивалась к многозначности [Азарова, Митрофанова 2002: 4].
Связи между синсетами и словами, входившими в их состав, носили характер парадигматических отношений. Их структура была довольно слабо, развитой по сравнению с более поздними электронными словарями. Между словами были заданы отношения синонимии и антонимии, между синсетами — гипонимия, тропонимия и различные виды лексического вывода, такие как каузация, пресуппозиция [Азарова, Митрофанова 2002: 4].
Компьютерный словарь WordNet после появления быстро приобрел большую популярность, и вскоре в разных европейских странах стали создаваться аналогичные ему компьютерные словари на основе лексики этих стран. Во 2-й половине 90-х гг. XX в. был реализован общеевропейский проект EuroWordNet, состоявший в построении многоязычной языковой базы для нескольких европейских языков. В состав базы EuroWordNet вошли гол-t ландский, испанский, итальянский, немецкий, французский, чешский и эстонский языки. Отдельные языковые базы получили название wordnet'oB (написание строчными буквами в отличие от оригинального принстонского WordNet'а). Для связи этих языковых баз в единую многоязычную базу данных использовалась система межъязыковых индексов — Inter Linguial Index (ILI). При создании EuroWordNet были устранены некоторые недостатки оригинального WordNet, например, слишком мелкое дробление на синсеты; система парадигматических отношений была существенно расширена и доработана. К 1999 г. проект EuroWordNet был завершен, но доработка языковых баз и создание новых языковых структур продолжается и в настоящее время; в случае совместимости вновь созданных структур возможно их подключение к общей системе Еиго\Уог(1Ые1 [Азарова, Митрофанова 2002: 5].
Как в принстонском \VordNet, так и в аналогичных ему по строению национальных тезаурусах при помощи отношения гипонимии из синсетов были сформированы иерархические структуры. Эти структуры представляли собой не единое дерево с абстрактным корнем, имеющим значение типа «нечто», а набор не связанных друг с другом структур, то есть лес. Так, для существительных были заданы такие вершины структур, как вещество, время, количество, местоположение, намерение, объект, отношение, совокупность и др. [Азарова, Митрофанова 2002: 7-8].
С 1999 на кафедре математической лингвистики Санкт-Петербургского государственного университета начались работы по созданию русской версии \VordNet. Проект компьютерного тезауруса лексики русского языка получил название КшзЫе!. При работе над ним необходимо было учитывать специфику русского языка и как следствие ряд трудностей, присущих работе именно с ним, к примеру, широкие возможности деривации с использованием большого количества аффиксов.
Основной проблемой, встающей перед исследователями, является изучение различных лексико-семантических полей русской лексики, что необходимо для построения фрагментов Для построения синсетов и задания отношений между ними необходимо изучить структуру русской лексики в плане семантики, сформулировать парадигматические отношения между лексическими единицами русского языка, построить структуры зависимостей между ними. В настоящее время в проекте КшзЫ^ на кафедре математической лингвистики в СПбГУ участвует большое количество студентов, аспирантов и преподавателей; этой задаче посвящен ряд исследований, выполненных и выполняемых на кафедре. Основным методом анализа русской лексики при этом является статистический анализ контекстов из корпуса и как следствие установление отношений между лексическими единицами в структуре русского языка — как парадигматических, так и синтагматиче6 ских. Парадигматические отношения устанавливаются как между синсетами, таге и между их отдельными элементами — литералами. В структуру описания элементов ЯиБзКе! включаются их дефиниции, взятые из толкового словаря, а также указание на связь с другими элементами при помощи определенных отношений. Из всех отношений важнейшим является гипонимия, на основе которой синсеты 11и88№1 объединяются в семантические деревья. Информация о синтагматических отношениях, то есть о сочетаемости слов, хранится в виде так называемых рамок валентностей; описывающих типичное для данного слова окружение.
Еще одним направлением исследований, выполняемых в рамках КиБэКе^ является разработка процедур автоматической классификации лексики на основе дистрибуций [Агагоуа 2008: 452-453]. В настоящее время разработан метод формального анализа, основанный на методике К. Ликок и М. Ходорова с применением локального контекста лексических элементов [Ьеасоск, СЬос1ого\у 1998]. В ходе исследований [Азарова, Марина 2006] установлен оптимальный размер окна анализа для осуществления автоматической классификации глаголов русского языка — [-3. +5] от исходного слова.
Актуальность настоящего исследования определяется в первую очередь необходимостью расширения фактической базы словаря без которой невозможно полноценное методологическое обеспечение проекта. До настоящего времени остается не проясненным до конца вопрос о том, какие возможности для идеографического описания (построения синсетов и установления отношений между ними) открываются при привлечении контекстной информации, выражаемой для глаголов в виде рамок валентностей. Также существует необходимость более тщательного изучения процедуры автоматической классификации на основе дистрибуций с точки зрения ее возможности служить инструментом для изучения внутренней структуры лексико-семантической группы.
Целью исследования является интерпретация морфосинтаксических дистрибуций глагольных контекстов на основе структуры лексико-семантических групп разных типов.
Данная цель достигается путем решения следующих задач:
1) отбор и контекстный анализ глаголов, относящихся к лексико-семантической группе глаголов положения в пространстве и к лексико-семантической группе глаголов мышления с выделением, пар «глагол — значение» (word-meaning, WM) для многозначных лексем;
2) составление описания рамок валентностей выбранных пар «глагол — значение»;
3) выделение основных семантических компонентов, определяющих формирование указанных глагольных групп, и применение этих компонентов для установления системных отношений внутри данных групп;
4) отбор контекстов, снабженных морфологической разметкой со снятой омонимией, из корпуса русских текстов «Бокренок 3» для-выбранных пар «глагол — значение», формирование для них дистрибуций в окне анализа [3. +5] и автоматическое вычисление мер сходства между парами WM для последующего автоматического кластерного анализа (с использованием существующего программного обеспечения);
5) проведение серии экспериментов с использованием процедуры кластерного анализа при меняющейся совокупности классифицируемых элементов (пар «глагол — значение») и интерпретация полученных результатов при помощи данных о структуре ЛСГ, полученных на этапе 3).
Работа выполнена на материале русской глагольной лексики, включая 57 глаголов положения в пространстве и 22 глагола мышления. Источником данных о контекстном окружении исследуемых глаголов служил корпус «Бокренок 3».
При выполнении указанных целей были применены следующие методы:
- контекстный анализ, позволивший на основе выборок из корпуса выделить пары «глагол — значение» и провести для них описание рамок валентностей;
- дефиниционный анализ, на основании которого были выделены основные семантические компоненты исследуемых глагольных групп;
- компонентный анализ, примененный для выделения основных семантических компонентов (сем), определяющих структуру ЛСГ глаголов положения в пространстве и ЛСГ глаголов мышления;
- дистрибутивный анализ, процедура которого позволила определить величину сходства между дистрибуциями, сформированными на основе контекстов с морфологической разметкой в окне анализа [-3. +5]; - кластерный анализ, проведенный на базе результатов дистрибутивного анализа.
Научная новизна исследования состоит:
- в обосновании выделения лексико-семантической группы глаголов положения в пространстве как единой группы, объединяющей статичные, фазовые и каузативные глаголы;
- в предоставлении структурно-семантического представления лекси-ко-семантических групп глаголов положения в пространстве и глаголов мышления;
- в уточнении роли формального дистрибутивного анализа как источника представления данных о внутренней структуре ЛСГ.
Теоретическая значимость исследования выражается в расширении и уточнении данных об управлении исследованных глаголов, о структурных связях между ними в пределах ЛСГ, а также в расширении представлений о роли формального дистрибутивного анализа в его применении к лексике.
Практическая значимость исследования обусловлена возможностью встраивания описанных контекстов глаголов в структуру ЫшвЫе!, а также возможностью использования данных формального анализа для уточнения методики составления тезауруса.
На защиту выносятся следующие положения:
1. Лексико-семантическая группа глаголов положения в пространстве неоднородна и имеет сложную структуру. Ядро группы составляют статичные глаголы, далее располагаются подгруппы, связанные с ядром отношениями специализации (подгруппа фазовых глаголов и подгруппа каузативных глаголов), а также подгруппа глаголов движения. Для статичных, фазовых и каузативных глаголов дополнительно выделяются две семантические области со значением «место (пространственные координаты)» и «положение (пространственная организация)» соответственно. Эти области универсальны для трех перечисленных подгрупп.
2. Лексико-семантическая группа глаголов мышления также неоднородна. Ядро группы составляют глаголы со значением собственно мышления, далее располагаются глаголы, у которых это значение модифицировано: мнение, намерение, рассуждение, поведение (под влиянием ментальных процессов), качество (как рефлексия мыслящего субъекта).
3. Модели управления большинства глаголов положения в пространстве сходны по структуре. Типичная для глаголов данной группы рамка валентностей включает позиции субъекта, объекта (только для каузативных глаголов) и обстоятельства места.
4. Модели управления глаголов мышления не являются единообразными. Для глаголов данной группы рамки валентностей могут отличаться друг от друга и включать следующие позиции: субъект, объект, обстоятельство времени, обстоятельство образа действия, предложно-падежная группа, придаточное предложение.
5. При проведении автоматической классификации глаголов положения в пространстве по параметрам морфосинтаксической дистрибуции находят регулярное отражение отношения специализации (фазовость, каузативность). В то же самое время, семантические компоненты «Место» и «Положение» не оказывают значимого воздействия на результаты автоматической классификации. Малая частотность глаголов мышления и, как следствие, недостаточ
10 ный объем выборочных совокупностей при отборе контекстов для формирования морфосинтаксических дистрибуций не позволяет провести автоматическую классификацию, результаты которой были бы надежны и достоверны.
Апробация работы. Результаты исследования обсуждались на ХХХГХ Международной филологической конференции (Санкт-Петербург, 5-20 марта 2010 г.) и на ХЬ Международной филологической конференции (Санкт-Петербург, 14-19 марта 2011 г.).
Структура работы
Диссертация состоит из введения, четырех глав, заключения, приложений, списка научной литературы (98 наименований: из них 67 на русском языке, 31 — на иностранных языках).
Похожие диссертационные работы по специальности «Экономика и управление народным хозяйством: теория управления экономическими системами; макроэкономика; экономика, организация и управление предприятиями, отраслями, комплексами; управление инновациями; региональная экономика; логистика; экономика труда», 08.00.05 шифр ВАК
Валентность татарского глагола2013 год, кандидат филологических наук Садыкова, Разиля Зуфаровна
Глагольные лексемы со значением качественного и качественно-оценочного признака: на материале современного немецкого языка2007 год, кандидат филологических наук Фадеева, Лариса Викторовна
Управление глагола как проявление его семантических свойств: На примере глаголов лексико-семантической группы созидания2000 год, кандидат филологических наук Архипова, Любовь Владимировна
Свойства субстантивно-глагольных фразеологизмов в аспекте их валентности1984 год, кандидат филологических наук Торцова, Марина Владимировна
Семантика каузативных глаголов в русском и польском языках2007 год, кандидат филологических наук Шорохова, Инга Александровна
Заключение диссертации по теме «Экономика и управление народным хозяйством: теория управления экономическими системами; макроэкономика; экономика, организация и управление предприятиями, отраслями, комплексами; управление инновациями; региональная экономика; логистика; экономика труда», Девочкина, Юлия Эдуардовна
4.2.5 Выводы по разделу «Применение процедуры автоматического анализа для исследования структуры ЛСГ глаголов положения в пространстве»
Результаты кластерного анализа ядерной совокупности (17 ЛУМ) позволяют заключить, что одним из факторов, влияющих на формирование кластеров, является способ представления .действия (статичность / фазовость / каузативность). Напротив, семы «Место», «Положение», «Перемещение» не получают регулярного выражения в локальном контексте и, соответственно, не могут влиять на. формирование кластеров: Данный вывод подтверждается результатами кластерного анализа для группы с общим значением, выражаемым семой «Место», а также для группы значений статичных глаголов. Тем не менее, как результаты кластеризации для исходной совокупности, так и результаты кластеризации для группы значений фазовых глаголов показывают, что способ представления действия не является единственным фактором, детерминирующим состав и структуру кластеров.
Результаты кластерного анализа ядерной совокупности, объединенной с предъядерной (всего 37 \УМ) позволяют заключить, что частотные значения, дистрибуция которых образована из большего количества контекстов, чаще объединяются в кластеры с, другими значениями, чем менее частотные, дистрибуция которых в большей степени: подвержена влиянию случайных факторов, таких, как необычный, нетипичный контекст.
Результаты кластерного анализа групп значений, образованных по принципу противопоставления способов выражения действия (фазовые + каузативные \¥М, статичные + каузативные, статичные + фазовые) позволяют сделать вывод, что наиболее ярко противопоставляются друг другу статичные и каузативные \¥М. Взаимоотношение статичных \УМ с фазовыми носит наиболее сложный характер; .
Заключение
Системность содержательной организации лексики — одно из важных положений современного языкознания. Наиболее разработанным направлением, призванным вскрыть и описать эту систему, является лингвистическая теория поля. При всем многообразии лингвистических концепций, использующих понятие поля, их общим признаком выступает применимость прежде всего к большим группам языковых элементов, объединенных на основании некоторых общих компонентов. В отечественных исследованиях по лексической семантике поле обычно представляется как сложная структура, в которой выделяются подструктуры — лексико-семантические группы (ЛСГ), лексические парадигмы, а также и более мелкие образования. Слова в поле или группе имеют общий (интегральный) компонент значения — интегральную сему (архисему), по В.Г. Гаку, и противопоставляются по дифференциальным признакам (дифференциальные семы в терминологии В.Г. Гака) (подробнее см. Гл. 1, п. 1.1).
Расширение фактической базы компьютерного словаря определяющее актуальность настоящего исследования, влечет за собой необходимость изучения методологических вопросов, связанных с использованием таких процедур, как анализ глагольных рамок валентностей и автоматическая классификация глагольных контекстов на основе дистрибуций грамматических тегов в локальном контексте. Описание семантической структуры двух разных лексико-семантических групп (ЛСГ глаголов положения в пространстве и ЛСГ глаголов мышления) и привлечение данных об этой структуре для интерпретации результатов формального анализа тех же глаголов на основе их морфосинтаксических дистрибуций представляет собой синтез этих процедур, осуществленный с привлечением конкретного языкового материала.
В тезаурусе структура ЛСГ представляется в виде семантического дерева, построенного на основе парадигматических отношений, существующих между синсетами, а также между отдельными единицами синсетов.
Важнейшее из отношений такого рода — гипонимия (для глаголов ее аналогом выступает тропонимия), связывающая синсеты на основании родовидовых отношений между ними (подробнее см. Гл.1, п. 1.2).
Контекстная информация в Б1и88№1 выражается в виде рамок валентностей, которые содержат информацию как о количестве присоединяемых к слову элементов, так и об их качестве. При этом грамматическую характеристику позиции можно рассматривать как аналог синтаксической валентности, а семантическую квалификацию — как аналог семантической валентности.
Под глаголами положения в пространстве в русском языке мы понимаем максимально широкую группу, включающую в себя глаголы, в семантике которых пространственный компонент играет доминирующую роль. К их числу относятся как статичные глаголы, указывающие на нахождение в определенном пространственном положении (находиться, стоять, сидеть, лежать, висеть и т. п.), так и глаголы с динамичной семантикой — глаголы перехода в указанное состояние, или фазовые глаголы (сесть, лечь, встать, окружить и т. п.), а также глаголы, каузирующие переход в это состояние (положить, поставить, вытащить и др.). Также мы включаем сюда глаголы, семантика которых связана с переходом из одного пространственного положения в другое, например, бросить, падать, опуститься, подняться, поскольку в их семантике присутствует указание на начальный или конечный пункт перемещения.
Выборка глаголов со значением пространственного положения производилась на основе частотного словаря С.А. Шарова. Глаголы отбирались таким образом, чтобы представить как ядерную часть ЛСГ — наиболее частотные лексические единицы и те, которые выражают значение ЛСГ в наиболее общем виде, а во-вторых, ее периферию — глаголы, обладающие меньшей частотой встречаемости в корпусе текстов и выражающие более сложные действия либо маркированные в стилистическом плане. В дальнейшем была проведена коррекция полученного списка глаголов на основе анализа дефиниций, предлагаемых современным толковым словарем («Словарь русского языка» в 4 томах, МАС). Список исследованных глаголов положения в пространстве включал в себя 57 наименований (см. с. 46-47). Для каждого глагола из корпуса было случайным образом выбрано по 150 контекстов, которые затем были вручную классифицированы по значениям на основе дефиниций.
Анализ размеченных по значениям контекстов позволил выявить модели управления 67 выбранных пар «глагол — значение» (\¥М) и составить для них рамки валентностей. Такое описание предполагало проведение нескольких этапов: составление списка регулярно заполняемых валентных позиций, их типизацию на основании статистических параметров (ранжирование по обязательности / факультативности), снабжение семантической квалификацией и морфологической характеристикой.
Помимо очевидной валентности субъекта, а для каузативных глаголов — также и объекта, важнейшей валентностью для ЛСГ глаголов положения в пространстве является валентность обстоятельства места (реализуемая в трех вариантах: слова и выражения, отвечающие в контекстах на вопрос «где», «куда» или «откуда»). С морфологической точки зрения заполнителями данной валентности могут выступать различные предложно-падежные группы, а также наречия (подробнее см. Гл. 2, п.З).
Список сем, полученных в результате анализа общей семантической структуры ЛСГ глаголов положения в пространстве, позволил описать в общем виде семантику практически всех ^М данной группы. В составе исследуемой ЛСГ выделяются 3 основные группы («Положение», «Место» и «Перемещение») и 2 дополнительные («Положение + место» и «Положение + перемещение»), причем количество подгрупп внутри этих групп разнилось от 1 до 12. Для каждой из трех основных групп было построено отдельное семантическое дерево. Первый уровень (корень) получившихся деревьев не получил выражения в виде конкретной лексемы; на втором и третьем уровне располагались ядерные лексемы группы, а их гипонимами были \УМ, семантика которых была осложнена различными тропонимическими сдвигами. Средняя глубина получившихся деревьев составляла 3 уровня, максимальная достигала 56 уровней (подробнее см. Гл. 2, пп. АЛ-А2).
Связь между семами, выделенными для ЛСГ глаголов положения в пространстве, а также между способами усложнения ядерной семантики группы (фазовой и каузативной подгруппами) была представлена в виде модели, демонстрирующей модификацию исходного значения («находиться в определенном пространственном положении»). Оно реализовано в подгруппе статических глаголов и включает в себя две модификации, соответствующие семам «Положение» и «Место». Для фазовых глаголов это значение формулировалось как «перейти в указанное состояние», для каузативных — «каузировать переход объекта в указанное состояние», для глаголов перемещения — «осуществлять движение, результатом которого будет указанное состояние». Для многих каузативных глаголов адекватное семантическое представление характеризуется не немедленным переходом в статическое состояние, а наличием промежуточного состояния движения.
Для значений стоять7, стоять8, сидеть 1, лежать лежать2 было проведено дополнительное исследование, предметом которого была возможность экспликации сем в конкретных контекстах. В результате было замечено, что сема «Место» получается эксплицитное выражение значительно чаще, чем сема «Положение», преимущественно в форме заполнения валентности обстоятельства места. Однако в ряде примеров указание на положение реализуется через употребление глагола без зависимых элементов:
Список глаголов мышления для контекстного анализа составили 22 глагола (см. с. 75). На материале корпуса «Бокренок 3» для данных глаголов были сформированы выборочные совокупности контекстов (по 150 контекстов на глагол либо все контексты, найденные в корпусе, если их число не доходило до 150). Была проведена ручная классификация контекстов, в основу которой легли дефиниции, предлагаемые MAC; в результате было сформировано 48 пар «глагол—значение» (WM) (подробнее см. Гл. 3, п. 1).
Для полученных WM было составлено описание рамок валентностей, включившее в себя подробную морфологическую характеристику (перечень всех зависимых от глагола элементов для каждого контекста.) В полученный в итоге список неокказиональных валентностей вошли такие элементы, как семантические субъект и объект, обстоятельство образа действия, обстоятельство времени, предложно-падежные группы, придаточное предложение. Для представления общей семантической структуры ЛСГ глаголов мышления был сформирован список сем: «Мышление», «Мнение», «Намерение», «Поведение», «Качество». Для представительного типа «Мышление» было построено семантическое дерево, максимальная глубина которого составила 3 уровня (подробнее см. Гл. 3, п. 2-4).
Автомагическая классификация контекстов на основе сходства их дистрибуций подразумевает обращение к кластерному анализу — процедуре организации объектов по группам на основе сходства. Используемая в настоящем исследовании древовидная классификация представляет собой разновидность кластерного анализа, при которой отдельные объекты в несколько этапов объединяются в кластеры с постепенным понижением порога сходства между объектами и финальным объединением их в единый кластер (подробнее см. Гл. 4, п. 1.4). В качестве классифицируемых объектов выступают глагольные значения, а мера сходства определяется из сравнения дистрибуций грамматических тегов в непосредственном контекстном окружении глаголов — в окне анализа, за которое в данном исследовании принимаются 3 слова влево и 5 справа от глагола. Дистрибуции глагольных значений получены при помощи выборки из грамматически размеченного корпуса текстов.
Минимальный объем выборки на каждое глагольное значение для проведения автоматического дистрибутивного анализа составляет 10 контекстов, а для получения более надежных результатов рекомендуется использовать выборку в 25 контекстов. Малая частотность глаголов мышления и, как следствие, недостаточный объем выборочных совокупностей при отборе контекстов для формирования морфосинтаксических дистрибуций не позволяет провести для этой ЛСГ автоматическую классификацию, результаты которой были бы надежны и достоверны. В ЛСГ глаголов положения в пространстве минимальный объем выборки был обеспечен для 37 глагольных значений, надежный — лишь для 17 значений (см. с. 117—118). Именно эти две совокупности послужили материалом для ряда экспериментов по проведению автоматического кластерного анализа.
В ходе первого эксперимента были взяты 17 значений, для каждого из которых имелось не менее чем 25 контекстов в размеченном корпусе. Сопоставление системы получившихся кластеров с семантической структурой группы позволяет сделать промежуточный вывод о том, что способы представления действия (статичность / фазовость / каузативность), способны влиять на образование кластеров (хотя это влияние и не настолько велико, чтобы полностью детерминировать процедуру кластерного анализа). Напротив, семы, выделенные в ходе анализа семантической структуры ЛСГ глаголов положения в пространстве, не получают явного отражения в локальном контексте (см. Гл. 4, п. 2.2).
На втором этапе эксперимента первоначальная совокупность была расширена до 37 глагольных значений (удовлетворявших минимальному статистическому критерию). Основные кластеры, выделенные в ходе первого эксперимента, наблюдаются и в данном случае. При этом 11 значений из 37 не присоединяются ни к одному кластеру вплоть до самого последнего (шестого) этапа. Из них лишь одно входило в выборку в ходе первого эксперимента. Таким образом, результаты кластерного анализа для 37 значений позволяют заключить, что частотные значения, дистрибуция которых образована из большего количества контекстов, чаще объединяются в кластеры с другими значениями, чем менее частотные, дистрибуция которых в большей степени подвержена влиянию случайных факторов, таких, как необычный, нетипичный контекст ит. п. (см. Гл. 4, п. 2.3).
На третьем этапе эксперимента анализ шел в обратном направлении: вместо присоединения дополнительных глаголов ядерная подгруппа, наоборот, подвергалась сокращению. Результаты экспериментов, направленных на сокращение ядерной совокупности, подтверждают вывод, сделанный на первом этапе (кластерный анализ для 17 ядерных \УМ): одним из факторов, влишощих на формирование кластеров, является способ представления действия (статичность / фазовость / каузативность). Напротив, семы «Место», «Положение», «Перемещение» не получают регулярного выражения в локальном контексте и, соответственно, не могут влиять на формирование кластеров. Данный вывод подтверждается результатами кластерного анализа для группы с общим значением, выражаемым семой «Место», а также для группы значений статичных глаголов. В первом случае получившаяся структура кластеров достаточно сложна, во втором же, напротив, не выделяется ни одного промежуточного кластера, объединение происходит в 1 этап. Тем не менее, результаты кластеризации для группы значений фазовых глаголов показывают, что способ представления действия не является единственным фактором, детерминирующим состав и структуру кластеров.
Результаты кластерного анализа групп значений, образованных по принципу противопоставления способов выражения действия (фазовые + каузативные \¥М, статичные + каузативные, статичные + фазовые) позволяют сделать вывод, что наиболее ярко противопоставляются друг другу статичные и каузативные \УМ. Взаимоотношение статичных \УМ с фазовыми носит наиболее сложный характер (см. Гл. 4, п. 2.4).
Данные, полученные в ходе исследования в результате анализа выборочных совокупностей ЛСГ глаголов положения в пространстве и глаголов мышления, могут быть встроены в структуру семантических словарей типа \\^ог(Ше1:, в частности, в тезаурус при его расширении. Кроме того, сама методология построения тезауруса может быть уточнена с учетом разработанной и опробованной в настоящем исследовании методики. Полученные данные о контекстном окружении глаголов положения в пространстве и глаголов мышления найдут свое применение не только в прикладных исследованиях лексики русского языка, но и в общей теории русского глагола
Список литературы диссертационного исследования кандидат экономических наук Девочкина, Юлия Эдуардовна, 2011 год
1. Адмони В.Г. Полевая природа частей речи (на материале числительных) // Вопросы теории частей речи (на материале языков различных типов). J1.: Наука, 1968. С. 98-107.
2. Адмони В.Г. Содержательные и композиционные аспекты предложения // Теоретические проблемы синтаксиса современных индоевропейских языков. Л.: Наука, 1975. С. 5-12.
3. Адмони В.Г. Теоретическая грамматика немецкого языка: Строй современного немецкого языка (Der deutsche Sprachbau). M: Просвещение, 1986. 333 с.
4. Адмони В.Г. Грамматический' строй как система построения и общая теория грамматики. Л.: Наука, Ленинградское отделение, 1988. 240 с.
5. Адмони В.Г. Основы теории грамматики. M.: URSS, 2004. 104 с.
6. Азарова И:В. Сетевое представление лингвистических данных // Прикладное языкознание / Отв. ред. A.C. Герд. СПб.: Издательство Санкт-Петербургского университета, 1996. С. 234-244.ч
7. Алексеев A.A., Кузнецова Е.Л. ЭВМ и проблемы текстологии древнесла-вянских текстов // Лингвистические задачи и обработка данных на ЭВМ. М. : ИРЯ АН СССР, 1987. С. 111-120.
8. Апресян Ю.Д. Избранные труды. Т. 1. Лексическая семантика: Синонимические средства языка. М., Наука, 1974. 367 с.
9. Арапов М.В. Квантитативная лингвистика. М.: Наука, 1988. 184 с.
10. Ахапкина Я.Э., Болдырев H.H., Бондарко A.B. и др. Проблемы функциональной грамматики: Семантическая, инвариантность / вариантность. СПб., Наука, 2003. 398 с.
11. Ахманова О.С. Словарь лингвистических терминов. М.: Советская энциклопедия, 1969. 608 с.
12. Богданова Л.И. Зависимость формы актантов от семантических свойств русских глаголов. М.: Диалог-МГУ, 1998. С. 244-246.
13. Богуславский И.М. Исследования по синтаксической семантике. М.: Наука, 1985. 175 с.
14. Богуславский И.М. Сфера действия лексических единиц. М.: Школа «Языки русской культуры», 1996. 460 с.
15. Большой толковый словарь русских глаголов: Идеографическое описание. Английские эквиваленты. Синонимы. Антонимы / Под ред. проф. Л.Г. Бабен-ко. М: АСТ-ПРЕСС КНИГА, 2009. 576 с.
16. Бондарко A.B. Проблемы грамматической семантики и русской аспекто-логии. СПб.: Издательство СПбГУ, 1996. 220 с. 1
17. Бондарко A.B. Принципы функциональной грамматики, и вопросы, аспек-тологии. 3-е издание, стереотипное. М.: УРСС, 2003. 207 с.
18. Бондарко A.B., Беляева Е.И, Бирюлин Л.А. и др. Теория функциональной грамматики: Темпоральность. Модальность. Л., «Наука», Ленингр. отделение. 1990. 263 с.
19. Васильев Л.М. Семантика русского глагола^ М.: Высшая школа, 1981. 184 с.
20. Васильева Н.В, Виноградов В.А., Шахнарович A.M. Краткий словарь, лингвистических терминов. М.: Русский язык, 1995. 175 с.
21. Гак В.Г. Языковые преобразования. М.: Школа Языки, русской культуры, 1998. 768 с.
22. Гринбаум О.Н. Компьютерные аспекты стилеметрии // Прикладное языкознание / Отв. ред. A.C. Герд. СПб.: Издательство Санкт-Петербургского университета; 1996. С. 451-465.
23. Гухман М.М. Грамматическая категория и структура парадигм // Исследования по общей теории грамматики. М: Наука, 1968. С. 117—174.
24. Гухман М:М. Единицы анализа словоизменительной системы и понятие поля // Фонетика, фонология, грамматика. М., 1971. С. 163-170.
25. Касевич В.Б. Семантика. Синтаксис. Морфология. М.: Главная редакция восточной литературы издательства «Наука», 1988. 309 с.
26. Кацнельсон С.Д. Содержание слова, значение и обозначение. M.: URSS, 2004. 112 с.
27. Кластерный анализ сайт. URL:http://www.statsoft.ru/home/textbook/modules/stcluan.html. (дата обращения: 24.11.2011).
28. Костышин A.C. Об одном методе структурного анализа текстов // Квантитативная лингвистика и семантика (КВАЛИСЕМ-99). Новосибирск: НГПУ, 1999. С. 41—45.
29. Кузнецова Э.В. Язык в свете системного подхода: Учебное пособие. Свердловск: Издательство УрГУ, 1983. 95 с.
30. Кусова M.JI. Антонимы в составе лексико-семантических групп русских глаголов // Русская глагольная лексика: пересекаемость парадигм. Екатеринбург: Изд-во Уральского университетата, 1997. С. 100-146.
31. Ленерт В., Дайер М.Г., Джонсон П.Н., Янг К.Дж., Харли С. BORIS — экспериментальная система глубинного понимания^ повествовательных текстов // Новое в зарубежной лингвистике. Вып. 24. Компьютерная лингвистика. М., 1989. 432 с.
32. Лингвистический энциклопедический словарь. М.: Советская энциклопедия, 1990. 685 с.
33. Марина A.C. Автоматизированная классификация контекстов при подготовке данных для компьютерного тезауруса RussNet. СПб., 2005 (магистерская диссертация: хранится на кафедре математической лингвистики СПбГУ). 232 с.
34. Мартыненко Г.Я. Методы статистического моделирования в языкознании // Прикладное языкознание / Отв. ред. A.C. Герд. СПб.: Издательство Санкт-Петербургского университета, 1996. С. 201-223.
35. Мартыненко Г.Я. Сложность синтаксических структур и стилистическая диагностика // Прикладное языкознание / Отв. ред. A.C. Герд. СПб.: Издательство Санкт-Петербургского университета, 1996. С. 435-450.
36. Мартыненко Г.Я., Чебанов C.B. Стилеметрия // Прикладное языкознание / Отв. ред. A.C. Герд. СПб.: Издательство Санкт-Петербургского университета, 1996. С. 420-434.
37. Марусенко М.А. Атрибуция анонимных и псевдонимных текстов методами прикладной лингвистики // Прикладное языкознание / Отв. ред. A.C. Герд. СПб.: Издательство Санкт-Петербургского университета, 1996. С. 466-479.
38. Материалы к компьютерному тезаурусу лексики русского языка / Сост. И.В. Азарова, О.А.Митрофанова. СПб.: Издательство Санкт-Петербургского государственного университета, 2002. 232 с.
39. Мельчук И.А. Курс общей морфологии. Том 2. М. — Вена: Языки русской культуры, Венский славистический-альманах, 1998. 544 с.
40. Мельчук И. А. Опыт теории лингвистических моделей «Смысл О Текст». М.: Школа «Языки русской культуры», 1999. 346 с.
41. Митрофанова O.A. Структурный анализ сигнификативного значения (На материале глаголов процесса мышления английского и русского языков). Дисс. на соиск. уч. степ. к. ф. н.: 10.02.21. СПб., 1999. 221 с.
42. Панкина,М.Ф. Формирование семантических структур в лексической системе языка: на материале русского и немецкого лексико-семантических полей «кинетическое состояние агенса». Воронеж: Издательство Воронежского государственного университета, 2002! 182 с.
43. Панкина М.Ф. Типы семантической сочетаемости глаголов самостоятельного перемещения в русском и немецком языках. М.: Компания Спутник +, 2007. 124 с.
44. Плоткин В.Я. Динамика английской фонологической системы. Новосибирск : Лира, 1960. 212 с.
45. Ревзина О.Г. Структура словообразовательных полей в славянских языках. М.: Издательство МГУ, 1969. 156 с.
46. Русская глагольная лексика: пересекаемость парадигм: Памяти Эры Васильевны Кузнецовой / Под ред. Л.Г. Бабенко. Екатеринбург, 1997. 520 с.
47. Сентенберг И.В. Лексическая семантика английского глагола. Учебное пособие к спецкурсу. М.: Издательство МГПИ им. В.И. Ленина, 1984. 96 с.
48. Словарь иностранных слов. М.: Русский язык, 1989. 624 с.
49. Теньер Л. Основы структурного синтаксиса / Вступ, ст. и общ. ред. В.Г. Гака. М.: Прогресс, 1988. 656 с.
50. Тестелец Я.Г. Введение в общий синтаксис. М.: Российский государственный университет, 2001. 800 с.
51. Турыгина Л.А. Моделирование языковых структур средствами вычислительной техники. М.: Высшая школа, 1988. 176 с.
52. ФиличеваН.И. Структура словосочетания и синтаксическое поле // Филология: Вестник МГУ. 1971. Вып. 3. С. 40-56.
53. Шайкевич А.Я. Дистрибутивно-статистический анализ. Автореф. дисс. на соиск. уч. степ. д. ф. н. JL, 1982. 35 с.
54. Шмелев Д.Н. Проблемы семантического' анализа лексики. (На материале русского языка). М.: Наука, 1973. 280 с.
55. Штерн A.C. Статистическая обработка экспериментальных данных // Прикладное языкознание / Отв. ред. A.C. Герд. СПб.: Издательство Санкт-Петербургского университета, 1996. С. 224-233.
56. ХЦур Г.С. Теории поля в лингвистике. M.:URSS, 2008. 264 с.
57. Allen J. Natural Language Understanding. California: The Benjamin Publishing Company, 1987. 574 p.
58. Azarova I. RussNet as a Computer L'exicon for Russian // Intelligent Information Systems 2008. 447-456.
59. Bech G. Studien über das deutsch verbum infinitum, Bd. 1. Kobenhavn, 1955. 222 S.
60. Boost K. Neue Untersuchungen zum Welt und zur Struktur des deutschen Satzes. Des Satz als Spannungsfeld. 5. Nachdruck. Berlin: Akademie-Verlag, 1964.88 S.
61. Brinkmann H. Die deutsche Sprache (Gestalt und Leistung). Düsseldorf, 1962. 654 S. '
62. Coseriu-E. Structure lexicale et enseignement du vocabulaire // Faculté des lettres et des sciences humaines de l'Université de Nancy, 1966. 175-217.
63. Duchäcek O. Le champ conceptuel de la beauté en français moderne. Praha, 1960.
64. Geckeler H. Strukturelle Semantik und Wortfeldtheorie. München: Fink, 1971.
65. Guilbert L. Le Vocabulaire de l'astronautique: Enquête linguistique à travers la presse d'information à l'occasion de cinq exploits de cosmonautes // Publications de l'Université de Rouen, s. d. (1967).
66. HarrisZ. Structural Linguistics. Chicago, 1961.
67. Harris Z. String Analysis of Language Structure. Mouton and Co, The Hague, 1964.
68. Harris Z. Mathematical Structures of Language. New York: Interscience Publishers, 1968.
69. Helbig G. Geschichte der neueren Sprachwissenschaft: unter dem besonderen Aspekt der Grammatik. Leipzig: Bibliographisches Institut, 1986. 392 S.
70. Homberger D. Sachwörterbuch zur Sprachwissenschaft. Stuttgart: Philipp Reclam jun., 2000.
71. Jolies A. Antike Bedeutungsfelder' // Beiträge zur Geschichte der deutschen Sprache und Literatur, Halle (Saale), 1934. 97-109.
72. Leacock C, Chodorow M. Combining Local Context and WordNet Similarity for Word Sense Identification // WordNet: Ant Electronic Database. 1998. 265283.
73. Matoré G. Le vocabulaire et la Société sous Louis-Philippe. Genève: Éd. Droz; Lille: Éd. Giard, 1953.87.0sthoff H. Vom Suppletivwesen der indogermanischen Sprache. Heidelberg, 1900.
74. Porzig W. Wesenhafte Bedeutungsbeziehungen // Beiträge zur Geschichte der deutsche Sprache und Literatur, Bd. 58, 1934. 70-97.
75. Reuning K. Joy and Freude. A Comparative Study of the Linguistic Field of Pleasurable Emotions in English and German. Swarthmore, 1941.
76. Rudskoger A. Fair, Foul, Nice, Proper. A Contribution to the Study of Polysemy. Stockholm: Almqvist & Wiksell., 1952.
77. Schulz D., Griesbach H. Grammatik der deutschen Sprache. München, 1970.
78. Swadesh M. The Phonemic Principles // Language, 1934, Vol. 10. 117-129.
79. Trier J. Sprachliche Felder // Zeitschrift für deutsche Bildung, Bd. 8, Hf. 9, 1932. 417-427.
80. Trier J. Das sprachliche Feld. Eine Auseinandersetzung // Neue Jahrbücher für Wissenschaft und Jugendbildung, Bd 10, Leipzig-Berlin, 1934. 428-449.
81. Trier J. Altes und Neues vom sprachlichen Feld // Duden-Beiträge zu Fragen der Rechtschreibung, der Grammatik und des Stils, Hf 34, Mannheim-Zürich, 1968. 41-54.
82. Ulrich W. Wörterbuch. Linguistische Grundbegriffe. Berlin, Stuttgart: Gebr.-Bornträger (5., völlig neu bearb. Aufl.), 2002.
83. Weisgerber L. Vom Weltbild der deutschen Sprache. 2 Halbende. Düsseldorf: Schwann, 1953/54.
84. Weisgerber L. Grundzüge der inhaltbezogenen Grammatik. Düsseldorf: Schwann, 1962.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.