Конструкции глагола как маркер литературных формул тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Буйлова Надежда Николаевна

  • Буйлова Надежда Николаевна
  • кандидат науккандидат наук
  • 2023, ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 110
Буйлова Надежда Николаевна. Конструкции глагола как маркер литературных формул: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики». 2023. 110 с.

Оглавление диссертации кандидат наук Буйлова Надежда Николаевна

Оглавление

Введение

Глава 1. Обзор подходов к задаче

1.1. Конструкционные свойства лексики как исследовательская задача

1.1.1. Теория зависимостей Л. Теньера

1.1.2. Модель «Смысл-Текст» А.И. Мельчука

1.1.3. Конструкции в микросинтаксисе

1.1.4. Грамматика конструкций: теория Ч. Филлмора и А. Голдберг

1.1.5. Интегральное описание лексики и конструкций Ю.Д. Апресяна

1.1.6. Соотношение семантики и синтаксиса глаголов и глагольных конструкций: школа Е.В. Падучевой

1.1.7. Глаголы и глагольные конструкции в коммуникативной грамматике

Г.А. Золотовой и других школах функционального синтаксиса

1.2. Лингвистические исследования формульной литературы 21 1.2.1. Дж.Г. Кавелти и исследование массовой литературы

1.3. Определения типа текста как прикладная задача компьютерной лингвистики 26 Глава 2. Данные: корпус детективов, любовных романов, фантастики и фэнтези

2.1. Критерии отбора текстов и доразметка признака микрожанра

2.2. Предобработка корпусных данных

2.3. Общие характеристики подкорпусов 35 Глава 3. Метод

3.1. Общая структура исследования

3.2. Выделение признаков для машинного обучения

3.2.1. Список синтаксических отношений, принятых в Universal Dependencies

3.2.2. Глагольные конструкции, используемые в качестве признаков машинного обучения

3.2.3. Конструкция заданного порога 46 Глава 4. Эксперименты 49 Глава 5. Анализ

5.1. Гипотезы качественного анализа

5.2. Схема анализа маркерных конструкций

5.3. Маркеры одной литературной формулы

5.3.1. Маркерные конструкции любовных романов

5.3.2. Маркерные конструкции детективов

5.3.3. Маркерные конструкции научной фантастики

5.3.4. Маркерные конструкции фэнтези

5.4. Маркеры двух микрожанров

5.4.1. Любовные романы и детективы

5.4.2. Любовные романы и научная фантастика

5.4.3. Любовные романы и фэнтези

5.4.4. Детективы и научная фантастика

5.4.5. Научная фантастика и фэнтези

5.5. Маркеры трех микрожанров 90 5.5.1. Любовные романы, научная фантастика и фэнтези

5.6. Особенности реализации валентностей в конструкциях-маркерах

5.6.1. Бессубъектные конструкции

5.6.2. Собственно безобъектные конструкции

5.6.3. Конструкции непереходных глаголов, где прямое дополнение невозможно

5.6.4. Конкуренция за валентности как объяснение опущению актантов

5.6.5. Конструкции с дополнительными участниками 96 Заключение 98 Публикации 102 Библиография

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Конструкции глагола как маркер литературных формул»

Введение

В диссертационной работе рассматриваются глагольные конструкции, присущие определенным типам (микрожанрам) формульной литературы (любовному роману, детективу, научной фантастике и фэнтези). С помощью методов автоматической классификации текстов и выделения значимых признаков выявляются характерные для этих микрожанров конструкции. Полученные конструкции анализируются количественно и качественно. Доказывается, что высокоуровневые синтаксические признаки текста могут служить признаками для машинного классификатора.

Диссертация выполнена в рамках теоретической парадигмы Грамматики конструкций. В рамках направления исследования глагольных конструкций значимы работы Л. Теньера, Ч. Филлмора, А. Голдберг, Л. Талми, Х. Боаса и др. На материале русского языка исследования семантико-синтаксических свойств глагола в функциональной и когнитивной традиции проводились Ю. Д. Апресяном, И. А. Мельчуком, Л. Л. Иомдиным, И. М. Богуславский, В.С. Храковским, Е. В. Падучевой, Г. И. Кустовой, Е. В. Рахилиной, Ю. Л. Кузнецовой и др. В части проблематики определения литературной формулы данная диссертация опирается как на работы литературоведов и культурологов (Дж. Кавелти, А.-М. Бойе, С. Бордони, Т.Г. Скребцовой, Н.М. Марусенко и др.). Количественные методы, используемые в диссертации, опираются на работы по определению жанра текста, выполненные в компьютерно-лингвистической традиции (Б. Кеслер, Ю. Карлгрен, Д. Каттинг, Х. Шутце, Ф. Себастиани и др.) и на корпусные количественные исследования (Дж. Бибер, А. Стефанович, Ш. Грис и др.).

Научная фантастика, детективы, любовные романы и фэнтези - представители формульной литературы, которые могут служить материалом для разработки метода автоматического определения микрожанра. В рамках исследования создан корпус произведений современной массовой литературы, который может быть использован как набор данных для проведения экспериментов по определению микрожанра текста. Заметим, что в современной компьютерной лингвистике чаще всего предлагаются модели классификации, основанные на длине слова, распределениях частей речи, и т. п. низкоуровневых признаках. Эти модели слабо связаны с высокоуровневыми параметрами текста, такими, как строение предложения или словосочетания; рассмотрение глагольной конструкции в таком аспекте представляется нам важным шагом.

Работа основана на материале лексически, морфологически и синтаксически размеченного корпуса. Цель данной работы - выявление специфики употребления конструкций в микрожанрах литературы.

Для достижения цели работы необходимо было решить следующие задачи:

— охарактеризовать исследуемые микрожанры, определить их специфику,

— сформулировать принципы отбора текстов для проведения экспериментов,

— адаптировать основные понятия грамматики конструкций к задаче определения микрожанра с использованием синтаксической информации,

— определить границы вариативности глагольных конструкций в близкородственных микрожанрах,

— выделить группы глаголов, вносящих наибольший вклад в различение микрожанров,

— проанализировать эти глаголы и их конструкционные свойства.

В центре внимания исследования находятся характерные синтаксические особенности современной массовой литературы. Эти специфические характеристики не рассматривались в комплексе в исследованиях синтаксического поведения глагола при помощи метода выделения значимых признаков машинного обучения, что обуславливает - вкупе с их потенциальной значимостью для уточнения признаков микрожанра - актуальность настоящей работы.

На защиту выносятся следующие положения:

1. Жанроспецифичные глагольные конструкции (конструкции-маркеры) -это конструкции глагола с его синтаксическими зависимыми, употребление которых в одном из микрожанров значимо преобладает относительно их употребления в других микрожанрах.

2. Задача автоматического определения микрожанра текста может решаться не только за счет низкоуровневых лингвистических признаков (длина слова, предложения и т.д.), но и на уровне лексики и лексических конструкций.

3. Частотное распределение конструкций отдельного глагола в корпусе неравномерно: в среднем две-три самые частотные конструкции покрывают 50% употреблений глагола.

4. Метрики значимости и важности признаков, используемых в алгоритмах автоматической классификации, могут быть использованы для выявления жанроспецифичных глагольных конструкций.

5. Выделяется несколько групп глагольных конструкций (полные VS неполные, аргументные VS c семантически необязательными модификаторами, конструкции отдельных тематических групп глаголов), вариативность которых маркирует микрожанр.

6. Анализ различий в употреблении глагольных конструкций в разных микрожанрах позволяет связать их с жанровыми признаками более высокого уровня (тема, тренд, авторские ограничения на лексику).

Интерпретация языковых данных осуществляется с применением различных лингвистических методических приемов и процедур, в частности, автором работы создан алгоритм, позволяющий выделить глагольные конструкции из художественной литературы, составлены списки жанроспецифичных глаголов, проведены эксперименты по машинному обучению классификатора.

Теоретическая значимость исследования заключается в рассмотрении синтаксической конструкции как важного стилистического маркера. Разделение глаголов на категории по количеству заполненных валентностей, рангу конструкций заданного порога, а также выделение кластеров, характерных для каждого жанра, может задать вектор развития стилометрических исследований литературных формул1.

Практическая значимость работы заключается в разработке алгоритма, позволяющего улучшить метаразметку корпусов русского языка. Сейчас большая часть корпусов имеет множество слоев разметки (морфологическую, синтаксическую, семантическую), однако задача определения метатегов, связанных с такими данными, как локация или время создания текста, большей частью ложится на плечи не программистов или лингвистов, а литературоведов и историков. Несмотря на достаточную логичность подобного положения дел, некоторые метатеги вполне могут быть проставлены автоматически - к примеру, жанр текста, некоторые характеристики стихотворных текстов и пр. Разработанный в рамках данной диссертации алгоритм определения микрожанра текста может быть применен в разметке корпусов; особо примечательно, что алгоритм способен различать близкородственные жанры. Предполагается, что этот подход может быть использован для определения не только микрожанра, но и других характеристик текста, к примеру, авторства и времени написания.

1 Литературная формула - структура повествовательных или драматургических конвенций, использованных в очень большом числе произведений, общие сюжетные схемы, не привязанные к конкретной культуре и определенному периоду времени.

Научная новизна работы заключается в том, что конструкционный потенциал лексики до нашего исследования не рассматривался как потенциально значимый для определения микрожанра текста. Большая часть работ подобного рода строятся на более низкоуровневых маркерах, таких как частеречные характеристики текста, распределение служебных слов или буквенные биграммы.

Апробация работы. Основные результаты работы были представлены на конференциях «Колмогоровские чтения» (Москва, 2017), ARANEA (Братислава, 2018), на научном семинаре Школы лингвистики НИУ ВШЭ 2020 (Москва, 2020), конференции ИТиС (Огниково, 2022), опубликованы в журналах «Научно-техническая информация. Серия 2: Информационные процессы и системы», «CLLS'18 CEUR Workshop Proceedings», «Вестнике Православного Свято-Тихоновского гуманитарного университета. Серия 3: Филология» и «Вестнике Новосибирского государственного университета».

Структура работы. Работа состоит из пяти глав. В первой главе излагаются теоретические основания использования глагольных конструкций как признака для машинного классификатора. В частности, в разделе 1.1 рассматриваются теоретические основы грамматики конструкций, в разделе 1.2. описываются подходы к определению литературной формулы. Во второй главе описаны используемые данные и ресурсы. Корпусы, используемые в исследовании, рассмотрены в разделе 2.1; операции по предобработке данных - в разделе 2.2; общие характеристики корпусов -в разделе 2.3. В третьей главе рассматривается метод обработки данных, его возможности и ограничения. В разделе 3.1 описывается общая структура исследования. Описание обработки данных для машинного обучения рассматривается в разделе 3.2. Раздел 3.3 посвящен описанию конструкций, выбранных нами в качестве признаков машинного обучения, а также описанию определения конструкции заданного порога. В четвертой главе описываются проведенные эксперименты - машинное обучение с применением низкоуровневых и высокоуровневых признаков. В пятой главе представлен анализ полученных лингвистических данных. В заключении подводятся итоги исследования.

Глава 1. Обзор подходов к задаче

В данной работе изучение синтаксических свойств глагола строится на статистических корпусных данных с привлечением многоуровневой лингвистической разметки. Традиционно материалом изучения является нормативный язык, язык «большой литературы», а детская, массовая литература, нон-фикшн остаются в ее тени. В нашем исследовании мы обратились к так называемой «формульной литературе» и поставили задачу выяснить при помощи количественных методов, каким образом поверхностный синтаксис подобных произведений может обуславливать их «формульность». Таким образом, обзор литературы включает в себя три раздела, которые затрагивают ключевые объекты диссертации: в Разделе 1.1 описаны статьи и монографии, посвященные конструкционной грамматике, в Разделе 1.2 приведен краткий обзор современных взглядов на литературные формулы и сопоставимые феномены.

1.1. Конструкционные свойства лексики как исследовательская задача

Одной из важных задач современного синтаксиса является определение правил, регулирующих поведение десятков и тысяч лексико-семантических единиц, а также объяснение исключительных проявлений лексического многообразия. Наиболее ярким проявлением статистического подхода к языку являются формальные модели, представляющие собой максимально обобщенные подходы к языковой системе.

Обратимся к наиболее значимым для работы терминам. Основа нашего терминологического аппарата для описания конструкций - «Введение в общий синтаксис» Я.Г. Тестельца [Тестелец, 2001]. Словоформы, вступающие в синтаксические отношения, мы будем называть узлами, а отношения между ними -связями. Если между словоформами налицо отношение зависи-мости X -> Y, то будем говорить, что X подчиняет Y, или, что то же, Y зависит от X. Есть и термины-существительные, обозначающие словоформы, которые вступают в синтаксическое отношение: X называется вершиной (или хозяином, или ядром, или главным словом) по отношению к Y, а Y -зависимым (или слугой, или зависимым словом) по отношению к X. При этом мы следуем номенклатуре Ю.Д. Апресяна, В.А. Плунгяна и Е.В. Рахилиной, используя понятия «актанты» и «сирконстанты», под актантами

понимая обязательные (синтаксические и семантические) валентности, без заполнения которых предложение становится некорректным; под сирконстантами -дополнительные элементы конструкции (заполняющие синтаксическую, но не семантическую валентность) [Апресян, 1976].

1.1.1. Теория зависимостей Л. Теньера

В лингвистике ХХ века существуют две важнейшие теории синтаксиса: синтаксис составляющих, лежащий в основе генеративной грамматики Н. Хомского [Chomsky, 1985], и синтаксис зависимостей. Мы изучаем синтаксис индоевропейского (русского) языка, используя вербоцентричную теорию зависимостей, разработанную Л. Теньером и опубликованную в книге «Основы структурного синтаксиса» [Теньер, 1988]. Основными положениями этой теории являются следующие утверждения:

- Между элементами предложения существуют бинарные направленные отношения с предикатом в качестве единственной вершины графической «стеммы»2-графа («дерева зависимостей» в более поздней терминологии). Связь между элементами может быть как вертикальной (предикат подчиняет себе актант), так и горизонтальной (приложения, однородные члены). Слово с зависимыми элементами составляет ядро (узел). В зависимости от принадлежности вершины различают узлы глагольные, субстантивные, адъективные и адвербиальные.

- Актанты и сирконстанты в предложении противопоставлены. Теньер первым ввел понятие глагольной валентности и классифицировал глаголы по количеству актантов, которые они могут присоединять, а также описал средства изменения валентной структуры (залог, возвратная форма, каузативная конструкция, лексические глагольные тары типа «идти» - «посылать»). В «Основах» еще нет четкого терминологического аппарата, связанного с называнием валентностей: Теньер дает им семантическое определение (отображение функции данной субстанции в структуре ситуации, изображаемой в предложении), но при описании примеров он придает актантам и сирконстантам формальные признаки, например, произвольно интерпретирует падеж существительного при определении. Так, существительное с предлогом а он считает актантом, а с предлогом de — сирконстантом, поскольку второе соответствует латинскому аблативу. В дальнейшем этот вопрос был разработан А.-Ж. Гремасом [Greimas, 1983], который разделил синтаксические и семантические

2 Совокупность линий, изображающих синтаксические связи.

актанты. Теория актантов Теньера стала одним из источников для работ Ч. Филлмора, А. Голдберг и т.д. [Fillmore, 1976].

1.1.2. Модель «Смысл-Текст» А.И. Мельчука

Теория Теньера оказалась базой для разработки грамматики зависимостей, теории валентностей, семантики синтаксиса [Hutchins, 1986; Канцельсон, 1972]. Как уже говорилось выше, идеи «Основ» стали толчком к развитию не только теоретических, но и практических разработок в лингвистике; так, модель «Смысл-Текст», на которой основан один из первых в СССР машинных переводчиков ЭТАП [Мельчук, 1974], была построена на теории Теньера с использованием не только синтаксиса зависимостей, но и намеченного противопоставления актантов и сирконстантов.

Модель «Смысл-Текст», разработанная в 1960-ых годах А. Мельчуком, представляет язык как многоуровневую систему переходов смысла в текст и обратно [Mel'cuk, 1974]. Важную роль в этом процессе играет синтаксис зависимостей. Синтаксис в модели состоит из двух уровней: глубинного и поверхностного. Глубинно-синтаксических отношений менее десятка, поверхностно-синтаксических в несколько раз больше; каждой глубинной связи может соответствовать несколько поверхностных реализаций. Особый интерес для нашего исследования представляет описание устройства предикатной группы (подробное рассмотрение моделей глагольного управления). Во многом синтаксис в модели «Смысл-Текст» (МСТ) выводится из структуры толкования, задающей модель управления лексемы и ее сочетаемостные свойства. Языковая модель по МСТ склонна представлять язык как совокупность словарных статей с различной лингвистической информацией. На основе этих данных был создан Толково-комбинаторный словарь русского языка [Мельчук, Жолковский, 1984], включающий в себя информацию о всех синтаксических и семантических актантах слова, а также о способах их морфологического и синтаксического выражения. Значительную роль в его создании играли введенные Мельчуком и Жолковским лексические функции (так называемая «нестандартная сочетаемость», идиоматические выражения), которые позволяли описывать периферийные конструкции и были одной из первых попыток описать микросинтаксические отношения.

Модель МСТ стала серьезным достижением отечественной лингвистической науки второй половины ХХ века. Сегодня ряд крупных проектов (например,

Национальный корпус русского языка) использует элементы МСТ в отдельных своих модулях (синтаксическая разметка корпуса осуществляется при помощи лингвистического процессора ЭТАП-3, основанного на разработках Мельчука).

Хотя МСТ разрабатывалась как практическая теория, она гораздо сильнее повлияла на теоретические аспекты лингвистики, нежели на принципы машинного перевода. Так, Московская семантическая школа [Апресян, 2005], подход которой радикально изменил лексикографическую теорию и практику, во многом основывается на постулатах МСТ.

1.1.3. Конструкции в микросинтаксисе

Синтаксическая наука большую часть своей истории занималась изучением высокочастотных явлений, заметных в речи отдельного носителя или целой социальной группы. В работах B.C. Храковского [Храковский, 2012] противопоставляется вербоцентрический (лексико-семантический) и конструкционный подходы. «В основе лексико-семантического подхода лежит принцип композиционности, который понимается как установка на наличие общих правил семантического взаимодействия значений слов, граммем, линейно-акцентной структуры и других значимых единиц языка в составе конструкции, являющейся коммуникативной единицей. В основе конструкционного подхода лежит принцип, который можно назвать антикомпозиционным. Этот принцип исходит из того, что конструкция представляет собой исходную единицу, у которой есть такие общие свойства, которые не детерминируются составляющими ее элементами и которые не находят объяснения в рамках лексико-семантического подхода.» Автор приходит к выводу, что оба эти варианта имеют право на существование и дополняют друг друга -вербоцентрический скорее подходит для стандартных неидиоматизированных конструкций, в то время как грамматика конструкций лучше объясняет синтаксические идиомы, эффекты введения в состав конструкции некоторых частиц и сирконстантов, и в какой-то мере поясняет правила введения в конструкцию «глаголов-доноров».

Ю.Д.Апресян, И.М. Богуславский и Л.Л. Иомдин столкнулись с проблемами периферийных конструкций (синтаксических идиом, или конструкций малого синтаксиса, микросинтаксиса) во время разработки алгоритмов для проекта ЭТАП [Иомдин, 2010]. Особое развитие изучение малого синтаксиса получило с появлением корпусов - до этого собрать достаточно данных было затруднительно. По словам

http ://www. ruscorpora. ru/new/instruction-syntax. html

Л.Л. Иомдина, «конструкции микросинтаксиса неоднородны; можно выделить два больших класса. Во-первых, это состоящие из нескольких элементов лексические единицы, или синтаксические фраземы, полноценное толкование которых часто отсутствует в толковых словарях. Во-вторых, это слабо лексикализованные нестандартные синтаксические конструкции» [Маракасова, Иомдин, 2016].

Долгое время считалось, что в подобные конструкции могут входить любые сирконстанты, поскольку они никак не связаны с семантикой глагола. Однако выяснилось, что сирконстант связан с глаголом семантически, что означает, что он не может по смыслу противоречить никакой части конструкции [Богуславский, 1990; Филиппенко, 1998]. Впервые семантическая сочетаемость актанта и сирконстанта была рассмотрена в работе «Сирконстанты в толковании?» [Плунгян, Рахилина, 1990], в которой было показано, что определенные сирконстанты сочетаются с глаголами, описывающими конкретные ситуации (бежать, резать), и не сочетаются с ситуациями абстрактными (портить, мстить). Другие очевидные примеры: сирконстанты длительности (несколько часов, пару минут) не сочетаются с глаголами совершенного вида, некоторые сирконстанты требуют появления фигуры наблюдателя (Она играючи/с трудом управилась с этим заданием). Таким образом, сирконстанты опровергают предыдущее утверждение о том, что глагол является определяющим элементом конструкции, который способен управлять всеми остальными ее частями; по крайней мере, он способен придавать конструкции дополнительные смыслы, а в некоторых случаях даже занимать место предиката.

1.1.4. Грамматика конструкций: теория Ч. Филлмора и А. Голдберг

Другим логичным продолжением теории Теньера стала «грамматика конструкций» (CxG), созданная в 60-ых годах ХХ века Чарльзом Филлмором [Fillmore, 1968]. Это важное направление современной лингвистики противопоставляет себя генеративным и другим «формальным» синтаксическим теориям. Грамматика конструкций представляет собой сегодня конгломерат различных подходов и концепций. В качестве базовых принципов, разделяемых всеми направлениями CxG, можно назвать отрицание четкой границы между грамматикой и словарем, постулированной в структурализме, и отказ от статичного взгляда на язык ранней генеративной грамматики, согласно которому высказывания строятся из лексических единиц с фиксированными значениями, соединяемых по независимым от этих значений регулярным грамматическим правилам. В центре внимания CxG оказываются

динамические аспекты порождения высказывания. Элементы, из которых строится высказывание, чувствительны к своему окружению и при этом влияют на сам способ построения синтаксических групп. Иными словами, план содержания единиц лексикона зависит от синтаксиса, а синтаксис зависит от выбора лексических единиц.

Развитие этой области лингвистики продолжила Адель Голдберг, одна из учениц Филлмора. Классическая работа «Конструкции в действии: природа генерализации в языке» [Goldberg, 2006] стала одним из наиболее последовательных и подробных обоснований нового подхода.

Если представить теорию конструкции (CxG) в предельно упрощенном и обобщенном виде, то самым простым следствием этой теории можно назвать несводимость семантики конструкций (реципрокных, предикативных и пр.) к семантике входящих в них элементов. Это позволяет говорить о равноценности всех элементов конструкции. А. Голдберг в своей работе «Конструкции: взгляд на аргументную структуру с позиций Грамматики конструкций» [Goldberg, 1995] выдвигает нестандартную для классической лингвистической модели идею: именные группы, относящиеся к участникам ситуации, должны описываться не как актанты глагола, а как элементы глагольных конструкций; таким же элементом является и сам глагол, что соответствует грамматике конструкции в целом - взаимные ограничения отныне «уравнивают в правах» все составляющие системы. Этот подход позволяет упростить описание неоднозначности глагола в контекстах типа играть на пианино -играть словами. В этом случае конструкция диктует различие в значении: первая соотносится с физической деятельностью, а вторая — с метафорическим пониманием глагола играть. Таким образом, глагол употреблен один и тот же, но в разных конструкциях.

Отдельно следует рассмотреть ситуации с окказиональным значением лексем -ставшее классическим после работы Голдберг to sneeze the napkin off the table ('счихнуть салфетку со стола') [Goldberg, 2006], где глагол to sneeze, который изначально является непереходным, присоединяет к себе сирконстант без предлогов -по мнению автора, глагол в таком случае меняет свою семантику, чтобы соответствовать ситуации. Это отсылает нас к областям метонимического, непрямого использования глагола.

Принципиальной для CxG является неразделимость синтаксиса и семантики -они не могут существовать по отдельности; при этом постулируется важность семантического наполнения конструкции [Goldberg, 2006]. Именно смысл диктует,

каким образом будет изложена мысль адресанта, при этом все элементы конструкции соподчинены друг другу таким образом, что в результате совокупная семантика конструкции больше, чем семантика каждого отдельного ее элемента. Все конструкции объединяются в семейства, сходство которых обусловлено семантическим сходством; оно не может быть полным, однако реципрокальные, каузативные, пассивные и прочие конструкции образуют четко очерченные группы. Семантика, синтаксис и даже морфология в таких конструкциях подвижны. Именно способность конструкций гибко и плавно изменяться позволяет языку реагировать на изменения окружающей действительности.

На работах Ч. Филлмора и А. Голдберг базируются и достаточно новые подходы к изучению языка - так, например, представители коллострукционного анализа используют «коллокации» и «конструкции» как базовые единицы анализа, работают преимущественно с глаголами и в своих исследованиях активно пользуются корпусными методами компьютерной лингвистики [Рахилина, 2010; Kuznetsova, 2013; Чжухонг, 2014].

В рамках когнитивно-лингвистической парадигмы, частью которой является CxG, получает новое объяснение и проблематика кодирования актантов и сирконстантов. Л. Талми отмечает, что некоторые компоненты присутствуют в концептуализации события, но не обязательно кодируются в языке [Talmy, 1985; 1996]. Часть компонентов имеет более высокий информационный статус (входят в окно внимания), а другие подразумеваются, но не кодируются (gapped). Принцип гэппинга Талми иллюстрирует на примере конструкции английского глагола to spend 'тратить': так, в предложении I spent fifty dollars (for this book) (at that store) (last Friday) 'Я потратил 50 долларов на эту книгу в том магазине в пятницу' можно выразить менее важные компоненты цели, места и времени, но нельзя выразить участника-продавца (*from/to/by/for/... the clerk). Талми использует метафору рамки, которую использует режиссер, чтобы определиться, какие элементы окажутся в кадре, чтобы объяснить эффекты 'final windowing' и 'initial widowing' в конструкциях глагола движения. Исходная и конечная точка практически никогда не попадают в кадр одновременно, и поэтому, например, часто имеет место гэппинг исходной точки - хотя она и подразумевается.

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Буйлова Надежда Николаевна, 2023 год

Библиография

1. Adamzik, K. Textsorten - Texttypologie. Eine kommentierte Bibliographie. Nodus, Münster. 1995

2. Angenot M. Les dehors de la littérature: du roman populaire à la science-fiction. P., 2013.

3. Biber D. The multidimensional approach to linguistic analyses of genre variation: An overview of methodology and finding. // Computers in the Humanities. 1992.

4. Biber, Douglas & Conrad, Susan. (2019). Register, Genre, and Style.

5. Bod R. Constructions at work or at rest? // Cognitive Linguistics 20-1, 2009.

6. Boese E.S., Howe A.E. Effects of web document evolution on genre classification // Proceedings of the 14th ACM international conference on Information and knowledge management. 2005.

7. Bordoni C. Il romanzo di consumo. Napoli, 1996.

8. Boyer A.-M. La paralittérature. P., 1992.

9. Cawelty J.G. Adventure, mystery and romance. Chicago-L., 1976.

10. Chomsky N. Syntactic Structures. — The Hague: Mouton, 1957.

11. Crowston, K., Kwasnik, B., and Rubleske, J. Problems in the use-centered development of a taxonomy of web genres. In Mehler, A., Sharoff, S., and Santini, M., editors, Genres on the Web: Computational Models and Empirical Studies.

12. Droganova K., Zeman D. Proceedings of the NoDaLiDa 2017 Workshop on Universal Dependencies. 2017.

13. Fillmore C. Frame semantics and the nature of language: In Annals of the New York Academy of Sciences: Conference on the Origin and Development of Language and Speech. Volume 280: 20-32, 1976.

14. Giesbrecht E., Evert S. Part-of-speech tagging - a solved task? An evaluation of POS taggers for the Web as corpus. // Proceedings of the 5th Web as Corpus Workshop (WAC5). 2009.

15. Goldberg A. Constructions at Work: the nature of generalization in language. Oxford University Press, 2006.

16. Goldberg A. Constructions: A Construction Grammar Approach to Argument Structure. University of Chicago Press, 1995.

17. Gorlach, M. Text types and the history of English. Walter de Gruyter. Berlin-New York. 2004

18. Greimas A.-J. Structural Semantics: An Attempt at a Method. trans. Daniele McDowell, Ronald Schleifer, and Alan Velie. Lincoln, Nebraska: University of Nebraska Press, 1983.

19. Hutchins W. J. Machine translation: past, present, future Chichester (UK): Ellis Horwood, 1986.

20. Kam T. Random Decision Forests. // Proceedings of the 3rd International Conference on Document Analysis and Recognition. 1995.

21. Karlgren J., Cutting D. Recognizing text genres with simple metrics using discriminant analysis. // Proceedings of Coling. 1994.

22. Langacker R.W. Cognitive Grammar // Oxford University Press, 2008.

23. Li Y.H., Jain A.K. Classification of text documents. // Computer Journal. № 41 (8). 1998.

24. Lyashevskaya, Olga, Kira Droganova, Daniel Zeman, Maria Alexeeva, Tatiana Gavrilova, Nina Mustafina, and Elena Shakurova. «Universal dependencies for russian: A new syntactic dependencies tagset.» //Higher School of Economics Research Paper Series Linguistic. No. WP BRP 44 (2016).

25. Martin, James R. «English text.» System and structure (1992).

26. Nivre J., Agic Z., Aranzabe M. J. et al., Universal Dependencies 1.2, LINDAT/CLARIAH-CZ digital library at the Institute of Formal and Applied Linguistics (UFAL), Faculty of Mathematics and Physics, Charles University. 2015

27. Quinlan J. R. Simplifying decision trees. // International Journal of Man-Machine Studies. 1987.

28. Rehm G. Towards Automatic Web Genre Identification // Proceedings of the 35th Annual Hawaii International Conference on System Sciences (HICSS'02). Volume 4. 2002.

29. Santini, M., Mehler, A., and Sharoff, S. Riding the rough waves of genre on the web. In Mehler, A., Sharoff, S., and Santini, M., editors, Genres on the Web: Computational Models and Empirical Studies. Springer, Berlin/New York. 2010.

30. Schutze H. Automatic word sense discrimination. // Computational Linguistics. v.24 n.1. 1998.

31. Sharoff S. Functional text dimensions for the annotation of web corpora. Corpora, 13(1):65{95, 2018.

32. Shavrina, Tatiana, and Olga Shapovalova. «To the methodology of corpus construction for machine learning: «Taiga» syntax tree corpus and parser.» Proceedings of "CORPORA-2017" International Conference. 2017.

33. Springer. Kessler B., Nunberg G., Schutze H. Automatic Detection of Text Genre // CoRR. 1997.

34. Stefanowitsch A., Gries S. T. Collostructions: Investigating the interaction of words and constructions //International journal of corpus linguistics. Т. 8. №. 2. 2003.

35. Stefanowitsch A., Rohde A. The goal bias in the encoding of motion events //Studies in linguistic motivation. 2004. Т. 249268.

36. Straka M., Hajic J., Strakova J. UDPipe: Trainable Pipeline for Processing CoNLL-U Files Performing Tokenization, Morphological Analysis, POS Tagging and Parsing. LREC 2016.

37. Straka M., Strakova J. Tokenizing, POS Tagging, Lemmatizing and Parsing UD 2.0 with UDPipe, Proceedings of the CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, 2017

38. Talmy, L. Lexicalization patterns: Semantic structure in lexical forms. In T. Shopen (Ed.), Language typology and syntactic description (pp. 36-149). Cambridge: Cambridge University Press. 1985.

39. Talmy, L. The windowing of attention in language. In Masayoshi Shibatani & Sandra Thompson (eds.), Grammatical constructions: Their form and meaning, 235-287. Oxford: Oxford University Press. 1996.

40. Tesniere L Esquisse d'une syntaxe structurale. — P.: Klincksieck, 1953. (в переводе 1988 Теньер Л. Основы структурного синтаксиса. М.: Прогресс, 1988. 656 с.)

41. The Case for Case (1968). In Bach and Harms (Ed.): Universals in Linguistic Theory. New York: Holt, Rinehart, and Winston, 1-88.

42. Webber B. Genre distinctions for Discourse in the Penn TreeBank. // Proceedings of the 47th Annual Meeting of the ACL and the 4th IJCNLP of the AFNLP. 2009.

43. Апресян Ю.Д. О московской семантической школе, Вопросы языкознания, 2005

44. Апресян Ю.Д., Глагольное управление revisited // Od fonemu do tekstu. Prace dedykowane Profesorowi Romanowi Laskowskiemu. Pod redakcjа I. Bobrowskiego i Krystyny Kowalik. Kra^w, 2006.

45. Апресян Ю.Д., Лексические конверсивы в русском языке // Lingüistica Silesiana. Katowice: Universitet Sl^ski, 1975. Т. 1.

46. Апресян Ю.Д., Типы соответствия семантических и синтаксических актантов // Проблемы типологии и общей лингвистики. Международная конференция, посвященная 100-летию со дня рождения профессора А. А. Холодовича. Материалы. Санкт-Петербург, 2006.

47. Апресян Ю.Д., Экспериментальное исследование семантики русского глагола. М.: Наука, 1967.

48. Богуславский И.М., Апресян Ю. Д. и др. Лингвистическое обеспечение системы ЭТАП-2. — М.: Наука, 1989.

49. Ванштейн О. Розовый роман как машина желаний //Новое литературное обозрение. № 22. 1996.

50. Горалик Л. «Фетиш миллиардера» и миллиардер-фетиш: новый канон розового романа и жанр BDSML (на примере новеллы «Фетиш миллиардера» Джордан Сильвер) // Теория моды. № 34. 2015-2014.

51. Демидова Е.О. Фэнтези как жанрово-тематический канон массовой литературы в России. Yearbook of Eastern European Studies. No 6189 (6). 2016.

52. Дяченко П.В., Л.Л. Иомдин, А.В. Лазурский, Л.Г. Митюшин, О.Ю. Подлесская, В.Г. Сизов, Т.И. Фролова, Л.Л. Цинман. Современное состояние глубоко аннотированного корпуса текстов русского языка (СинТагРус) // Национальный корпус русского языка. 10 лет проекту. Труды Института русского языка им. В В. Виноградова. М., 2015.

53. Евстратенко Б. Автоматическое распознавание семантических полей с привлечением больших данных. Бакалаврский диплом, НИУ ВШЭ, Москва, 2016.

54. Егошин, С. В. «Архетип Тени в романе братьев Стругацких "Град обреченный".» Студенческая наука и XXI век 17.1-2 (2020): 73-75.

55. Золотова Г.А. Очерк функционального синтаксиса современного русского языка. — М., 1973.

56. Ильенко С.Г. Лексико-синтаксическая координация и ее проявление в художественном тексте // Сложноподчиненное предложение в лексикографическом аспекте. СПб., 2008. С. 44-54.

57. Канцельсон С.Д. Типология языка и речевое мышление. Л., 1972.

58. Копотев М.В., Стексова Т.И. Исключение как правило: Переходные явления в грамматике и словаре. М.: Языки славянской культуры, 2016.

59. Кустова Г.И. Типы производных значений и механизмы языкового расширения. М: Языки славянской культуры. 2004.

60. Маракасова А.А., Иомдин Л.Л. Микросинтаксическая разметка в корпусе русских текстов СинТагРус // Информационные технологии и системы 2016 (ИТиС'2016). Сборник трудов 40-ой междисциплинарной школы-конференции ИППИ РАН. Репино, Санкт-Петербург, 2016.

61. Массовая литература сегодня: учеб. пособие. Купина Н.А., Литовская М.А., Николина Н.А. М. : Флинта : Наука. 2009

62. МВ Копотев, ТИ Стексова. Исключение как правило: Переходные явления в грамматике и словаре. М.: Языки славянской культуры, 2016.

63. Мельников Н.Г. Жанрово-тематические каноны массовой литературы в творчестве В. В. Набокова : диссертация кандидата филологических наук : 10.01.08. - Москва, 1998.

64. Мельчук И. А. Опыт теории лингвистических моделей «Смысл ^ Текст». М., 1974.

65. Мельчук И. А. Холодович А. А. Категории грамматического залога // Народы Азии и Африки. 1970. No4.

66. Мельчук И. А., Жолковский А. К. Толково-комбинаторный словарь современного русского языка. Опыты семантико-синтаксического описания русской лексики. — Вена: Wiener Slavistischer Almanach, 1984.

67. Мельчук И.А. Русский язык в модели Смысл-Текст. «Языки русской культуры». Москва - Вена. 1995.

68. Мэнчжоу Х. Распространение и развитие китайской научной фантастики в России (на примере научно-фантастического романа Лю Цысиня) // Образование и право. 2020. №7.

69. О. Н. Ляшевская, С. А. Шаров, Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М.: Азбуковник. 2009.

70. Падучева Е. В. динамические модели в семантике лексики. М.: Языки славянской культуры, 2004.

71. Падучева Е. В. Соответствие «Смысл ^ Текст» в исторической перспективе // Восток — Запад: Вторая международная конференция по модели «Смысл ^ Текст». — М.: Языки славянской культуры, 2005.

72. Плунгян В. А., Рахилина Е. В. Сирконстанты в толковании? В кн.: Z. Saloni (red.), Metody formalne w opisie j^zykow slowianskich. Bialystok, 1990.

73. Прияткина А.Ф. Текстовые «скрепы» и «скрепы-фразы» (О расширении категории служебных единиц русского языка) // Предложение. Текст. Речевое функционирование языковых единиц : межвузовский сборник научных трудов. Елец, 2002. - С. 334-344

74. Рахилина Е. В. (отв. ред) Лингвистика конструкций. — М.: «Издательский центр «Азбуковник», 2010.

75. Саморуков И.И. Массовая литература: проблема художественной рефлексии : диссертация ... кандидата филологических наук : 10.01.08 / Сам. гос. ун-т. -Самара, 2006.

76. Сидорова М. Ю. Коммуникативный регистр и деомонимизация форм несовершенного вида в тексте // Вестник Удмуртского университета. Серия «История и филология» 1 (2009).

77. Скокова Т. А. Специфика массовой литературы в эпоху постмодернизма // Вестник ВГУ. Серия: Филология. Журналистика. 2009. № 2. С. 95—100.

78. Скокова Т. А. Специфика массовой литературы в эпоху постмодернизма //Вестник Воронежского государственного университета. Серия: Филология. Журналистика. - 2009. - №. 2. - С. 95-100.

79. Скребцова Т.Г., Марусенко Н.М. Современный российский детектив в контексте общего развития детективного жанра // Русский язык и литература в пространстве мировой культуры: Материалы XIII Конгресса МАПРЯЛ (г. Гранада, Испания, 13-20 сентября 2015 года) / Ред.кол.: Л.А.Вербицкая, К.А.Рогова, Т.И.Попова и др. - В 15 т. - СПб.: МАПРЯЛ, 2015. Т.14.

80. Стексова Т.И. Смысловой диапазон изъяснительной конструкции (на примере конструкции Не понимаю, что...) // Вестник Томского государственного университета. Филология. 2018. № 51. С. 47-57

81. Типология условных конструкций [Текст] / [А. Салим, Т. Г. Акимова, Н. Я. Булатова и др.]; отв. ред. В. С. Храковский; Рос. акад. наук, Ин-т лингвист. исслед. Спб: Наука : Санкт-Петербургская изд. фирма, 1998.

82. Федорова Ж. В. Массовая литература в России XIX века: художественный и социальный аспекты // Русская и сопоставительная филология: Взгляд молодых / Казанский государственный университет; Филологический факультет; Ред.

кол.: Н.А. Андрамонова (отв. ред.), М.А. Козырева. Казань: Казанский государственный университет, 2003. С. 202—208.

83. Филипенко М.В. Семантика наречий и адвербиальных выражений. М: Азбуковник. 2003.

84. Фразеологический словарь современного российского детектива : в двух томах / Е. В. Ганапольская. Санкт-Петербург : Златоуст, 2015-2016.

85. Хоруженко Т.И. Русское фэнтези: на пути к метажанру: дис. кандидат наук: 10.01.01 - Русская литература. Екатеринбург. 2015.

86. Хоруженко Татьяна Игоревна Фэнтези на стыке с научной фантастикой: формирование направления стимпанк-фэнтези // Вестник Пермского университета. Российская и зарубежная филология. 2014. №1 (25).

87. Храковский В. С. Два подхода к анализу синтаксических конструкций:" лексико-семантический" и "конструкционный"(опыт сопоставления). Acta Lingüistica Petropolitana. Труды института лингвистических исследований 10, no. 2 (2014).

88. Храковский В.С. Вербоцентрический подход к конструкциям и (или) грамматика конструкций // Ю. Д. Апресян и др. (ред.). Смыслы, тексты и другие захватывающие сюжеты. Сборник статей в честь 80-летия Игоря Александровича Мельчука. М.: Языки славянских культур, 2012.

89. Шмелева Е.Я. Текстовая скрепа "и это при том, что" // Вестник новосибирского государственного университета. Серия: история, филология. Новосибирск, 2015.

90. Черемисина М. И., Колосова Т. А. Очерки по теории сложного предложения. Новосибирск: Наука, 1987.

91. Черняк М. А. Отечественная массовая литература как альтернативный учебник // Русская литература в формировании и современной языковой личности. Санкт-Петербург, 24-27 октября 2007 г. Материалы конгресса: в 2 частях. СПб.: МИРСС, 2007.

92. Черняк М.А. Современный детектив: занимательное чтиво, или игры разума // Universum: Вестник Герценовского университета. 2006. №6 (32). URL: https://cyberleninka.ru/article/n/sovremennyy-detektiv-zanimatelnoe-chtivo-ili-igry-razuma (дата обращения: 04.03.2021).

93. Черняк М.А. Феномен массовой литературы. СПб.: Изд-во РГПУ им. А.И. Герцена, 2005.

94. Чжухонг Л. Корпусный анализ форм будущего времени в русском языке: статистика и коллострукционные закономерности // Вестник Московского университета. Серия 9. Филология. №6. 2014.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.