Автоматизация лексико-типологических исследований: методы и инструменты тема диссертации и автореферата по ВАК РФ 10.02.19, кандидат наук Рыжова, Дарья Александровна

  • Рыжова, Дарья Александровна
  • кандидат науккандидат наук
  • 2018, Москва
  • Специальность ВАК РФ10.02.19
  • Количество страниц 174
Рыжова, Дарья Александровна. Автоматизация лексико-типологических исследований: методы и инструменты: дис. кандидат наук: 10.02.19 - Теория языка. Москва. 2018. 174 с.

Оглавление диссертации кандидат наук Рыжова, Дарья Александровна

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. ОБЩИЕ СВЕДЕНИЯ

§1. Краткий обзор имеющихся методик и подходов к типологическому описанию лексики

1. Экспериментальная парадигма Инстутита психолингвистики имени Макса Планка

2. Теория семантических примитивов

3. Серия подходов, основанных на анализе лексикографических источников

4. Серия подходов, основанных на использовании параллельных корпусов

5. Методологическая ниша

§2. ТЕОРЕТИЧЕСКАЯ БАЗА: ФРЕЙМОВЫЙ ПОДХОД К ЛЕКСИЧЕСКОЙ ТИПОЛОГИИ

ГЛАВА 2. ВЕРИФИКАЦИЯ ПОНЯТИЯ ФРЕЙМА С ПОМОЩЬЮ МОДЕЛЕЙ ДИСТРИБУТИВНОЙ СЕМАНТИКИ

§1. ПОСТАНОВКА ЗАДАЧИ

§2. Модели дистрибутивной семантики

§3. ПИЛОТНЫЕ ЭКСПЕРИМЕНТЫ

§4. Новая серия экспериментов

1. Подготовка типологических и дистрибутивных данных

1.1. Подготовка типологического векторного пространства

Предобработка Базы данных признаковой лексики

Метрика типологической близости

1.2. Подготовка дистрибутивного векторного пространства

1.3. Подсчет корреляции

1.4. Базовый алгоритм

2. Эксперимент 1: признаковые поля 'острый' и 'гладкий'

3. Эксперимент 2: глаголы качания

4. Эксперимент 3: англоязычный обучающий корпус

5. Эксперимент 4: визуализация векторных пространств

6. Выводы

ГЛАВА 3. АВТОМАТИЧЕСКАЯ РАЗРАБОТКА АНКЕТЫ С ПОМОЩЬЮ МОДЕЛЕЙ ДИСТРИБУТИВНОЙ СЕМАНТИКИ

§1. Краткий обзор существующих методов составления типологических анкет

§2. ПОСТАНОВКА ЗАДАЧИ

§3. Определение круга лексем, относящихся к изучаемому полю

1. Проблема границ поля

2. Проблема метафорических значений

3. Формализация задачи

4. Методы (полу)автоматического составления списка прилагательных

4.1. Метод анализа синонимов

4.2. Метод ближайших соседей

4.3. Определение границ поля по материалам онтологии ЯиШоМКе!

4.4. Метод обратных переводов

5. Анализ результатов

§4. Составление списков коллокаций

1. Выбор корпуса

2. Установление порога частотности

§5. РАЗДЕЛЕНИЕ КОЛЛОКАЦИЙ НА ГРУППЫ

1. Выбор основания для кластеризации и подготовка векторного пространства

2. Кластеризация векторного пространства

1. Алгоритмы с автоматическим определением количества кластеров

2. Алгоритмы с заданным числом кластеров

§7. Уменьшение объема анкеты

§8. ОЦЕНКА РЕЗУЛЬТАТОВ

§9. Эксперименты с другими полями

§10. Выводы

ГЛАВА 4. МЕТОДЫ АВТОМАТИЧЕСКОГО СБОРА ДАННЫХ

§1. ПОСТАНОВКА ЗАДАЧИ

§2. МАТЕРИАЛ ДЛЯ ЭКСПЕРИМЕНТОВ

§3. АЛГОРИТМЫ АВТОМАТИЧЕСКОГО ЗАПОЛНЕНИЯ ТИПОЛОГИЧЕСКОЙ АНКЕТЫ

3.1. Перевод анкеты

2.1.1. Онлайн-переводчики компаний Yandex и Google

2.1.2. Машиночитаемые словари Freedict и Verdict

2.1.3. Параллельные корпуса

2.1.4. Анализ результатов

2.2. Заполнение анкеты

§4. ВЫВОДЫ

ГЛАВА 5. ПОСТРОЕНИЕ СЕМАНТИЧЕСКОЙ КАРТЫ И АНАЛИЗ ТИПОВ СИСТЕМ

§1. Существующие методы создания семантических карт

1.1. Графовые семантические карты

1.2. Вероятностные семантические карты

§2. ГРАФОВАЯ И ВЕРОЯТНОСТНАЯ МОДЕЛИ В ПРИМЕНЕНИИ К НАШЕМУ МАТЕРИАЛУ

§3. ПОСТРОЕНИЕ СЕМАНТИЧЕСКИХ КАРТ С ПОМОЩЬЮ РЕШЕТОК ФОРМАЛЬНЫХ ПОНЯТИЙ

1. Анализ формальных понятий

2. Решетки формальных понятий как лексические семантические карты

3. Представление метафорических значений

§4. ВЫВОДЫ

ЗАКЛЮЧЕНИЕ

БИБЛИОГРАФИЯ

ПРИЛОЖЕНИЕ 1. АНКЕТА ДЛЯ ПОЛЯ 'ОСТРЫЙ'

ПРИЛОЖЕНИЕ 2. АНКЕТА ДЛЯ ПОЛЯ 'ГЛАДКИЙ'

ПРИЛОЖЕНИЕ 3. АНКЕТА ДЛЯ ПОЛЯ ГЛАГОЛОВ КАЧАНИЯ

ПРИЛОЖЕНИЕ 4. АВТОМАТИЧЕСКИ СКОНСТРУИРОВАННАЯ АНКЕТА ДЛЯ ПОЛЯ 'ПРЯМОЙ'

ПРИЛОЖЕНИЕ 5. АВТОМАТИЧЕСКИ СКОНСТРУИРОВАННАЯ АНКЕТА ДЛЯ ПОЛЯ 'ТОЛСТЫЙ'

Рекомендованный список диссертаций по специальности «Теория языка», 10.02.19 шифр ВАК

Введение диссертации (часть автореферата) на тему «Автоматизация лексико-типологических исследований: методы и инструменты»

Введение

Лексическая типология - сравнительно молодая область лингвистики, основной задачей которой является сопоставительный анализ значений слов в разных языках. Сильнейший импульс для развития лексическая типология получила с выходом знаменитой статьи Berlin & Kay 1969 о типологии цветообозначений, где была предложена четкая методика сопоставления лексических значений, широко применяемая до сих пор. Эта работа вызвала широкий резонанс в лингвистическом сообществе и положила начало активному развитию лексической типологии. В настоящее время интерес к типологическому анализу лексики только продолжает возрастать.

За полвека лексическая типология добилась существенных результатов: разработаны различные методики сбора и анализа материала (см., например, недавний обзор Koptjevskaja-Tamm, Rakhilina, & Vanhove 2016, описан целый ряд семантических полей (глаголы давания (Newman 1998), разделения объектов на части (Majid & Bowerman 2007), движения в воде (Майсак & Рахилина 2007), извлечения объектов (Kopecka & Narasimhan 2012) и многие другие, в том числе не-глагольные). Между тем, некоторые методологические сложности по-прежнему не преодолены. В первую очередь, они связаны с тем, что для анализа лексики необходим обширный и представительный материал, который в большинстве случаев невозможно почерпнуть из лексикографических источников. Это вынуждает исследователей разрабатывать специальные анкеты и собирать команду экспертов по различным языкам, способных провести работу с носителями и проанализировать полученный материал. Трудоемкость всего процесса не позволяет проводить подробный анализ обширных семантических зон в большом количестве языков. Поэтому, в большинстве случаев, приходится серьезно ограничивать либо количество языков в выборке, либо степень подробности их анализа. Автоматизация трудоемкой деятельности по сбору и обработке лексического материала позволила бы получить огромный массив структурированных данных для многих языков мира, подготовленных к лексикографической обработке и непосредственному сопоставлению.

Результаты подробного и обширного сравнительного анализа лексических значений, а также сама алгоритмизация и компьютеризация лексико-типологического исследования представляют несомненную теоретическую ценность: они позволяют не только расширять и уточнять данные, полученные ручным путем, но и уточнять методологические

основания, на которых была построена ручная работа с этими данными. В частности, в данной диссертации мы предполагаем доказать реальность и лингвистическую релевантность такого теоретического понятия, как лексико-типологический фрейм, которое лежит в основе наших исследований. Таким образом, с алгоритмизацией лексическая типология повышает свой статус как научно обоснованная область лингвистических исследований: мы строим не гипотезы, а полноценные модели.

Одновременно привлечение в лексическую типологию больших данных принесло бы и практическую пользу: их можно было бы учитывать при решении задач ручного и машинного перевода, а также при разработке более эффективных методик обучения иностранному языку. Таким образом, актуальность представляемой на защиту диссертационной работы, определяется востребованностью методов автоматического анализа лексики как в теоретической, так и в прикладной лингвистике.

Наша работа опирается на фреймовый подход к лексической типологии, разработанный Московской лексико-типологической группой MLexT (Рахилина & Резникова 2013; Rakhilina & Reznikova 2016) и восходящий к традициям Московской семантической школы, см. Апресян 1974. Ключевое для данной парадигмы понятие фрейма обозначает минимальную ситуацию, которая может в каком-либо языке описываться отдельной лексемой. Задача типологического описания некоторого семантического поля в таком случае сводится к определению набора составляющих его фреймов (т.е. типов ситуаций, которые могут покрываться относящимися к нему лексемами) и моделей их лексикализации (т.е. стратегии объединения значений в рамках одного лексического средства - прототипически, слова). Набор фреймов определяется через анализ сочетаемости слов, которая изучается по словарям и корпусам и уточняется в ходе опросов носителей, а принципы объединения фреймов отображаются на семантических картах, подобных тем, что создаются по результатам исследований в грамматической типологии (см. Haspelmath 2003).

Цель нашей работы - обосновать фреймовый подход в качестве методологической основы и теоретической базы лексико-типологических исследований и предложить новые методы автоматического сбора и анализа лексико-типологических данных, которые позволят упростить и ускорить процесс сбора первичных данных и обнаружить новые закономерности в выражении лексических значений.

В соответствии с поставленной целью, работа решает следующие задачи:

(1) формализация базовых понятий и процедуры лексико-типологического исследования, выполняемого в рамках фреймовой парадигмы: выделение основных его этапов и формулировка задач, которые должны быть решены на каждом шаге;

(2) подбор и апробация автоматических методов реализации каждого из этапов;

(3) анализ полученных результатов, определение перспектив применения квантитативных методик в лексической типологии.

Основные методы, на которые мы опираемся при разработке алгоритмов автоматического сбора и анализа лексических данных, - это дистрибутивный анализ (модели дистрибутивной семантики, см. Baroni, Bernardi, & Zamparelli 2014), кластерный анализ (Everitt 2011) и анализ формальных понятий (Ganter & Wille 1999).

Научная новизна исследования обусловлена слабой изученностью лексико-типологической области в целом и узким кругом исследований, посвященных задаче разработки компьютерных методов анализа значений слов. Методы, которые мы используем в диссертации, пока не применялись для решения подобных задач. Мы предлагаем свои собственные алгоритмы их внедрения в процесс типологического анализа лексики.

На защиту выносятся следующие положения:

(1) Фреймовая структура поля имеет квантитативное обоснование и представляет собой пересекающиеся кластеры с ярко выраженными центрами («фокусами»).

(2) Предварительный вариант лексико-типологической анкеты может быть получен на основе одноязычного корпуса текстов с помощью моделей дистрибутивной семантики и кластерного анализа полученного дистрибутивного пространства.

(3) Процесс сбора данных по анкете может быть полностью автоматизирован с помощью параллельных и одноязычных корпусов, машиночитаемых переводных словарей и онлайн-переводчиков.

(4) Решетки формальных понятий могут быть использованы как новый аналог семантических карт. Такие карты независимы от изначальных теоретических предпосылок исследователя и имеют более широкий круг возможностей по сравнению с обычными графовыми и вероятностными моделями. Они позволяют отображать не только относительные расстояния между исходными значениями, но и стратегии объединения прямых значений и системные связи между прямыми и метафорическими употреблениями лексем.

Тем самым, теоретическая значимость работы определяется её вкладом в развитие лексической типологии в целом и фреймового подхода в частности. Результаты, полученные в ходе настоящего исследования, позволяют уточнить наши представления об организации семантического пространства лексических значений и выдвинуть новые гипотезы относительно степени их сопоставимости.

Практическая значимость диссертации заключается в разработке алгоритмов, которые могут позволить оптимизировать процесс лексико-типологического исследования, а значит, ускорить процесс подготовки материала, необходимого для решения задач в области лексикографии (в том числе компьютерной), обучения языку, ручного и машинного перевода.

Все эксперименты, описанные в настоящей работе, проводятся на материале нескольких признаковых и глагольных семантических полей, уже исследованных вручную участниками группы MLexT: 'острый' (Кюсева 2012), (Kyuseva, Parina, & Ryzhova to appear), 'гладкий' (Кашкин 2013), (Kashkin & Vinogradova to appear), 'прямой' (Лучина 2014), 'толстый' (Kozlov & Privizentseva to appear), 'качание' (Шапиро 2015), 'падение' (Кузьменко & Мустакимова 2015; Reznikova & Vyrenkova 2015) и некоторые другие.

Апробация результатов исследования. Основные результаты исследования были представлены на XI Конференции по типологии и грамматике для молодых исследователей (г. Санкт-Петербург, 2014), мастер-классе по лексической типологии в Университете Хельсинки (г. Хельсинки, Финляндия, 2014), XVI Апрельской международной научной конференции НИУ ВШЭ (г. Москва, 2015), научном семинаре с профессором Института психолингвистики имени Макса Планка Асифой Маджид (г. Москва, 2015), Международной конференции по компьютерной лингвистике «Диалог 2015» (г. Москва, 2015), конференции «Проблемы компьютерной лингвистики» (г. Воронеж, 2015), I международной научно-практической конференции «Иностранные языки в науке и образовании: проблемы и перспективы» (г. Москва, 2015), международном научном семинаре «Компьютерная лингвистика и наука о языке» (г. Москва, 2016), постерной секции Типологической школы Школы лингвистики НИУ ВШЭ (г. Москва, 2016), X Международной конференции по языковым ресурсам и их оценке LREC'16 (г. Порторож, Словения, 2016), международном семинаре по перцептивной метафоре (г. Неймеген, Голландия, 2016), международном семинаре по глаголам движения (г. Париж, Франция, 2017), XIV Международной конференции по когнитивной лингвистике (г. Тарту,

Эстония, 2017). По теме диссертации опубликовано 9 работ, в том числе 5 в изданиях, рекомендованных ВАК.

Структура работы. Помимо Введения, работа включает пять глав, заключение, библиографию из 158 названий и пять приложений. В первом разделе Главы 1 приводится обзор существующих методик сравнительного анализа лексики, в том числе новейших компьютерных. Во втором разделе дается обзор фреймового подхода к лексической типологии, на который мы опираемся в настоящем исследовании. В Главе 2 мы представляем результаты серии экспериментов, направленных на оценку состоятельности ключевого для данной парадигмы понятия - фрейма. Главы 3 - 5 посвящены обсуждению возможных методов автоматизации каждого из этапов исследования: разработки анкеты (Глава 3), заполнения анкеты материалами различных языков (Глава 4) и построения семантической карты (Глава 5). Наконец, в Заключении формулируются основные выводы.

Глава 1. Общие сведения

Лексическая типология - относительно молодая, но бурно развивающаяся область лингвистики. По аналогии с грамматической типологией, изучающей инвентарь грамматических значений и средства их выражения в языках мира, лексическая типология стремится описать набор лексических значений и способы их лексикализации, т.е. их обозначения с помощью слов и других словарных средств естественных человеческих языков. Так, лексико-типологический анализ наименований частей человеческого тела показывает, что в одних языках, например, в английском или японском, нижняя часть руки от пальцев до запястья и верхняя - от запястья до плеча - противопоставляются лексически (ср. англ. arm vs. hand, яп. te vs. ude), а в других языках такого противопоставления на лексическом уровне не наблюдается, или, по крайней мере, оно выражено менее явно (ср. русск. рука, обозначающее всю руку, от пальцев до плеча)1.

Иногда лексическую типологию противопоставляют семантической и лексико-семантической, говоря, что лексическая типология - это «изучение того, как средствами лексики «обеспечивается» и членится то или иное денотативное поле (область действительности и соответствующая понятийная область), какие свойства и отношения реальных объектов оказываются релевантными для их номинации» (Толстая 2013: 142). Семантическая типология, напротив, занимается изучением семантической структуры слова, т.е. выбирает в качестве отправной точки не действительность и понятийную область, а лингвистическую единицу и её характеристики. Лексико-семантическая типология, как это и следует из ее названия, комбинирует два подхода: «...она либо исходит из денотативного поля, но ограничивает его лексически, либо, наоборот, исходит из лексического поля (гнезда и т. п.) и изучает набор и соотношение обозначаемых лексикой этого гнезда денотативных сфер» (там же). Мы будем использовать термин «лексическая типология» в широком смысле, объединяя под этим ярлыком все три типа задач.

Долгое время лексическая типология оставалась в стороне от магистральных направлений лингвистических исследований. На это есть множество причин. Во-первых, инвентарь лексических смыслов заведомо на несколько порядков объемнее инвентаря грамматических значений, что заметно затрудняет их изучение. Во-вторых, среднестатистическая лексическая единица в разы менее частотна, чем стандартный

1 Подробнее о типологии частей тела см. Brown 2005a, 2005b; Majid, Enfield, & van Staden 2006, Majid 2015.

9

грамматический показатель, что осложняет процесс сбора материала. И, наконец, до недавнего времени основной причиной отсутствия интереса у лингвистов к лексическим значениями была их эфемерность и отсутствие сколько-нибудь надежных методов их анализа и описания, а значит, и отсутствие базы для их сопоставления. Все эти факторы нередко создавали впечатление не просто невозможности адекватного анализа семантического уровня языка в силу отсутствия необходимых инструментов (ср. взгляд Л. Блумфилда (1926)), но и принципиальной безнадежности, бессмысленности этого предприятия: лексический состав языка казался хаосом, в котором просто нет и быть не может никаких более или менее строгих правил2.

Однако со второй половины XX века лексическая типология начинает привлекать к себе все больший и больший интерес исследователей. Разрабатывается целый ряд подходов к анализу словарных значений, предлагается несколько оснований для сопоставления лексики различных языков. Далее мы представим краткий обзор основных методик (§1), а затем более подробно рассмотрим подход, который мы используем в качестве теоретической базы для данного исследования (§2).

§1. Краткий обзор имеющихся методик и подходов к типологическому описанию лексики

1. Экспериментальная парадигма Инстутита психолингвистики имени Макса Планка

Экспериментальная методика сопоставления лексических значений была впервые предложена в знаменитой и уже упоминавшейся во Введении работе Berlin & Kay 1969, посвященной типологическому анализу цветообзначений. Сегодня этот подход является самым распространенным в области лексико-типологических исследований. Его развивает и активно применяет исследовательская группа Института психолингвистики имени Макса Планка (см. Kopecka & Narasimhan 2012; Majid, 2015; Majid & Bowerman, 2007 и др.).

Этот метод базируется на эксперименте. Для каждого изучаемого семантического поля подготавливается набор стимулов: карточек, выкрашенных в разные цвета, - для исследования цветообозначений; клипов, представляющих ситуации разделения объектов

2 Ср. цитату из Di Sciullo & Williams 1987 (с. 3-4): «The lexicon is increadibly boring by its very nature. It <.. .> is like a prison - it contains only the lawless and the only thing that its inmates have in common is lawlessness» («Лексикон - вещь невероятно скучная по своей природе. <...> Он как тюрьма: в нем одни нарушители законов, и беззаконие - это единственное, что объединяет его обитателей» (перевод наш - ДР)).

на части, - для глаголов разбиения, разрезания и т.п.; пузырьков со смесями различного вкуса - для изучения вкусовых прилагательных и т.д. Анкеты предъявляются испытуемым, которых просят описать стимулы словами своего родного языка. Тем самым, можно сказать, что в рамках этой парадигмы минимальным элементом «значения» слова считается совокупность некоторых физических характеристик объекта действительности или ситуации в целом.

Такая методика обладает целым рядом достоинств. Прежде всего, единая анкета, по которой опрашиваются информанты, становится базой для сравнения и позволяет проводить параллели между лексическими составами разных, в том числе и неродственных, языков. Поскольку анкета состоит из экстралингвистических стимулов, ее не нужно переводить и адаптировать для каждого конкретного языка выборки. Тем самым, такой метод позволяет быстро получить необходимую информацию, причём не только о хорошо изученных языках с богатой письменной традицией, но и о малых бесписьменных языках, для которых нет ни корпусов, ни хороших и достаточно полных толковых и переводных словарей. Кроме того, метод элицитации позволяет получить и отрицательную информацию, т.е. запреты на употребление тех или иных лексем в определенных контекстах.

Однако, несмотря на все преимущества, этот метод имеет свои ограничения. В частности, он накладывает серьёзные ограничения на область исследования: если прилагательные со значением 'сладкий' или 'солёный' можно изучать, предлагая испытуемым пробовать воду с сахаром или с солью, то составить анкету, состоящую из экстралингвистических стимулов, для анализа предикатов боли (ср. русск. колет в боку, першит в горле), оценочных прилагательных (хороший, ужасный, божественный, отвратительный и т.п.) или метафорических сдвигов ('сладкая вода' уб. 'сладкая жизнь') значительно сложнее.

Другое ограничение связано с тем, что в центре внимания этой школы с самого начала оказались особенности когнитивного восприятия цвета, звука, вкуса и других экстралингвистических ситуаций и их параметров людьми, относящимися к разным расам и культурам. Лингвистическое поведение слов, описывающих эти ситуации, становится ключом к пониманию более общих когнитивных закономерностей, но его изучение не является самоцелью. Соответственно, и наборы стимулов, разрабатываемые в Институте имени Макса Планка, часто предполагают изучение наименований тех или иных физических характеристик или процессов в отрыве от контекста, от реальной жизненной

ситуации, в которой искомые слова могут использоваться. Так, например, исследование цветообозначений нацелено на определение того, к каким физическим характеристикам и их значениям в этой зоне чувствительна когнитивная система человека вообще и представителей разных рас и народностей в частности. Ключом к решению этой задачи служит, в том числе, информация о том, какие физические противопоставления могут быть вербализованы в тех или иных языках, а какие - нет (ср. термины «expressibilty» («выразимость») и «ineffability» («невыразимость») в работе Levinson & Majid 2014).

Между тем, один и тот же с физической точки зрения цвет может описываться разными лексическими средствами, в зависимости от того, атрибутом какого объекта он является, ср. русск. карие глаза vs. каштановые волосы vs. коричневое платье vs. бурый медведь (подробнее об этом см. Рахилина 2010). Эти лингвистические особенности слов выходят за рамки задач исследовательской группы Института имени Макса Планка. Заметим, однако, что этот подход непрерывно развивается и в настоящее время уже не сводится исключительно к элицитации по анкетам, состоящим из экстралингвистических стимулов (см., например, Majid 2015). Однако сам вектор развития остается тем же: анализ когнитивных механизмов через призму языка.

2. Теория семантических примитивов

Другой подход, применяемый в мировой практике в сфере лексической типологии, реализован в работах А. Вежбицкой и К. Годдарда (см. Wierzbicka 1972, Goddard 2011). Согласно этому подходу, каждое лексическое значение представляет собой один элементарный универсальный смысл (такой, как 'я', 'ты', 'кто-то', 'люди', 'думать', 'хороший', 'большой' и др., общее количество таких элементарных смыслов ~ 60) или их комбинацию. Тем самым, слова разных языков можно сравнивать на основе того, какие элементарные смыслы входят в их значение.

Так, например, разницу в семантике польского цветообозначения niebeski и английского blue А. Вежбицка следующим образом отражает в их толкованиях:

X - niebeski:

(а) в некоторые моменты на небе можно видеть солнце

когда люди видят что-то, подобное Х-у, они могут подумать о небе в такие моменты

X - blue:

(а) в некоторые моменты на небе можно видеть солнце

когда люди видят что-то, подобное Х-у, они могут подумать о небе в такие моменты

(б) в некоторых местах можно видеть массу воды не потому, что люди в этих местах что-то делали

когда люди далеко от таких мест, они могут видеть эту воду когда они видят что-то, подобное Х-у, они могут подумать об этом3

Как можно видеть из приведенных толкований, такой подход частично преодолевает недостатки экспериментальной методики, рассмотренной выше. В частности, А. Вежбицкая, описывая цвет, обращается не к физическим характеристикам спектра (тону, яркости и т.п.), а к прототипу (в данном случае, небу и воде), т.е. к контексту, что кажется более естественным для описания лингвистических единиц.

Сложность, однако, заключается в том, что предложенный А. Вежбицкой и К. Годдардом набор универсальных компонентов настолько мал, что семантическое представление каждого лексического значения оказывается очень громоздким, и сравнивать такие значения между собой оказывается крайне затруднительно (ср. похожую критику в работах Geeraerts 1988, 2014 и др.). Помимо этого, маленький набор универсальных смыслов не позволяет описывать тонкие различия между лексемами и, в особенности, исследовать зоны вариативности. Вызывает вопросы и сам универсальный набор: А. Вежбицка и К. Годдард утверждают, что его элементы должны иметь однословное выражение в любом языке, однако на деле это не так (см. Плунгян & Рахилина 1996, а также Goddard & Wierzbicka 1994). Дополнительным ограничением такого подхода является его трудоемкость: исчерпывающее описание той или иной семантической области на материале представительной языковой выборки в рамках этой парадигмы не представляется возможным.

3. Серия подходов, основанных на анализе лексикографических источников

Еще одна методологическая ниша, которая сейчас становится все более и более популярной, - сопоставительные исследования лексической семантики на базе имеющихся толковых и переводных словарей. Эта идея стала популярной с момента выхода статьи François 2008, которая очень широко цитируется (ср. Newman 2015 и др.). Она же легла в основу лексико-типологической базы данных CLICS4 (List et al. 2014), которую мы рассмотрим в этом же разделе ниже.

3 Толкования даны по (Вежбицкая 1996: 257-258).

4 URL: [http://clics.lingpy.org/]

В работе А. Франсуа на материале словарных данных анализируется семантическое поле дыхания. В качестве основной единицы типологического описания выбирается словарное значение (а не словарный вход)5. Предполагается, что набор таких значений близок к универсальному, а разные лексемы в разных языках покрывают те или иные его подмножества. Основные принципы лексикализации зоны отражаются на семантической карте.

Семантические карты (см. Haspelmath 2003) широко используются в грамматической типологии (см. Anderson 1986, Haspelmath 1997, van der Auwera & Plungian 1998 и др.) и представляют собой графы, узлами которых служат функции из минимального грамматического набора, а ребра между узлами ставятся в том случае, если соответствующие функции могут обозначаться одним и тем же грамматическим средством хотя бы в одном языке. При этом особую роль играет взаимное расположение узлов на карте: считается, что чем ближе узлы друг к другу, тем больше вероятность их объединения в рамках одного лингвистического средства (например, грамматического показателя). С этим же ограничением связан так называемый «принцип смежности»: каждая из рассматриваемых лингвистических единиц может покрывать только смежные функции, т.е. только связный подграф семантической карты (см. Croft 2001: 96). В работе А. Франсуа (2008) эксплуатируется тот же самый метод семантического картирования, что и в грамматической типологии, но вместо грамматических функций в качестве узлов графа выступают минимальные словарные значения6.

Методика, предложенная А. Франсуа, не лишена недостатков - в первую очередь, связанных с выбором источника данных. Известно, что разные словари характеризуются разной степенью подробности: единой лексикографической традиции и единого шаблона представления семантики многозначного слова пока не существует. Помимо того, что в одних словарях представлены более дробные списки значений лексем, чем в других, тут есть и более существенные теоретические трудности. Е.В. Рахилина, А.С. Выренкова и Л.О. Наний (Наний 2016, Rakhilina, Vyrenkova, Orekhov to appear) провели подробную экспертизу методики Александра Франсуа (на основании предложенных им

5 Т.е., в терминах МСШ, лексема (одно из значений многозначного слова), а не вокабула (отдельное слово, основная единица словарного описания), см. определение этих терминов в Активном словаре русского языка (Апресян 2014:11). В рамках данной работы мы пользуемся другим терминологическим аппаратом: слово лексема мы употребляем в качестве синонима слов слово и вокабула, а словарные значения называем

значениями или концептами.

6 Более подробный обзор методик семантического картирования см. в Главе 5 настоящей диссертации.

семантических карт и их описаний) и возможностей ее дигитализации в системах типа CLICS и выявили проблемные точки такого подхода.

Во-первых, словари не всегда отделяют устаревшие значения. Но даже если они помечены, информация об этом может быть проигнорирована, особенно при автоматическом ее извлечении, как в системах типа CLICS. Примером может служить представление как результата системной колексификации в русском языке метафорического значения, реализуемого в словосочетаниях вида дух народа (войска, страны), и лексикализованного значения дух как 'breathing' (ср. современное русское вдох / вы-дох). Употребления второго типа в современном русском языке характеризуются очень узкой и лексикализованной сочетаемостью. Фактически она ограничена только тремя фраземами: испустить дух, дух захватывает, перевести дух, которые действительно исторически восходят к глаголу дышать, но уже по данным Малого академического словаря (Евгеньева 1999) являются периферийными и устаревшими и синхронно с другими его производными не ассоциируются. Любопытно, что МАС, который не используется в исследовании François 2008 (в отношении русского материала эта статья опирается на данные словаря Sakhno 2005), разводит эти употребления по разным словарным статьям без взаимных ссылок друг к другу.

Похожие диссертационные работы по специальности «Теория языка», 10.02.19 шифр ВАК

Список литературы диссертационного исследования кандидат наук Рыжова, Дарья Александровна, 2018 год

Библиография

1. Абдурашитова Г.М. Кластеризация существительных на основе их сочетаемости в разных языках: дипломная работа. Москва, 2017.

2. Александрова З.Е. Словарь синонимов русского языка: Практический справочник: Около 11 тысяч синонимических рядов / З.Е. Александрова, 11-е издание, переработанное и дополненное, Москва: Русский язык, 2001. 568 с.

3. Апресян Ю.Д. Лексическая семантика: синонимические средства языка. / Ю.Д. Апресян, Москва: Наука, 1974.

4. Апресян Ю.Д. Новый объяснительный словарь синонимов русского языка / под ред. Ю.Д. Апресяна, Второе издание, исправленное и дополненное, Москва, Вена: Языки славянской культуры: Венский славистический альманах, 2004. 1488 с.

5. Апресян Ю.Д. Активный словарь русского языка. Том 1. А-Б / Ю.Д. Апресян (отв.ред.), Москва: Языки славянской культуры, 2014. 408 с.

6. Большакова Е. И. [и др.]. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб. пособие / Е. И. Большакова [и др.], Москва: МИЭМ, 2011, 272, 3.

7. Брицын В.М. [и др.]. Концепт БОЛЬ в типологическом освещении / под ред. В.М. Брицын, Е.В. Рахилина, Т.И. Резникова, Г.М. Яворская, Киев: Видавничий Дiм Дмитра Бураго, 2009.

8. Вежбицкая А. Язык. Культура. Познание / А. Вежбицкая, Москва: Русские словари,

1996.

9. Евгеньева А.П. Словарь русского языка: В 4-х т. РАН, Ин-т лингвистич. исследований / под ред. А.П. Евгеньевой, 4-е изд., Москва: Русский язык; Полиграфресурсы, 1999.

10. Зализняк Анна А. О понятии семантического перехода // Компьютерная лингвистика и интеллектуальные технологии: Труды междунар. конф. «Диалог'2009» (Бекасово, 27-31 мая 2009 г.). Вып. 8 (15). М.: Издательство РГГУ, 2009.

11. Кашкин Е.В. Семантические особенности глаголов разделения объектов на части в типологической перспективе: дипломная работа. Москва, 2010.

12. Кашкин Е.В. Языковая категоризация фактуры поверхностей (типологическое исследование наименований качественных признаков в уральских языках): дис. ... канд. филол. наук. Москва, 2013.

13. Кибрик А.А. Недискретность в языке и фокальная структура // Ростов-на-Дону: СКНЦ ВШ ЮФУ, 2013. С. 15-18.

14. Кибрик А. Е. Родственные языки как объект типологии // Константы и переменные языка / Кибрик А. Е., СПб: Алетейя, 2003. С. 191—195.

15. Козлов А.А., Кухто А.В., Привизенцева М.Ю. О реальности семантического поля: лексико-типологический подход // Acta Lingüistica Petropolitana. Труды института лингвистических исследований. 2016. № 1 (XII).

16. Кронгауз М.А. Семантика. Учебник для студентов вузов, обучающихся по специальности «Теоретическая и прикладная лингвистика» направления подготовки дипломированных специалистов «Лингвистика и новые информационные технологии» / М.А. Кронгауз, 2-е издание, исправленное и дополненное, Москва: Издательство Академия, 2005.

17. Круглякова В.А. Семантика глаголов вращения в типологической перспективе: дис. ... канд. филол. наук. Москва, 2010.

18. Кузнецов С.А. Большой толковый словарь русского языка / под ред. С.А. Кузнецова, Первое издание, Санкт-Петербург: Норинт, 1998.

19. Кузьменко Е.А., Мустакимова Э.Г. Глаголы падения в лексикотипологической перспективе // Типология морфосинтаксических параметров, сб. трудов конф. / под ред. Е.А. Лютикова, А.В. Циммерлинг, М.Б. Коношенко, Москва: Московский педагогический государственный университет, 2015. С. 149-160.

20. Кустова Г.И. Типы производных значений и механизмы языкового расширения / Г.И. Кустова, М.: Языки славянских культур, 2004.

21. Кюсева М.В. Лексическая типология семантических сдвигов названий качественных признаков 'острый' и 'тупой': дипломная работа. Москва, 2012.

22. Кюсева М.В. Верификация фреймового подхода к лексической типологии с помощью векторных моделей: магистерская диссертация. Москва, 2014.

23. Кюсева М.В., Резникова Т.И., Рыжова Д.А. Типологическая база данных адъективной лексики // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т. / под ред. В.П. Селегей, Москва: РГГУ, 2013. С. 407-419.

24. Кюсева М.В., Резникова Т.И., Рыжова Д.А. Совершенствование одноязычных, двуязычных и мультиязычных словарей: автоматизация процесса сбора материала //

Доклады всероссийской научной конференции АИСТ'2013 / под ред. Е.Л. Черняк [и др.]., Москва: Национальный открытый университет «ИНТУИТ», 2013. С. 225-232.

25. Кюсева М.В., Рыжова Д.А., Холкина Л.С. Прилагательные «легкий» и «тяжелый» в типологической перспективе // КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ труды XVIII Международной конференции «Диалог 2012»: в 2-х томах. 2012. (1). C. 247-255.

26. Кюсева М.В., Рыжова Д.А., Холкина Л.С. Лексическая типология: к проблеме определения границ семантического поля (на примере признаков «толстый» и 'тонкий') // Tipología léxica / под ред. Guzmán Tirado R., Votyakova I., Гранада: Jizo Ediciones, 2013. С. 255-262.

27. Лакомкин Е.Д., Пузыревский И.В., Рыжова Д.А. Анализ статистических алгоритмов снятия морфологической омонимии в русском языке // Доклады всероссийской научной конференции АИСТ'2013 / под ред. Е.Л. Черняк [и др.]. Москва: Национальный открытый университет «ИНТУИТ», 2013. С. 184-195.

28. Лучина Е.С. Пути грамматикализации лексем со значением 'прямой': дипломная работа. Москва, 2014.

29. Лучина Е.С. Векторные методы в лексической типологии: выделение функций частиц группы «прямо»: курсовая работа. Москва, 2015.

30. Ляшевская О.Н., Шаров С.А. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка) / О.Н. Ляшевская, С.А. Шаров, Москва: Азбуковник, 2009.

31. Майсак Т.А., Рахилина Е.В. Глаголы движения в воде: лексическая типология / под ред. Т.А. Майсак, Е.В. Рахилина, Москва: Индрик, 2007.

32. Мельник А.А. Автоматическая разработка анкет для лексико-типологических исследований на материале многоактантных глаголов: дипломная работа. Москва, 2018.

33. Мельчук И.А., Жолковский А.К. Толково-комбинаторный словарь современного русского языка. Опыты семантико-синтаксического описания русской лексики / И.А. Мельчук, А.К. Жолковский, Вена: Wiener Slavistischer Almanach, 1984.

34. Минский М. Фреймы для представления знаний / М. Минский, Москва: Энергия,

1979.

35. Наний Л.О. Прилагательные простейших форм и размеров китайского и русского языков в типологическом аспекте: дис. ... канд. филол. наук. Москва, 2016.

36. Орехов Б.В., Резникова Т.И. Компьютерные перспективы лексико-типологических исследований // Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2015. № 3. C. 17-23.

37. Павлова Е.К. Лексико-типологическое описание признаков «мягкий'-'твердый» в языках разных семей: дипломная работа. Москва, 2014.

38. Падучева Е.В. Динамические модели в семантике лексики / Е. В. Падучева, Москва: Языки славянской культуры, 2004.

39. Плунгян В.А., Рахилина Е.В. [Рец. на:] C. Goddard, A. Wierzbicka (eds.). Semantic and lexical universals: Theory and empirical findings. Amsterdam, 1994 // Вопросы языкознания. 1996. № 3.

40. Плунгян В.А., Рахилина Е.В. К типологии глаголов «летать» и «прыгать» // Глаголы движения в воде: лексическая типология / под ред. Т.А. Майсак, Е.В. Рахилина, Москва: Индрик, 2007. С. 739-748.

41 . Рахилина Е.В. Когнитивный анализ предметных имен / Е.В. Рахилина, Москва: Азбуковник, 2010. 448 c.

42. Рахилина Е.В., Резникова Т.И., Карпова О.С. Семантические переходы в атрибутивных конструкциях: метафлоа, метонимия и ребрендинг // Лингвистика конструкций / под ред. Е.В. Рахилина, Москва: Азбуковник, 2010. С. 396-455.

43. Резникова Т.И. [и др.]. Глаголы звуков животных: типология метафор / под ред. Т.И. Резникова [и др.]. Москва: Языки славянской культуры, 2015. 399 с.

44. Рахилина Е.В., Резникова Т.И. Фреймовый подход к лексической типологии // Вопросы языкознания. 2013. № 2. C. 3-31.

45. Рыжова Д.А. Построение лексико-типологической анкеты с помощью моделей дистрибутивной семантики: магистерская диссертация. Москва, 2014.

46. Рыжова Д.А. Построение лексико-типологической анкеты с помощью моделей дистрибутивной семантики // Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2015. № 3. С. 127-132.

47. Рыжова Д.А. Опыт автоматического построения анкеты для лексико-типологического исследования прилагательных и одноместных глаголов с помощью моделей дистрибутивной семантики // Вестник РГГУ. Серия «История. Филология. Культурология. Востоковедение». 2016. № 9 (18). С. 140-150.

48. Рыжова Д.А. Фантастическая конференция, чудовищный доклад: формирование оценочных значений на базе русской признаковой лексики // Вестник Московского Университета. Серия 9: Филология. 2016. № 4. C. 178-192.

49. Рыжова Д.А., Ершов И.А., Мельник А.А. Автоматический сбор данных для исследований по лексической типологии // Проблемы компьютерной лингвистики и типологии: сб. науч. трудов / под ред. А.А. Кретов. Воронеж: ВГУ, 2017. С. 123-134.

50. Толстая С.М. Семантическая реконструкция и лексическая типология // Славянское языкознание. Доклады российской делегации. Москва: Индрик, 2013. С. 141160.

51 . Фрей А. Грамматика ошибок / А. Фрей, Москва: КомКнига, 2006.

52. Холкина Л.С. Качественные признаки в китайской лексике: опыт типологического описания: дис. ... канд. филол. наук. Москва, 2014.

53. Шапиро М.М. Глаголы колебательного движения в уральских языках (на материале финского, ненецкого и коми-зырянского языков): семантика и типология // Урало-алтайские исследования. 2015. № 1 (16). C. 29-52.

54. Шеманаева О.Ю. [и др.]. Семантические фильтры для разрешения многозначности в Национальном корпусе русского языка: прилагательные // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции "Диалог 2007" / под ред. Л.Л. Иомдин [и др.]. Москва: Издательство РГГУ, 2007. 582-587 с.

55. Шеянова М.В. Компьютерные методы установления границ поля в лексико-типологическом исследовании: курсовая работа. Москва, 2016.

56. Agirre E., Edmonds P. Word Sense Disambiguation: Algorithms and Applications / E. Agirre, P. Edmonds (Eds.), Springer, 2007. 381 p.

57. Anderson L.B. Evidentials, Paths of Change, and Mental Maps: Typologically Regular Asymmetries // Evidentiality: The Linguistic Coding of Epistemology / W.L. Chafe, J. Nichols, Ablex, 1986. P. 273-312.

58. Auwera J. van der, Plungian V. Modality's semantic map // Linguistic Typology. 1998. № 1 (2). P. 79-124.

59. Baroni M. [et al.]. The WaCky wide web: a collection of very large linguistically processed web-crawled corpora // Language Resources and Evaluation. 2009. № 3 (43). P. 209226.

60. Baroni M., Bernardi R., Zamparelli R. Frege in Space: A Program for Compositional Distributional Semantics // Linguistic Issues in Language Technologies. 2014. (9). P. 241-346.

61. Berlin B., Kay P. Basic color terms: Their universality and evolution. / B. Berlin, P. Kay, Berkeley: Univ. of California press, 1969.

62. Bloomfield L. A Set of Postulates for the Science of Language // Language. 1926. № 3 (2). P. 153-164.

63. Brown C.H. Finger and hand. Oxford: Oxford University Press, 2005. P. 526-529.

64. Brown C.H. Hand and arm. Oxford: Oxford University Press, 2005. P. 522-525.

65. Bullinaria J.A., Levy J.P. Extracting semantic representations from word co-occurrence statistics: stop-lists, stemming, and SVD // Behavior Research Methods. 2012. № 3 (44). P. 890907.

66. Comaniciu D., Meer P. Mean shift: a robust approach toward feature space analysis // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2002. № 5 (24). P. 603-619.

67. Croft W. Radical Construction Grammar: Syntactic Theory in Typological Perspective / W. Croft, Oxford University Press, 2001. 448 p.

68. Croft W. The role of domains in the interpretation of metaphors and metonymies // Cognitive Linguistics. 2009. № 4 (4). P. 335-370.

69. Croft W., Poole K.T. Inferring universals from grammatical variation: Multidimensional scaling for typological analysis // Theoretical Linguistics. 2008. № 1 (34). P. 1-37.

70. Cysouw M. Building semantic maps: the case of person marking // New Challenges in Typology: Broadening the Horizons and Redefining the Foundations / M. Miestamo, B. Walchli (Eds.), Walter de Gruyter, 2007. P. 225-248.

71. Dahl O. From questionnaires to parallel corpora in typology // Sprachtypologie und Universalienforschung. 2007. № 2 (60). P. 172-181.

72. Di Sciullo A.-M., Williams E. On the definition of word / A.-M. Di Sciullo, E. Williams, Cambridge, MA: MIT press, 1987.

73. Dinu G., Pham N.T., Baroni M. DISSECT - DIStributional SEmantics Composition Toolkit // Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics: System Demonstrations. Sofia, Bulgaria: Association for Computational Linguistics, 2013. P. 31-36.

74. Divjak D., Gries S.T. Ways of trying in Russian: clustering behavioral profiles // Corpus Linguistics and Linguistic Theory. 2006. № 1 (2). P. 23-60.

75. Dubossarsky H., Weinshall D., Grossman E. Verbs change more than nouns: a bottom-up computational approach to semantic change // Lingue e linguaggio. 2016. № 1. P. 7-28.

76. Eger S. Lexical Semantic Typologies from Bilingual Corpora: A Framework // Proceedings of the First Joint Conference on Lexical and Computational Semantics - Volume 1: Proceedings of the Main Conference and the Shared Task, and Volume 2: Proceedings of the Sixth International Workshop on Semantic Evaluation / Stroudsburg, PA, USA: Association for Computational Linguistics, 2012. P. 90-94.

77. Ester M. [et al.]. A Density-based Algorithm for Discovering Clusters in Large Spatial Databases with Noise // Proceedings of the Second International Conference on Knowledge Discovery and Data Mining / Portland, Oregon: AAAI Press, 1996. P. 226-231.

78. Everitt B. Cluster analysis / B. Everitt, Chichester, West Sussex, U.K.: Wiley, 2011.

79. Fillmore C.J. Frame semantics // Linguistics in the Morning Calm. Seoul, South Korea: Hanshin Publishing Co. 1982. P. 111-137.

80. Fillmore C.J., Atkins B.T. Describing Polysemy: The Case of «Crawl» // Polysemy: Theoretical and Computational Approaches / Y. Ravin, C. Leacock (Eds.), Oxford University Press, 2000. P.91-110.

81. François A. Semantic maps and the typology of colexification: Intertwining polysemous networks across languages // Studies in Language Companion Series / M. Vanhove (Ed.), John Benjamins Publishing Company, 2008. P. 163-215.

82. Frey B.J., Dueck D. Clustering by Passing Messages Between Data Points // Science. 2007. № 5814 (315). P. 972-976.

83. Ganter B., Wille R. Formal Concept Analysis: Mathematical Foundations / B. Ganter, R. Wille, Berlin/Heidelberg: Springer, 1999.

84. Geeraerts D.. [Pe^ Ha:] A. Wierzbicka. Lexicography and conceptual analysis. Ann Arbor, 1985 // Language in society. 1988. V. 17.

85. Geeraerts, D. The lexicographical treatment of prototypical polysemy // Meanings and Prototypes (RLE Linguistics B: Grammar). Routledge, 2014. P. 205-220.

86. Georgakopoulos Thanasis, Polis Stéphane. The semantic map model: State of the art and future avenues for linguistic research // Language and Linguistics Compass. 2018. № 2 (12). P. 1-33.

87. Gibbs R.W. The Cambridge Handbook of Metaphor and Thought / R.W. Gibbs, Cambridge University Press, 2008. 550 p.

88. Goddard C. Semantic Analysis: A Practical Introduction / C. Goddard, Oxford University Press, 2011. 512 p.

89. Cox T.F., Cox M.A.A. Multidimensional Scaling / T.F. Cox, M.A.A. Cox, Chapman and Hall, 2001.

90. Harris Z.S. Co-Occurrence and Transformation in Linguistic Structure // Language. 1957. № 3 (33). P. 283-340.

91. Haspelmath M. Indefinite pronouns / M. Haspelmath, Oxford: Clarendon Press, 1997.

92. Haspelmath M. The geometry of grammatical meaning: semantic maps and cross-linguistic comparison // The new psychology of language. Mahwah, NJ: Lawrence Erlbaum, 2003. P. 211-242.

93. Janda L.A., Solovyev V.D. What constructional profiles reveal about synonymy: A case study of Russian words for sadness and happiness // Cognitive Linguistics. 2009. № 2 (20). P. 367-393.

94. Johnson S.C. Hierarchical clustering schemes // Psychometrika. 1966. № 32 (2). P. 241254.

95. Jurafsky D., Martin J.H. Speech and Language Processing, 2nd Edition / D. Jurafsky, J.H. Martin, 2nd edition, Upper Saddle River, N.J: Prentice Hall, 2008. 1032 p.

96. Kashkin E., Vinogradova O. The domain of surface texture // The Typology of Physical Qualities / E. Rakhilina, T. Reznikova (Eds.), John Benjamins Publishing Company, to appear.

97. Kay P. [et al.]. World Color Survey / P. Kay, B. Berlin, L. Maffi, W. Merrifield, Center for the Study of Language and Information, 2007.

98. Keenan, E. L., & Comrie, B. Noun phrase accessibility and universal grammar // Linguistic inquiry. 1977. № 8(1). P. 63-99.

99. Key M.R., Comrie B. IDS - The Intercontinental Dictionary Series. 2007.

100. Kholkina L. Lexical typology of Chinese qualitative features // The Typology of Physical Qualities / E. Rakhilina, T. Reznikova (Eds.), John Benjamins Publishing Company, to appear.

101. Kibrik A.A. Toward a typology of verbal lexical systems: A case study in Northern Athabaskan // Linguistics. 2012. № 3 (50). P. 495-532.

102. Kibrik, A. E. Does intragenetic typology make sense? // Sprache im Raum und Zeit: in memoriam Johannes Bechert. Bd. 2: Beiträge zur empirischen Sprachwissenschaft / W. Boeder et al. (Eds.), Tübingen: Narr, 1998. P. 61-68.

103. Kilgarriff A. [et al.]. Itri-04-08 the sketch engine // Information Technology. 2004. № 105. P. 116.

104. Kopecka A., Narasimhan B. Events of Putting and Taking: A crosslinguistic perspective / A. Kopecka, B. Narasimhan, John Benjamins Publishing Company, 2012. 389 p.

105. Koptjevskaja-Tamm M., Divjak D., Rakhilina E. Aquamotion verbs in Slavic and Germanic: A case study in lexical typology // New Approaches to Slavic Verbs of Motion / V. Hasko, R. Perelmutter (Eds.), John Benjamins Publishing, 2010. P. 315-341.

106. Koptjevskaja-Tamm M., Rakhilina E., Vanhove M. The semantics of lexical typology // The Routledge Handbook of Semantics / N. Riemer (Ed.), 2016. P. 434-454.

107. Kozlov A., Privizentseva M. Typology of dimensions // The Typology of Physical Qualities / E. Rakhilina, T. Reznikova (Eds.), John Benjamins Publishing Company, to appear.

108. Kutuzov A., Kuzmenko E. Comparing Neural Lexical Models of a Classic National Corpus and a Web Corpus: The Case for Russian // Lecture Notes in Computer Science / Springer,

2015. P. 47-58.

109. Kyuseva M., Parina E., Ryzhova D. Methodology at work: semantic fields «sharp» and «blunt» // The Typology of Physical Qualities / E. Rakhilina, T. Reznikova (Eds.), John Benjamins Publishing Company, to appear.

110. Lakoff G., Johnson M. Metaphors we live by / G. Lakoff, M. Johnson, Chicago; London, 1980.

111. Lakoff G., Turner M. More than cool reason: A field guide to poetic metaphor / G. Lakoff, M. Turner, Chicago, 1989.

112. Levin I., Reznikova T. Lexical typology in Slavic languages / Encyclopedia of Slavic Languages and Linguistics, Brill, to appear.

113. Levinson, S. C., & Majid, A. Differential ineffability and the senses // Mind & Language. 2014. № 29(4). P. 407-427.

114. Lin D., Pantel P. DIRT - Discovery of Inference Rules from Text // Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining / New York, NY, USA: ACM, 2001. P. 323-328.

115. List J.-M. [et al.]. CLICS: Database of Cross-Linguistic Colexifications [Электронный ресурс]. URL: http://CLICS.lingpy.org (дата обращения: 19.02.2018).

116. Loukachevitch N. [et al.]. Creating Russian WordNet by Conversion // Proceedings of Conference on Computatilnal linguistics and Intellectual technologies Dialog-2016. Moscow,

2016. P. 405-415.

117. MacQueen J. Some methods for classification and analysis of multivariate observations // Proc. 5th Berkeley Symp. on Math. Statistics and Probability, 1967. P. 281-297.

118. Majid A. Comparing lexicons cross-linguistically // The Oxford Handbook of the Word / J.R. Taylor (Ed.), Oxford: Oxford University Press, 2015. P. 364-379.

119. Majid A., Bowerman M. Cutting and breaking events: A crosslinguistic perspective [Special issue] // Cognitive linguistics. № 18 (2). 2007.

120. Majid A., Enfield N.J., Staden M. van. Parts of the body: Cross-linguistic categorisation. [Special issue]. // Language Sciences. 2006. № 2-3 (28). P. 137-360.

121. Majid A., Jordan F., Dunn M. Semantic systems in closely related languages // Language Sciences. 2015. (49). P. 1-18.

122. Majid A. [h gp.]. How similar are semantic categories in closely related languages? A comparison of cutting and breaking in four Germanic languages // Cognitive Linguistics. 2007. № 2 (18). P. 179-194.

123. Miller G.A. WordNet: A Lexical Database for English // Communications of the ACM. 1995. № 11 (38). P. 39-41.

124. Mitchell J., Lapata M. Composition in Distributional Models of Semantics // Cognitive Science. 2010. № 8 (34). P. 1388-1429.

125. Newman J. The Linguistics of Giving / J. Newman (Ed.), Amsterdam & Philadelphia: John Benjamins, 1998. 384 p.

126. Newman J. Semantic shift // The Routledge Handbook of Semantics / N. Riemer (Ed.),

2015. P.266-280.

127. Nudds, M. Is audio-visual perception 'amodal' or 'crossmodal'? // Perception and its modalities / D. Stokes, M. Matthen, & S. Biggs (Eds.), Oxford: Oxford University Press, 2015. P.166-188.

128. Ostling R. Studying colexification through massively parallell corpora // The Lexical Typology of Semantic Shifts / P. Juvonen, M. Koptjevskaja-Tamm (eds.), Walter de Gruyter,

2016. P. 157-176.

129. Pado S., Lapata M. Dependency-Based Construction of Semantic Space Models // Computational Linguistics. 2007. № 2 (33). P. 161-199.

130. Paperno D., Pham N.T., Baroni M. A practical and linguistically-motivated approach to compositional distributional semantics // Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), Baltimore, Maryland: Association for Computational Linguistics, 2014. P. 90-99.

131. Peirsman Y., Geeraerts D. Metonymy as a prototypical category // Cognitive Linguistics. 2006. № 3 (17). P. 269-316.

132. Rakhilina E. Verbs of rotation in Russian and Polish // New Approaches to Slavic Verbs of Motion / V. Hasko, R. Perelmutter (Eds.), John Benjamins Publishing, 2010. P. 291314.

133. Rakhilina E., Merle J.-M., Chahine I.K. Verba sonandi : étude de la représentation linguistique des cris d'animaux / E. Rakhilina, J.-M. Merle, I. Kor Chahine (Eds.), Presses Universitaires de Provence, 2017.

134. Rakhilina E., Reznikova T. A Frame-based methodology for lexical typology // The Lexical Typology of Semantic Shifts / P. Juvonen, M. Koptjevskaja-Tamm (Eds.), Walter de Gruyter GmbH & Co KG, 2016. P. 95-129.

135. Rakhilina E., Vyrenkova A., Orekhov B. New approach to «old» studies // The Typology of Physical Qualities / E. Rakhilina, T. Reznikova (Eds.), John Benjamins Publishing Company, to appear.

136. Regier T., Khetarpal N., Majid A. Inferring semantic maps // Linguistic Typology. 2013. № 1 (17). P. 89-105.

137. Reznikova T., Krugliakova V., Panina A. The domain of wetness and its difference from other domains of physical qualities // The Typology of Physical Qualities / E. Rakhilina, T. Reznikova (Eds.), John Benjamins Publishing Company, to appear.

138. Reznikova T., Vyrenkova A. Semantics of falling: a cross-linguistic approach. // NRU HSE. Series WP BRP "Linguistics". 2015. № 40.

139. Ryzhova D. [et al.]. Automatic data collection in lexical typology. // Proceedings of Conference on Computatilnal linguistics and Intellectual technologies Dialog-2018 [Publication on the conference website], Moscow, 2018.

140. Ryzhova D., Kyuseva M., Paperno D. Typology of Adjectives Benchmark for Compositional Distributional Models // Proceedings of the Language Resources and Evaluation Conference, 2016. P. 1253-1257.

141. Ryzhova D., Obiedkov S. Formal concept lattices as semantic maps // Aachen: CEUR Workshop Proceedings, 2017. P. 78-87.

142. Ryzhova D., Paperno D. Constructing typological questionnaire with distributional semantic models // The Typology of Physical Qualities / E. Rakhilina, T. Reznikova (Eds.), John Benjamins Publishing Company, to appear.

143. Ryzhova D., Rakhilina E., Kholkina L. Approaching perceptual qualities: The case of HEAVY // Perception metaphor / L.J. Speed [et al.] (Eds.), John Benj amins Publishing Company, 2019.

144. Sahlgren M. The distributional hypothesis // Italian Journal of Linguistics. 2008. № 20. P. 33-53.

145. Sakhno S. Les 100 racines essentielles du russe / S. Sakhno, Paris: Ellipses, 2005.

146. Salton G. Developments in Automatic Text Retrieval // Science. 1991. № 5023 (253). P. 974-980.

147. Schütze H. Automatic Word Sense Discrimination // Computational Linguistics. 1998. № 1 (24). P. 97-123.

148. Sejane I., Eger S. Semantic typologies by means of network analysis of bilingual dictionaries // Approaches to measuring linguistic differences / L. Borin, A. Saxena (Eds.), De Gruyter Mouton, 2013. P. 447-474.

149. Singh Y. Loria. Automatic Treatment of Adjectives for Computational Lexicography. France, 2017. Manuscript.

150. Speed L.J. [h gp.]. Perception Metaphors / L.J. Speed [h gp.] (Eds.), John Benjamins Publishing Company, 2019.

151. Sweetser E. From etymology to pragmatics: metaphorical and cultural aspects of semantic structure / E. Sweetser, Cambridge: CUP, 1990.

152. Tomasello M. First verbs: A case study of early grammatical development / M. Tomasello, Cambridge: Cambridge University Press, 1992.

153. Trier J. Der deutsche Wortschatz im Sinnbezirk des Verstandes: von den Anfängen bis zum Beginn des 13. Jahrhunderts. / J. Trier, Winter, 1931.

154. Viberg Ä. Posture verbs: A multilingual contrastive study // Languages in Contrast. 2013. № 2 (13). P. 139-169.

155. Viberg Ä. Seeing the lexical profile of Swedish through multilingual corpora: The case of Swedish äka and other vehicle verbs // Advances in Corpus-based Contrastive Linguistics: Studies in honour of Stig Johansson / K. Aijmer, B. Altenberg (Eds.), John Benjamins Publishing Company, 2013. P. 25-56.

156. Wälchli B., Cysouw M. Lexical typology through similarity semantics: Toward a semantic map of motion verbs // Linguistics. 2012. № 3 (50). P. 671-710.

157. Wierzbicka A. Semantic Primitives / A. Wierzbicka, (Frankfurt/M.)Athenäum-Verl.,

158. Youn H. [et al.]. On the universal structure of human lexical semantics // Proceedings of the National Academy of Sciences. 2016. № 7 (113). P. 1766-1771.

Приложение 1. Анкета для поля 'острый'

Фрейм Микрофрейм Словосочетание для дистрибутивного представления (русскоязычный корпус) Словосочетание для дистрибутивного представления (англоязычный корпус)

прямые значения острый инструмент с режущим краем острый нож острый_нож sharp_knife

острый меч острый_меч sharp_sword

острая сабля острый_сабля sharp_saber

острое лезвие острый_лезвие sharp_blade

острая коса острый_коса sharp_scythe

острые ножницы острый_ножницы sharp_scissors

острая пила острый_пила sharp_saw

острый инструмент с колющим концом острая иголка острый_иголка sharp_needle

острая стрела острый_стрела sharp_arrow

острый коготь острый_коготь sharp_claw

острый кол острый_кол sharp_pole

острая спица острый_спица sharp_knitting_ needle

острая палка острый_палка sharp_stick

острое копье острый_копье sharp_spear

острый зуб острый_зуб sharp_tooth

острый ноготь острый_ноготь sharp_nail

острый рог острый_рог sharp_horn

предмет, суживающийся к концу острый нос острый_нос sharp_nose

острый носок ботинка острый_носок sharp_shoe_tip

острая гора острый_гора sharp_peak

острый локоть острый_локоть sharp_elbow

острый клюв острый_клюв sharp_beak

острый колпак острый_колпак pointed_cap

острый подбородок острый_ подбородок sharp_chin

острый каблук острый_каблук pointed_heel

острая мачта острый_мачта pointed_mast

колющаяся поверхность/ колющийся предмет острый шип острый_шип sharp_thorn

колючее одеяло колючий_одеяло prickly_blanket

колючая щетина колючий_щетина prickly_bristle

колючая шерсть колючий_шерсть prickly_wool

колючий куст колючий_куст thorny_bush

колючий свитер колючий_свитер prickly_sweater

переносные значения геометрическая форма острый угол острый_угол sharp_angle

полоса, резко меняющая направление крутой поворот крутой_поворот sharp_turn

крутой изгиб крутой_изгиб sharp_bend

крутая излучина реки к руто й_и злучина sharp_bend

отвесный, обрывистый, крутой склон крутой подъем крутой_подъем sharp_rise

крутой склон крутой_склон steep_slope

крутой берег крутой_берег steep_bank

крутая гора крутой_гора steep_mountain

четкая линия/изображ ение с четкими линиями четкая линия четкий_линия sharp_line

четкая фотография четкий_фотография sharp_picture

резкий контраст резкий_контраст sharp_contrast

четкая картинка четкий_картинка sharp_image

сильные очки сильный_очки strong_glasses

умный, хорошо соображающий (о человеке) проницательный человек проницательный_ человек sharp_man

острый ум острый_ум sharp_wit| acute_mind | keen_mind

острый, проницательный взгляд проницательный_ взгляд sharp_eye

проницательный наблюдатель проницательный_ наблюдатель keen_observer

умная девочка умный_девочка sharp_girl| keen_girl

умная голова умный_голова clever_head

остроумный, язвительный, меткий человек острый журналист острый_журналист sarcastic_journalist

острое слово острый_слово poignant_word

острый язык острый_язык sharp_tongue

острое высказывание острый_высказыва ние sharp_utterance

острый критик острый_критик sharp_critic

острое замечание острый_замечание sharp_remark

острая критика острый_критика sharp_criticism

острая статья острый_статья harsh_article

острый анекдот острый_анекдот harsh_anecdote

грубый, жестокий, резкий человек резкий_человек abrupt_person

резкий (о человеке) резкий взгляд резкий_взгляд abrupt_look

резкое слово резкий_слово harsh_word

резкая реакция резкий_реакция harsh_reaction

резкая брань резкий_брань harsh_verbal_abuse

грубый ответ грубый_ответ harsh_answer

грубая бесцеремонность грубый_ бесцеремонность sharp_arrogance

грубый циннизм грубый_цинизм sharp_cynicism

строгий (о человеке) строгий закон строгий_закон stringent_law

строгий правитель строгий_правитель strict_ruler

строгий распорядок строгий_ распорядок strict_schedule

строгое наказание строгий_наказание severe_punishment

строгая диета строгий_диета strict_diet

непоседливый (о человеке) непоседливый ребенок непоседливый_ ребенок restless_child

узкоспециализи рованное исследование узкоспециализиров анное исследование узкоспециализиров анный_ исследование specialized_research

узкоспециализиров анная работа узкоспециализиров анный_работа specialized_work

блюдо с большим острый соус острый_соус hot_sauce

количеством

специй и пряностей острый вкус острый_вкус spicy_taste

острый перец острый_перец hot_pepper

газированный напиток газированный напиток газированный_ вода sparkling_water

газированная вода газированный_ напиток sparkling_drink

неприятно действующий на органы резкий звук резкий_звук jarring_sound

чувств: звук острый визг острый_визг jarring_scream

резкий голос резкий_голос shrill_voice

резкий лай резкий_лай jarring_bark

резкий храп резкий_храп jarring_snore

неприятно действующий на органы чувств:вкус резкий вкус резкий_вкус sharp_taste

неприятно резкий свет резкий_свет sharp_light

действующий

на органы

чувств:свет резкая вспышка резкий_вспышка sharp_flash

острый блеск острый_блеск sharp_glint

неприятно резкая вонь резкий_вонь sharp_stench |

действующий на органы sharp_stink

чувств:запах резкий запах резкий_запах sharp_smell

высокий звук высокий звук высокий_звук high_sound

высокая нота высокий_нота high_note

яркий цвет цвет яркий_цвет bright_color

синева яркий_синева bright_blue

оттенок яркий_оттенок bright_hue

сильный запах сильный запах сильный_запах strong_smell

сильный аромат сильный_аромат strong_aroma

яркий свет яркий свет яркий_свет bright_light

яркое солнце яркий_солнце bright_sun

хорошо функционирую щий орган чувств острый слух острый_слух good_hearing | sharp_hearing | keen_hearing

острое зрение острый_зрение good_eyesight| sharp_eyesight| keen_eyesight

хорошие глаза хороший_глаз good_eye

хорошие уши хороший_ухо good_ear

острый нюх острый_нюх good_nose

отчетливое острое ощущение острый_ощущение poignant_sensation

ощущение острое осознание острый_осознание sharp_realization | keen_realization

сильная острое желание острый_желание keen_desire

эмоция острая ревность острый_ревность intense_jealousy

острая зависть острый_зависть intense_envy

острая обида острый_обида intense_resentment

острое стремление острый_ стремление intense_aspiration

погодное острый мороз острый_мороз sharp_frost

явление,

проявляющеес

я в высокой степени резкий ветер резкий_ветер sharp_wind

сильный холод сильный_холод sharp_chill

сильная жара сильный_жара strong_heat

требующий острая проблема острый_проблема actual_problem | sharp

немедленного разрешения _problem

острая нехватка острый_нехватка acute_shortage

острый вопрос острый_вопрос sharp_question

интенсивное физиологическ ое ощущение острая боль острый_боль sharp_pain

острая жажда острый_жажда excessive_thirst

острый недосып острый_недосып acute_sleep_ deprivation

острая дрожь острый_дрожь severe_tremor

острая слабость острый_слабость severe_weakness

сильная болезнь острое воспаление острый_ воспаление acute_inflammation

острый грипп острый_грипп severe_flu

острое заболевание острый_ заболевание acute_disease

острое расстройство острый_ расстройство acute_disorder

острый аппендицит острый_ аппендицит acute_appendicitis

напряженный (о острый конфликт острый_конфликт acute_conflict

взаимодействи ях) острый момент острый_момент tense_moment

острое сопротивление острый_ сопротивление sharp_opposition

острый спор острый_спор sharp_debate

острая перепалка острый_перепалка sharp_squabble

интенсивный по степени проявления (о острое любопытство острый_ любопытство acute_curiosity

качествах человека) острая наблюдательность острый_ наблюдательность acute_outsight

острая впечатлительность острый_ впечатлительность acute_susceptibility

острая гордость острый_гордость acute_pride

резкое резкий подъем резкий_подъем sharp_raise

изменение резкий спад резкий_спад sharp_decline

внезапное, быстрое резкий взмах резкий_взмах abrupt_stroke

движение резкий вздох резкий_вздох abrupt_sigh

резкое движение резкий_движение abrupt_movement

резкий бросок резкий_бросок abrupt_throw

резкий скачок резкий_скачок abrupt_shift

быстрый (о скорости) быстрый темп быстрый_темп quick_pace|fast_pace

быстрый бег быстрый_бег fast_run

Приложение 2. Анкета для поля 'гладкий'

Фрейм Микрофрейм Словосочетание для дистрибутивного представления

прямые значения Скользкая опорная поверхность, покрытая льдом Скользкая заледеневшая дорога скользкий_дорога

Скользкие заледеневшие ступеньки скол ьзкий_ступ енька

Скользкая опорная поверхность, не покрытая льдом Скользкий мокрый пол скользкий_пол

Скользкая полка в бане скользкий_полка

Скользкая лестница скользкий_лестница

Скользкий паркет скользкий_паркет

Поверхность предмета, выскальзывающего из рук Скользкая рыба (только что пойманная) скользкий_рыба

Скользкое мыло скользкий_мыло

Скользкий мокрый мяч скользкий_мяч

Скользкие грибы скользкий_гриб

Скользкие руки скользкий_рука

Скользкий черенок лопаты (по которому скользят руки) скользкий_черенок

Скользкая обувь и подошва обуви Скользкая подошва скользкий_подошва

Скользкие сапоги скользкий_сапог

Скользкие ботинки скользкий_ботинок

Участок местности без зрительно заметных неровностей ровное место (обширный участок местности) ровный_место

ровная степь ровный_степь

ровный луг ровный_луг

ровная тундра ровный_тундра

ровный покос ровный_покос

Участок местности без холмов и гор Плоское место (нет холмов и гор) плоский_место

Плоская местность плоский_местность

Плоский ландшафт плоский_ландшафт

Гладкие поверхности тактильно воспринимаемых предметов: артефакты гладкая доска гладкий_доска

гладкий камень гладкий_камень

гладкая дужка кровати гладкий_дужка

гладкая миска гладкий_миска

Гладкие поверхности тактильно воспринимаемых предметов: части тела гладкая кожа (у девушки) гладкий_кожа

гладкая шерсть (у собаки) гладкий_шерсть

гладкие щеки (чисто выбритые) гладкий_щека

гладкий подбородок (чисто выбритый) гладкий_подбородок

гладкие волосы (хорошо причесанные) гладкий_волосы

гладкие перышки птицы гладкий_перышко

Ровная дорога (нет выбоин, ухабов на поверхности) Ровная дорога (заасфальтированная) ровный_дорога

Ровное шоссе ровный_шоссе

Ровная тропинка ровный_тропинка

Ровный, хорошо накатанный зимник ровный_зимник

Поверхность воды в водоеме Гладкая поверхность воды в озере (при штиле) гладкий_поверхность

Зрительно воспринимаемые поверхности артефактов: горизонтальные Ровный пол ровный_пол

Ровный потолок ровный_потолок

Ровный настил ровный_настил

Зрительно воспринимаемые поверхности артефактов: вертикальные Ровная стена ровный_стена

Ровный забор ровный_забор

Переносные значения Ненадежность: сфера деятельности Скользкий вопрос (неприятно обсуждать) скользкий_вопрос

Скользкий путь (жизненный) скользкий_путь

Скользкая тема скользкий_тема

Ненадежность: человек Скользкий тип (может обмануть, подвести) скользкий_тип

Льстивый человек льстивый_человек

Болтливый человек болтливый_человек

Быстрота, легкость выполнения действия Красноречивый человек красноречивый_человек

Ловкий человек ловкий_человек

Сообразительный человек сообразительный_человек

Отсутствие недостатков, затруднений: характеристика человека Красивая девушка красивый_девушка

Стройная девушка стройный_девушка

Добрый человек добрый_человек

Мягкий человек мягкий_человек

Аккуратный человек аккуратный_человек

Красивый парень красивый_парень

Стройный парень стройный_парень

Красивый человек красивый_человек

Стройный человек стройный_человек

Отсутствие недостатков, затруднений:вкус Приятный вкус (+ сочетаемость с названиями естественных для информанта блюд) приятный_вкус

Равномерность: статичные объекты Ровно расставленные стулья. ровный_стул

Равные расстояния между селами. ровный_расстояние

Ровный загар. ровный_загар

Одинаково хорошее качество стабильный_качество

Равные промежутки времени. равный_промежуток

Равномерность: действия, процессы Ровный звук (всё время одинаковый). ровный_звук

Ровный ритм ровный_ритм

Постоянная скорость постоянный_скорость

Ровное гудение ровный_гудение

Ровное дыхание ровный_дыхание

Ровная линия, край Ровная линия (прямая) ровный_линия

Прямая дорога прямой_дорога

Отсутствие ресурса, отличительных качеств; малая интенсивность Гладкая ткань (без рисунка) гладкий_ткань

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.