Язык русской и башкирской поэзии XX века в свете дистрибутивного подхода тема диссертации и автореферата по ВАК РФ 10.02.20, кандидат наук Гречачин, Виталий Андреевич
- Специальность ВАК РФ10.02.20
- Количество страниц 176
Оглавление диссертации кандидат наук Гречачин, Виталий Андреевич
СОДЕРЖАНИЕ
Введение
Глава 1. Актуальные вопросы изучения текстов при помощи компьютерных технологий
1.1. Основные понятия и задачи прикладной лингвистики
1.2. Корпусный анализ как основной метод современного изучения языка
1.3. Модели и алгоритмы автоматической обработки лингвистических данных
Выводы по главе 1
Глава 2. Формализация распределения языковых единиц при изучении языков
2.1. Дистрибутивные семантические модели естественных языков
2.2. Прикладные парсеры в корпусных исследованиях
2.3. Статистические модели при сопоставительном анализе языков
Выводы по главе 2
Глава 3. Сопоставительный анализ распределения языковых данных
в текстах русской и башкирской поэзии XX в
3.1. Структурные особенности корпусов поэтических текстов XX века на русском и башкирском языках
3.2. Сопоставительный анализ ключевых слов в русской и башкирской
поэзии XX века
3.3. Сопоставительный анализ дистрибутивных моделей русской и
башкирской поэзии XX века
Выводы по главе 3
Заключение
Библиография
Приложения
Рекомендованный список диссертаций по специальности «Сравнительно-историческое, типологическое и сопоставительное языкознание», 10.02.20 шифр ВАК
Формализация естественного языка в машинном переводе с опорой на дополнительный корпус родственного языка2017 год, кандидат наук Мифтахова, Рамиля Габдулхаевна
Корпусная лингвистика и контекстное разрешение лексической многозначности слов2004 год, кандидат филологических наук Магомедова, Адигат Нурахмагаджиевна
Роль и функции контекстологического словаря в алгоритмической обработке контрактов и международных соглашений: на материале английского языка2007 год, кандидат филологических наук Сушилин, Алексей Анатольевич
Репрезентация категории пространства в русском, башкирском и английском языках2022 год, кандидат наук Канафина Айзиля Расулевна
Дистрибутивность семантики лексических параметров знака2002 год, доктор филологических наук Серебрякова, Светлана Васильевна
Введение диссертации (часть автореферата) на тему «Язык русской и башкирской поэзии XX века в свете дистрибутивного подхода»
Введение
В связи с развитием информационных технологий и увеличением количества информации растет потребность и в автоматическом анализе больших массивов данных. Инструменты такого анализа проникают во все сферы человеческой деятельности, и лингвистика не является исключением. Специфика основного объекта и предмета изучения лингвистики - языка, представленного текстом - требует соответствующего специфического подхода. С целью внедрения формальных моделей и алгоритмов в лингвистический контекст для автоматической обработки естественных языков во второй половине XX века начались активные исследования в этой области. Наибольший вклад в развитие теоретической базы автоматической обработки естественных языков внесла работа профессоров Стэнфордского университета Д. Журавски и К. Маннинга. Среди русскоязычных стоит отметить работы Ю.Н. Марчука и А.Л. Семенова, которые внесли весомый вклад в развитие отечественной прикладной лингвистики.
Несмотря на активную разработку методов обработки и анализа текстов, многие лингвистические дисциплины оставляют без внимания потенциал использования инструментария автоматической обработки естественных языков, чему и посвящено настоящее исследование.
Актуальность исследования. В основе предлагаемого подхода лежит идея использования инструментов автоматической обработки естественных языков и статистики для проведения сопоставительного анализа двух разноструктурных языков с целью определения национально-специфических черт функционирования лингвистических единиц и семантики. В рамках данного исследования разработана методика сопоставительного анализа двух языков на материале корпуса текстов с применением инструментов автоматической обработки языка, статистического анализа текстовых данных и дистрибутивных моделей. Также разработан набор программных инструментов для осуществления предобработки и анализа массивов текстов.
Объектом исследования выступают коллекции текстов русской и башкирской поэзии XX века, анализируемые при помощи предложенного подхода с целью выявления результативности данной модели обработки языка.
Предметом исследования становятся автоматическая обработка языка, направленная на предобработку данных для сопоставительного исследования, инструменты описательной статистики для описания функционирования лингвистических единиц, статистические подходы для извлечения ключевых слов и коллокаций, которые способны описать исследуемые тексты с точки зрения частотного распределения лексики, а также дистрибутивные семантические модели.
Цель диссертационного исследования связана с разработкой программного инструмента для извлечения данных, необходимых для описания особенностей языковой картины мира, национальной специфики изучаемых языковых единиц, семантики, отраженной в поэтических текстах, особенностей функционирования лингвистических единиц в русском и башкирских языках; исследованием формальных моделей, наиболее подходящих для сопоставительного анализа.
Для реализации поставленной цели необходимо решить следующие задачи:
- выявить современные методы предобработки текстовых данных, необходимых для квантитативного анализа;
- дать типологическое описание существующих подходов автоматической обработки естественных языков и выделить из них доминирующие;
- разработать программу морфологического анализа и лемматизации для башкирского языка, необходимую для осуществления предобработки данных;
- выявить основные способы извлечения необходимых данных для проведения сопоставительного исследования разноструктурных языков;
- выявить особенности использования дистрибутивных семантических моделей;
- разработать программный инструмент для извлечения необходимых данных из коллекций текстов русской и башкирской поэзии XX века;
- апробировать использование анализа частного распределения лингвистических единиц, использование способов извлечения ключевых слов и коллокаций, использование дистрибутивных семантических моделей для проведения сопоставительного исследования.
Цель и задачи настоящей работы обусловили применение соответствующих методов исследования: для предобработки текстовых данных, анализа данных и разработки программы были использованы язык программирования Python версии 3.6.5 и пакет nltk 3.3 (Natural Language Toolkit), пакет морфологического анализатора русского языка pymorphy2 0.8, пакет машинного обучения scikit-learn 0.19.1 с открытым исходным кодом, метод сопоставительного анализа языковых единиц изучаемых разноструктурных языков, метод описательной статистики, метод количественного анализа, метод исследования семантики на основе дистрибутивной модели, метод корпусного анализа.
Материалом исследования послужили поэтические тексты на русском и башкирском языках, написанные или изданные в период 1900-2000 гг.
Научная новизна диссертационного исследования заключается в том, что впервые:
• в его рамках обоснована целесообразность использования лингвистических корпусов для сопоставительного анализа разноструктурных языков;
• обоснована целесообразность приложения теории графов к морфологии агглютинативных языков;
• обоснована целесообразность применения статистических и дистрибутивных моделей и квантитативного анализа для выявления
национально-специфических черт функционирования лингвистических единиц и семантики;
• выявлено, что ключевые слова, извлеченные из количественных данных частотного распределения лексики, могут быть использованы для характеристики того периода времени, когда написаны анализируемые тексты;
• выявлено, что дистрибутивные семантические модели могут быть использованы для поиска ассоциативного ряда слов, относящихся к одному концепту, и, соответственно, для описания языковой картины мира;
• проведен сопоставительный анализ частотного распределения лексики, ключевых слов, дистрибутивных семантических моделей в текстах русской и башкирской поэзии XX века.
Предложенные методы автоматической обработки языка, статистики, программирования могут быть использованы для сопоставительного анализа других разноструктурных языков.
Теоретическая значимость исследования обусловлена переложением методов и приложений компьютерной лингвистики и статистики в контекст сопоставительных исследований разноструктурных языков; предложенной методикой проведения сопоставительного исследования; исследованием методов автоматической обработки естественных языков и статистического анализа данных и определении наиболее оптимального подхода. Диссертационное исследование вносит вклад в развитие теоретических подходов к формализации сопоставительных исследований. Предложенные методы автоматической обработки языка, статистики, программирования могут быть использованы для сопоставительного анализа других разноструктурных языков
Практическая ценность данной работы заключается в том, что полученные результаты могут быть использованы для дальнейшего изучения методов обработки и анализа текстовых данных в контексте сопоставительных
исследований языков; для обогащения поискового функционала существующих русскоязычных и башкироязычных корпусов. Результаты данной работы могут быть использованы в переводоведении и преподавании русского и башкирского языков в качестве иностранных.
Теоретической и методологической основой исследования послужили труды отечественных и зарубежных ученых в области:
компьютерной и корпусной лингвистики (А.Н. Арапов, Д. Байбер, С. Конрад, В.А. Плунгян, Р. Рэппен, У.Э. Френсис, В.П. Захаров, С.Ю. Богданова, Д.°Журавски, К. Маннинг и др.);
дистрибутивной семантики (Т. Ландауэр, Т. Миколов, Дж.Р. Ферс, З. Харрис, М. Шалгрен, Х. Шутс и др.);
лингвистической семантики, прагматики и сопоставительной лингвистики (А. Вежбицкая, В.В. Виноградов, В.Г. Костомаров, М.А. Кронгауз, И.М. Кобозева и др.);
а также научные разработки крупных IT-компаний Google, Yandex, Facebook.
Основные положения, выносимые на защиту:
1. Лингвистические корпуса разноструктурных языков могут быть использованы для проведения сопоставительных исследований с целью выявления национально-специфических особенностей языковых единиц. Количественные признаки частотного распределения лексики могут быть использованы для извлечения ключевых слов из массивов текстов с целью содержательного описания исследуемых текстов.
2. Ключевые слова, извлеченные из данных о частотном распределении лексики в текстах, написанных в один и тот же период времени, дают полную характеристику социальной, политической, идеологической и культурной жизни в стране, относятся к одному и тому же концепту и репрезентируют языковую картину мира автора произведения и самого художественного текста в указанный период времени.
3. Частотное распределение морфем и корреляционный анализ выявляют числовые данные, характеризующие структуру исследуемого языка, а сопоставительный анализ этих данных позволяет определить основные различия в структуре исследуемых языков.
4. Предложенная сетевая модель агглютинативной морфологии, нашедшая применение в программе морфологического парсинга текстов, написанных на башкирском языке, может быть использована для описания морфологии башкирского языка.
Основная гипотеза, выдвигаемая в диссертационном исследовании, заключается в том, что степень семантической близости между двумя лингвистическими единицами А и В есть функция схожести лингвистических контекстов, в которых могут употребляться А и В, и она не зависит от структуры изучаемого языка.
Апробация работы. Основные положения диссертационного исследования были представлены на Второй Московско-Тартуской школе по цифровым гуманитарным исследованиям «Тексты. Сети. Карты» (Москва, 2017), на научном форуме «Наука будущего - наука молодых» (Казань, 2016), Международной научно-практической конференции «Интеграция образования, науки и производства» (Актобе, 2016), XVI Всероссийской конференции «Актуальные проблемы диалектологии языков народов России» (Уфа, 2016), Международной научно-методической конференции «Актуальные проблемы русской и сопоставительной филологии: теория и практика» (Уфа, 2016), IV международной научно-методической конференции «Межкультурная ^ интракультурная коммуникация: теория и практика обучения и перевода» (Уфа, 2015).
Диссертационное исследование обсуждалось на заседании кафедры русской и сопоставительной филологии факультета башкирской филологии и журналистики Башкирского государственного университета. По материалам настоящего исследования опубликовано 10 печатных работ, из них 3 работы -
в журналах, рекомендованных ВАК (Гречачин, В.А. Сетевая модель агглютинативной морфологии / В.А.Тречачин // Международный научно-исследовательский журнал. - 2018. - №°1 (67) Ч. 4. - С. 101-105. doi: 10.23670/Ш.2018.67.132; Саитбатталов, И.Р. Лексика М.-А. Чукури в статистическом освещении / И.Р. Саитбатталов, В.А.Тречачин // Международный научно-исследовательский журнал. - 2016. - №°12 (54) Ч. 2. - С. 76-78. doi: 10.18454/Ш.2016.54.016; Гречачин, В.А. К вопросу о токенизации текста / В.А.Тречачин // Международный научно-исследовательский журнал. - 2016. - №°6 (48). Ч. 4. - С. 25-27. doi: 10.18454ЛЮ.2016.48.070), получено 2 свидетельства о государственной регистрации программы ЭВМ, создан интернет-ресурс oldturkicmorph.herokuapp.com.
Структура работы определяется целями и задачами, поставленными в исследовании. Диссертация состоит из введения, трех глав, заключения и библиографии (160 наименований).
Глава 1. Актуальные вопросы изучения текстов при помощи
компьютерных технологий
1.1. Основные понятия и задачи прикладной лингвистики
Если рассмотреть историю развития языкознания, то обнаружится, что в этой науке четко обозначены три ветки исследовательских направлений, и у каждой своя цель. Теоретическое направление языкознания занимается фундаментальными исследованиями, которые раскрывают внутренние структуры языка и коммуникативных процессов. На основе этих исследований строятся теоретические модели языка. В описательном направлении языкознания конечной целью ставится конкретное описание процессов, происходящих в языке, а в прикладном направлении - приложение теоретических моделей языка к другим нелингвистическим научным дисциплинам, а также применение знаний о языке в различных сферах деятельности человека.
Эти три ветки исследовательских направлений взаимодействуют и оказывают влияние друг на друга. Например, понимание структуры языка невозможно без описания явлений, которые являются реальным воплощением этой структуры, а приложение моделей языка, например, в области математики или информатики - без теоретического осмысления моделей.
Взаимосвязь исследовательских направлений в современной лингвистике все более усиливается. Так, необходимость решения ежедневных практических задач требует соединения фундаментальных исследований с прикладными, а последние, в свою очередь, ставят новые актуальные проблемы перед теоретиками.
Прикладная лингвистика является отражением человеческих потребностей в различных сферах жизнедеятельности. Поэтому она объединяет деятельность представителей различных дисциплин, которые
занимаются решением актуальных практических задач. Развитие технологий снабдило лингвистов солидным инструментарием для использования моделей языка на практике. Сегодня активно развиваются системы распознавания речи и голосового управления, синтезаторы речи, системы автоматического извлечения информации из любого текста, поисковые системы в Интернете, машинный перевод и т.д. Подобные явления ставят перед лингвистами новые задачи. В этих сферах деятельности лингвист является не просто ученым, но и инженером. Он конструктор и разработчик. Не стоит забывать и о других интенсивно развивающихся областях, таких как лингводидактика, практическая стилистика, искусственные языки, языковое планирование и методы лечения речевых расстройств.
Прикладная лингвистика сегодня рассматривается как «деятельность по приложению научных знаний об устройстве и функционировании языка в нелингвистических научных дисциплинах и в различных сферах практической деятельности человека, а также теоретическое осмысление такой деятельности» [Баранов 2001]. Такое понимание термина «прикладная лингвистика» охватывает всю полноту задач, которые ставят перед этой дисциплиной приверженцы различных национальных традиций. В Европе аналогами данного термина можно считать англ. Applied Linguistics и нем. Angewandte Linguistik, которые используются прежде всего для обозначения теории и практики преподавания языков, куда включаются методика преподавания, особенности описания грамматики для обучения и особенности преподавания языка как иностранного или родного. Ярким примером можно считать School of Applied Languages в Дублине. Это учебное заведение фактически является институтом иностранных языков. В России прикладная лингвистика стала известна и востребована прежде всего благодаря появлению первых ЭВМ для обработки текстовой информации, главными задачами которых были машинный перевод и реферирование текста. Поэтому с 1950 г. в русскоязычной литературе термин «прикладная лингвистика» используется в том же значении, что и «вычислительная лингвистика»,
«компьютерная лингвистика», «автоматическая лингвистика», а чаще не используется совсем, уступая место перечисленным выше терминам. Такая подмена значений и неконкретность терминологии вызывает путаницу. Каждая из названных дисциплин располагает свойственными только ей предметами и методами исследования, но в рамках прикладной лингвистики.
Прикладная лингвистика как отдельная дисциплина (раздел языкознания) возникла в недавнем прошлом (около 1920 г.). Но проблемы прикладного характера в языкознании появились гораздо раньше. Например, необходимость поддержания традиции чтения (сегодня - скорочтение), формирования определенного понимания священных писаний (экзегетика и герменевтика), необходимость осуществления коммуникации между народами обусловливали потребность в практической пользе и конкретных результатах лингвистических исследований. А.Н. Баранов определяет основную задачу прикладной лингвистики как оптимизацию функций языка: «С функциональной точки зрения прикладная лингвистика может быть определена как научная дисциплина, в которой изучаются и разрабатываются способы оптимизации функционирования языка» [Баранов 2001].
Методы прикладной лингвистики разнообразны и отличаются в конкретных областях приложения языкознания. Так в квантитативной лингвистике основные методы исследования опираются на инструменты статистики, компьютерная лингвистика использует программирование и базы данных и т.п. Но важнейшим свойством всех методов прикладной лингвистики является оптимизация. «Под оптимизацией понимается такое описание (модель) проблемной области, при котором эта область сохраняет в результирующем представлении только те существенные свойства, которые необходимы для данной практической задачи» [Баранов 2001]. То есть прикладное описание направлено исключительно на решение конкретной задачи. Важнейшим методом прикладной лингвистики можно назвать моделирование. Прикладное моделирование не охватывает весь язык и
теоретические знания о нем, оно ориентировано на конкретные языковые уровни.
Например, в компьютерной лингвистике при создании морфологических анализаторов учитывается морфологический уровень языка, а остальные уровни (фонетический, лексический, синтаксический, семантический, экстралингвистический) могут не учитываться вовсе. Так, для конкретной задачи морфологического парсинга достаточно знать, что язык состоит из слов, слова состоят из минимально значимых единиц - морфем, которые, в свою очередь, обладают значением и определенными правилами сочетаемости, отражающимися в морфемных цепочках. То есть морфологический парсинг основывается на морфологической модели языка.
Прикладные модели требуют большой степени формализации и, как мы увидели выше, используют выборочные знания о языке. В отличие от теоретических моделей, которые стремятся охватить все аспекты языка, прикладные допускают определенную степень «огрубления».
Прикладная лингвистика опирается также на методы описательной и теоретической лингвистики. Описывая факты языка, лингвистика выявляет закономерности, классифицирует их, то есть пытается осмыслить и понять структуру языка. Благодаря этому лингвистические знания могут быть приложены в различных научных областях.
С точки зрения гносеологической функции язык рассматривается нами как способ хранения и передачи знания. Согласно В.А. Звегинцеву, в рассматриваемой функции язык служит для дискретизации знаний и их объективизации [Звегинцев 1996]. Кроме того, язык является и отражением национального взгляда на мир. Одним из ключевых понятий здесь является языковой знак.
Знак во многих словарях определяется как материальный предмет (явление, событие), выступающий в качестве представителя некоего другого предмета или свойства. В нашем случае знак будет пониматься прежде всего в рамках языка. Языковая специфика знака возникает только на почве учения
о разумно-жизненном знаке, то есть знак должен рассматриваться как явление динамическое. Тогда данное выше определение следовало бы расширить: знак - материальный предмет (явление, событие), выступающий в качестве представителя некоего другого предмета, который выступает представителем некоего другого предмета, который ... и т.д. Знак понимается нами с точки зрения дуалистической, которая разделяет материальное и идеальное. Таким образом, мы находим в знаке элементы, которые могут существовать только с позиции дуалистического восприятия мира.
Знак обладает транслирующей функцией. М.К. Петров в своей теории социального кодирования рассматривал знак в качестве носителя смысла, знания [Петров 1991]. Он утверждал, что все в составе социальности, передающееся от поколения к поколению, фиксируется в знаке. Например, отец учит сына удить рыбу, рассказывая, как обращаться с удочкой. В данном случае речь отца - текст, фиксирующий правила использования удилища. Такое понимание знака - это диахрония, то есть знак рассматривается в эволюционном процессе. Вторая функция знака - коммуникативная. Языковые обозначения, использованные отцом, который учит сына удить рыбу, воспроизводят нечто в сознании сына.
Исходя из этого, определим, как прикладная лингвистика оптимизирует его гносеологическую функцию. Не только лингвистам необходимо фиксировать знания, которые содержит язык. Можно с уверенностью сказать, что практически все люди хотя бы раз в жизни заглядывали в словарь, чтобы найти там нужное определение слова или перевод. Словари фиксируют знания, которые хранятся в языке. Словари строятся по определенным методам, разработкой которых занимается прикладная дисциплина лексикография. Под словарем обычно понимается организованное определенным образом собрание слов с соответствующими комментариями. Например, слова могут сопоставляться с толкованиями значений и употреблений. Помимо слов, словари могут содержать описания их
компонентов (морфемные словари) или различные словосочетания с толкованиями (фразеологические словари).
Кроме того, лексикография занимается разработкой технологий составления словарей. На сегодняшний день наиболее актуальными являются компьютерные технологии. Так возникли электронные словари, которые могут храниться на носителе или доступ к которым можно получить в Интернете.
С оптимизацией гносеологической функции связана терминография. Предметом исследования и описания этой дисциплины является терминология, в широком понимании охватывающая все термины естественного языка, а в узком - термины конкретной научной дисциплины или специальной области деятельности человека. Терминография занимается составлением терминологических стандартов, терминологических словарей. Таким образом. она может регулировать употребление терминов в различных областях.
С оптимизацией гносеологической функции также связана корпусная лингвистика [Захаров 2011]. Эта дисциплина на сегодняшний день наиболее востребована среди лингвистов. Корпусная лингвистика становится основой верификации теоретических моделей языка. Кроме того, современные корпусы могут объединять в себе многие инструменты и наработки лексикографии и терминографии.
Подробное описание задач корпусной лингвистики приводится в следующем разделе. Они относятся не только к оптимизации гносеологической функции языка, но затрагивают и другие функции.
В последнее десятилетие благодаря компьютерным технологиям возникла целая область исследования, связанная с оптимизацией гносеологической функции языка. Это цифровые гуманитарные науки. Исследования в этой сфере обеспечивают сохранность культурного и литературного наследия с помощью цифровых технологий.
С оптимизацией когнитивной функции языка связана компьютерная и квантитативная лингвистика. Под компьютерной лингвистикой обычно понимается область использования различных программных инструментов, связанных с технологиями структурирования и обработки данных, которые направлены на моделирование языковых явлений. А квантитативная лингвистика характеризуется использованием количественных и статистических методов анализа. Речь идет, например, о частотном распределении слов в тексте и подсчете лексики, что позволяет добавлять в прикладную лингвистику вероятностный компонент.
Как научное направление компьютерная лингвистика возникла в 1960-е годы. Это продукт практического использования языкознания с применением знаний математического и компьютерного моделирования, а также программирования. Главная точка соприкосновения данных наук - мышление и сознание. Если языкознание рассматривает процессы, происходящие в сознании человека при коммуникативном акте, то компьютерная лингвистика при помощи математического и компьютерного моделирования пытается решить ряд определенных задач, которые должны привести к формированию компьютерной модели языка и сознания, то есть к созданию искусственного интеллекта. В англоязычной литературе инструменты компьютерной, квантитативной лингвистики объединяют в дисциплину «обработка естественного языка», или Natural Language Processing (NLP) [Jurafsky, Martin 2000].
Одна из ключевых идей в исследованиях обработки языка за последние полвека заключается в том, что теоретические знания о языке могут быть задействованы с использованием узких формальных моделей или теорий. Эти модели и теории исходят из стандартных средств информатики, математики. Среди важных элементов таких средств можно выделить конечные автоматы, системы формальных правил, логику, а также теорию вероятности и другие средства машинного самообучения. Эти модели, в свою очередь, поддаются небольшому количеству алгоритмов из хорошо известных вычислительных
принципов. Среди них наиболее важными являются алгоритмы поиска в пространстве состояний и алгоритмы динамического программирования.
Похожие диссертационные работы по специальности «Сравнительно-историческое, типологическое и сопоставительное языкознание», 10.02.20 шифр ВАК
Лексико-семантическая репрезентация категории деструктивности в русском и башкирском языках2020 год, кандидат наук Гизатуллин Данил Эдуардович
Семантизация историко-культурного компонента в учебном мультимодальном словаре (на материале русского / английского языков)2022 год, кандидат наук Башмакова Анастасия Юрьевна
Лексика, отражающая растительный мир в башкирском и английском языках1999 год, кандидат филологических наук Хизбуллина, Диля Ишбуловна
Вербализация концепта Madness (безумие) в английском языке: когнитивно-корпусные и лингвокультурологические аспекты2011 год, кандидат филологических наук Селин, Сергей Васильевич
Теория и методология сопоставительного когнитивно-семиотического корпусного исследования парцелляции во французских и русских печатных СМИ2016 год, кандидат наук Богоявленская, Юлия Валерьевна
Список литературы диссертационного исследования кандидат наук Гречачин, Виталий Андреевич, 2018 год
Библиография
1. Александровская, Л.Н., Кириллин, А.В. Рекомендации по применению ряда критериев проверки отклонения распределения вероятностей от нормального закона в практике инженерного статистического анализа // Известия Самарского научного центра РАН. - 2017. № 1-1 [Электронный ресурс] - Режим доступа: https://cyberleninka.ru/article/n/rekomendatsii-po-primeneniyu-ryada-kriteriev-proverki-otkloneniya-raspredeleniya-veroyatnostey-ot-normalnogo-zakona-v-praktike.
2. Арапов, М.В. Квантитативная лингвистика. - М.: Наука, 1988. - 184 с.
3. Баранов, А.В. Введение в прикладную лингвистику. - М.: Эдиториал УРСС, 2001. - [Электронная книга].
4. Баранов, А.В., Паршин, П.Б. Языковые механизмы вариативной интерпретации действительности как средство воздействия на сознание // Роль языка в средствах массовой коммуникации. - М., 1986. - [Электронная книга].
5. Ванюшкин, А.С., Гращенко, Л.А. Методы и алгоритмы извлечения ключевых слов // Новые информационные технологии в автоматизированных системах. - 2016. № 19 [Электронный ресурс] - Режим доступа: https://cyberleninka.ru/article/n/metody-i-algoritmy-izvlecheniya-klyuchevyh-slov.
6. Васнев, С.А. Статистика: Учебное пособие. - М.: МГУП, 2001. - 170
с.
7. Витгенштейн, Л. Философские работы / Пер. с нем. М.С. Козловой и Ю.А.°Асеева. - М.: Гнозис, 1994. - [Электронная книга].
8. Галина, И.В., Козеренко, Е.Б., Морозова, Ю.И., Сомин, Н.В., Шарнин,°М.М. Ассоциативные портреты предметной области - инструмент автоматизированного построения систем Big Data для извлечения знаний: теория, методика, визуализация, возможное применение // Информатика и ее применение. - Т. 9. Вып. 2. - М.: ИПИ РАН, 2015. - С. 93-110.
9. Гарбовский, Н.К. Теория перевода. — М.: Изд-во Моск. ун-та, 2004. —
544°с.
10. Герасимов, В.Н., Марчук, Ю.Н. Машинный перевод в системе научно-технического перевода. - В кн.: МСМП. - С. 4.
11. Грамматика современного башкирского литературного языка / Под ред. А.А. Юлдашева. - М.: Наука, 1981. - 495 с.
12. Гречачин, В.А. К вопросу о токенизации текста / В.А. Гречачин // Международный научно-исследовательский журнал. - 2016. - № 6 (48). Ч. 4.
- С. 25-27. doi: 10.18454/IRJ.2016.48.070.
13. Гречачин, В.А. Сетевая модель агглютинативной морфологии / В.А.°Гречачин // Международный научно-исследовательский журнал. - 2018.
- №°1 (67). Часть 4. - С. 101-105. doi: 10.23670/IRJ.2018.67.132.
14. Гржибовский, А.М. Корреляционный анализ // Экология человека. -2008. № 9 [Электронный ресурс] - Режим доступа: https://cyberleninka.ru/article/n/korrelyatsionnyy-analiz.
15. Грязнухина, Т.А. Исследование семантических отношений между компонентами словосочетаний с помощью трансформационного анализа. (На основе аппликативной порождающей модели). - М.: Просвещение, 1983. - 174 с.
16. Гурова, Ю.И. Фразеологизмы античного происхождения. // Санкт-Петербургский гуманитарный университет профсоюзов. - Innovative views of young scientists '2015. - 5 с.
17. Добровольский, Д.О. Корпус параллельных текстов как инструмент анализа литературного перевода // Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции. -Диалог, 2003, М., 2003. [Электронный ресурс] - Режим доступа: http://www.dialog-21.ru/Archive/2003/Dobrovolskij.pdf.
18. Евтеев, С.В. Лингвокультурологическая модель перевода // Вестник Брянского государственного университета. № 2. - 2014. - С. 3.
19. Епрев, А.С. Автоматическая классификация текстовых документов // МСиМ, 2010. - № 1 (21). [Электронный ресурс] - Режим доступа: https://cyberleninka.ru/article/n/avtomaticheskaya-klassifikatsiya-tekstovyh-dokumentov-1.
20. Зализняк, А.А. Грамматический словарь русского языка. Издание 4-е, исправленное и дополненное. - М.: Русские словари, 2003. - 795 с.
21. Захаров, В.П., Богданова, С.Ю. Корпусная лингвистика. - Иркутск: ИГЛУ, 2011. - [Электронная книга].
22. Звегинцев, В.А. Мысли о лингвистике. - М.: Просвещение, 1996. -[Электронная книга].
23. Звегинцев, В.А. Мысли о лингвистике. // УРСС, 2008. - Журнал Language and languages. - [Электронная книга].
24. Звегинцев, В.А. Теоретическая и прикладная лингвистика. - М.: Просвещение, 1968. - [Электронная книга].
25. Златоустова, Л.В. Фонетические единицы русской речи. - М., 1981. - В кн.: Звучащий текст. -М., 1983. - С. 76-87.
26. Зубкова, Т.И. Психолингвистика. Прикладное языкознание. - СПб., 1996. - [Электронная книга].
27. Зубов, А.В. Автоматический словарь с нежесткими связями. // В кн.: МСМП. - С. 138.
28. Зубов, А.В., Зубова, И.И. Информационные технологии в лингвистике: учеб. пособие для студ. вузов. - М.: Академия, 2004. - 208 с.
29. Ингве, В.Г. Синтаксис и проблема многозначности. // В кн.: Машинный перевод. - М., 1957. - С. 281-304.
30. Каде, О. Проблемы перевода в свете теории коммуникации // Вопросы теории перевода в зарубежной лингвистике. - М: Международные отношения, 1978. - С. 69-90.
31. Карпилович, Т.П. Автоматический анализ технического текста путем построения семантических моделей. // В кн.: МСМП. - С. 94.
32. Карпилович, Т.П. Автоматическое порождение предложений на основе детерминированных и вероятностных правил. // В кн.: СТОПИЛ. - С. 76.
33. Карпов, В.А. Язык как система. - Изд. 3 АН СССР. - 2009. - 304 с.
34. Катфорд, Дж.К. Лингвистическая теория перевода: Об одном аспекте прикладной лингвистики. - УРСС Эдиториал. - 2004. - 208 с.
35. Кипяткова, И.С. Применение синтаксического анализа при создании п-граммной модели языка для систем распознавания русской речи / И.С. Кипяткова // Труды 5 междисциплинарного семинара «Анализ разговорной русской речи». - СПб., 2011. - С. 13-18.
36. Кирьянов, Д.П., Орехов, Б.В. Сетевой подход к описанию башкирской морфологии / Д.П. Кирьянов, Б.В. Орехов // Вестник Приамурского государственного университета им. Шолом-Алейхема, 2015. -№ 3 (20). - С. 23-40.
37. Козеренко, Е.Б., Лунева, Н.В., Галина, И.В., Морозова, Ю.И. Лингвистические и металингвистические представления в интеллектуальных многоязычных системах // Журнал «Искусственный интеллект». - НАН Украины, 2011. - Т. 3. - С. 123-135.
38. Козеренко, Е.Б., Лунева, Н.В., Морозова, Ю.И., Ермаков, П.В. Проектирование многоязычного лингвистического ресурса для систем машинного перевода и обработки знаний // Системы и средства информатики. - Вып. 19. - М.: Наука, 2009. - С. 119-141.
39. Комиссаров, В.Н. Теория перевода (лингвистические аспекты): Учеб. для ин-тов и фак. иностр. яз. - М.: Высш. шк., 1990. - 253 с.
40. Компьютерра, 2002, № 21. Тема номера: «Ты меня понимаешь?» Проблемы машинного перевода. - С. 26-37.
41. Кондрашова, Д.С. Теория сегментной репрезентации дискурса для решения задач судебной лингвистической экспертизы при извлечении из текста имплицитной информации. - Труды международной конференции «Диалог 2006». - С. 95.
42. Коробейникова, Н.Н. Коллокации с темпоральным наречием immediately: корпусно-ориентированный подход // Вестник ИГЛУ. - 2013. № 4 (25). [Электронный ресурс] - Режим доступа: https://cyberleninka.ru/article/n/konokatsn-s-temporalnym-narecMem-immediately-korpusno-orientirovannyy-podhod.
43. Королев, Э.И. Об автоматическом распознавании логических предикатов // Машинный перевод и прикладная лингвистика. - М., 1972. -Вып. 15. - С. 172-186.
44. Корпусная лингвистика. Теория. - Корпусная лингвистика, Институт лингвистических исследований РАН, 2008. [Электронный ресурс] - Режим доступа: http:// corpora.iling.spb.ru/theory.htm.
45. Корпусная лингвистика. - Фонд знаний «Ломоносов». [Электронный ресурс] - Режим доступа: http://www.lomonosov-fund.ru/enc/ru/encyclopedia: 01210: article.
46. Кочеткова, Н.А. Статистические языковые методы. Коллокации и коллигации // Новые информационные технологии в автоматизированных системах. - 2013. - № 16. [Электронный ресурс] - Режим доступа: https://cyberleninka.ru/article/n/statisticheskie-yazykovye-metody-kollokatsii-i-kolligatsii.
47. Крылов, С.А., Старостин, С.А. Актуальные задачи морфологического анализа и синтеза в интегрированной информационной среде STARLING // По материалам ежегодной международной конференции «Диалог». 2003. [Электронный ресурс] - Режим доступа: http://www.dialog-21.ru/media/2655/krylov.pdf.
48. Кузнецов, П.С., Ляпунов, А.А., Реформатский, А.А. Основные проблемы машинного перевода. - Вопросы языкознания, 1956. - № 5.
49. Кулагина, О.С. Исследования по машинному переводу. - М.: Наука,
1979.
50. Кулагина, О.С. О роли А.А. Ляпунова в развитии работ по машинному переводу в СССР. - Проблемы кибернетики, 1977. Вып. 32 (в
переработанном и дополненном варианте - в книге «Очерки истории информатики в России». - Новосибирск, ОИГГМ СО РАН, 1998).
51. Латышев, Л.К. Технология перевода // Учеб. пособие для студ. лингв, вузов и фак. - 2-е изд., перераб. и доп. - М.: Издательский центр «Академия», 2005. - 320 с.
52. Лекомцев, Ю.К. Введение в формальный язык лингвистики. - Изд. 3 АН СССР. - 1983. - 264 с.
53. Ляпунов, А.А., Кулагина, О.С. Использование вычислительных машин для перевода с одного языка на другой. - Природа, 1955. - № 8.
54. Миньяр-Белоручев, Р.К. Общая теория перевода и устный перевод. -М.: Воениздат, 1980. - 237 с.
55. Морозова, Ю.И. Извлечение переводного словаря значимых словосочетаний из параллельных текстов с использованием методов дистрибутивной семантики // Новые информационные технологии в автоматизированных системах: материалы шестнадцатого научно-практического семинара. - М.: Моск. ин-т. электроники и математики НИУ «Высшая школа экономики», 2013. - С. 268-272.
56. Морозова, Ю.И. Извлечение переводных соответствий из корпуса параллельных текстов с использованием методов дистрибутивной семантики // Материалы трудов международной конференции «Корпусная лингвистика-2013». - Спб.: С.-Петербургский гос. университет, филологический факультет, 2013. - С.°379-386.
57. Морозова, Ю.И. Моделирование трансформаций предикативных структур при французско-русском и русско-французском машинном переводе // Новые информационные технологии в автоматизированных системах: материалы пятнадцатого научно-практического семинара. - Моск. гос. ин-т. электроники и математики. - М., 2012. - С. 170-175.
58. Морозова, Ю.И. Построение семантических векторных пространств различных предметных областей // Информатика и ее применения. - Т. 7. Вып. 1. - М.: ИПИ РАН, 2013. - С. 90-93.
59. Найда, Ю.Я. К науке переводить // Вопросы теории перевода в зарубежной лингвистике. Сборник статей. - М.: Международные отношения, 1978.
60. Налимов, В.В. Вероятностная Модель Языка. О соотношении естественных и искусственных языков. - М.: Наука, 1979. - 304 с.
61. Нелюбин, Л.Л. Лингвостилистика современного английского языка (учебное пособие). - М.: МОПИ им. Н.К. Крупской, 2000. - 110 с.
62. Нелюбин, Л.Л. Перевод и прикладная лингвистика. - М.: Высшая школа, 1998. - 207 с.
63. Нелюбин, Л.Л. Толковый переводоведческий словарь. - М.: Флинта, Наука, 2003. - 320 с.
64. Новый словарь методических терминов и понятий (теория и практика обучения языкам). Э.Г. Азимов, А.Н. Щукин. - М.: Издательство ИКАР, 2009. — [Электронная книга].
65. Объекты и типы данных R: таблицы данных / R: Анализ и визуализация данных. [Электронный ресурс] - Режим доступа: Шрв://г-analytics.blogspot.eom/2011/07/r_22.html#.WyO6rfZuKUm.
66. Оре, О. Теория графов / О. Оре - М.: Наука, 1968. - 336 с.
67. Панов, Д.Ю. Автоматический перевод. - М., Изд. АН СССР, 1958. -[Электронная книга].
68. Панов, Д.Ю., Ляпунов, А.А., Мухин, И.С. Автоматизация перевода с одного языка на другой: Сессия по научным проблемам автоматизации производства. - М.: изд. АН СССР, 1956. - С. 19-21.
69. Папуша, И.С. Сложное синтаксическое целое: ключевые слова или гермы // Вестник ассоциации вузов туризма и сервиса. - 2008. № 3. [Электронный ресурс]. - Режим доступа: https://cyberleninka.ru/article/n/slozhnoe-sintaksicheskoe-tseloe-klyuchevye-slova-Ш^егту.
70. Петров, М.К. Язык. Знак. Культура. - М.: Наука, 1991. - 328 с.
71. Пиотровский, Р.Г. Текст. Машина. Человек. - Л.: Наука, 1975. - 244
с.
72. Плунгян, В.А. Зачем нужен национальный корпус русского языка? Неформальное введение // Национальный корпус русского языка: 2003-2005. - М.: Индрик, 2005. - С. 6-20.
73. Программа автоматического анализа башкирской морфологии: тэбриклэнем / Б. Орехов. [Электронный ресурс] - Режим доступа: http://nevmenandr.net/cgi-bin/bashmorphweb.py.
74. Ревзин, И.Н., Розенцвейг, В.Ю. Основы общего и машинного перевода. - М., 1964.
75. Резников, И.А. Обзор алгоритмов автоматического извлечения ключевых слов из текста // Московский государственный университет им. М.В. Ломоносова. Вычислительный центр им. А.А. Дородницына РАН. [Электронный ресурс] - Режим доступа: http://conf58.mipt.ru/static/reports_pdf/499.pdf.
76. Рецкер, Я.И. Очерки лингвистической теории перевода. - М.: Р. Валент, 2007. - С. 92.
77. Рецкер, Я.И. Теория перевода и переводческая практика. - М.: Международные отношения, 1974. - 216 с.
78. Рыбаков, М.А. Задачи, методы и актуальные проблемы типологической лингвистики // Вестник РУДН, серия «Лингвистика», № 8, 2006. - С. 37-46.
79. Саитбатталов, И.Р. Лексика М.-А. Чукури в статистическом освещении / И.Р. Саитбатталов, В.А. Гречачин // Международный научно-исследовательский журнал. - 2016. - № 12 (54). Часть 2. - С. 76-78. [Электронный ресурс] - Режим доступа: https://research-journal.org/languages/leksika-m-a-chukuri-v-statisticheskom-osveshhenii/.
80. Сегаран, Т. Программируем коллективный разум. - М.: Символ-Плюс, 2008. - 368 с.
81. Седых, А.П. Лингвокультурология и модели перевода // Вестник Нижегородского государственного лингвистического университета им.°Н.А.°Добролюбова. - Вып. 5. Лингвистика и межкультурная коммуникация. - С. 7.
82. Селиванова, Е.А. Основы лингвистической теории текста и коммуникации - Монографическое учебное пособие. - К.: ЦУЛ, «Фитосоциоцентр», 2002. - 336 с.
83. Семенов, А.Л., Современные информационные технологии и перевод. - М.: Издательский центр «Академия», 2008. - 224 с.
84. Сиразитдинов, З.А. Моделирование грамматики башкирского языка. Словоизменительная система / З.А Сиразитдинов. - Уфа: АН РБ, Гилем, 2006. - 160°с.
85. Словарь лингвистических терминов: Изд. 5-е, испр-е и дополн. / Т.В.°Жеребило. - Назрань: Пилигрим, 2010. - 486 с.
86. Соколов, А.Н. Способы перевода метонимии / А.Н. Соколов // Language and Literature. - Вып. 18. - С. 13.
87. Соснина, Е.П. Параллельные корпусы в обучении языку и переводу. [Электронный ресурс] - Режим доступа: http://ling.ulstu.ru/linguistics/resourses/literature/articles/corpus.
88. Способы нормализации переменных / Портал искусственного интеллекта. [Электронный ресурс] - Режим доступа: http: //neuronus .com/theory/931 -sposoby-normalizatsii-peremennykh.html.
89. Стеблин-Каменский, М.И. Значение машинного перевода для языкознания. В сб.: Материалы по машинному переводу. Сб. 1. - Л., Изд. ЛГУ, 1958.
90. Тарануха, В.Ю. Метод построения n-граммной модели, адаптированной для славянских языков // Инновации в науке: сб. ст. по матер. XXXIII Междунар. науч.-практ. конф. - № 5 (30). - Новосибирск: СибАК, 2014. - С. 102.
91. Тюленев, С. Что перевод системе? Что ему она? - Логос, 2012. - № 3 (87). - С. 105.
92. Тутубалин, В.Н. Теория вероятностей и случайных процессов. - М.: МГУ, 1992. - 398 с.
93. Успенский, В.А. Серебряный век структурной, прикладной и математической лингвистики в СССР и В.Ю. Розенцвейг. Как это начиналось (заметки очевидца) - в кн.: Очерки истории информатики в России. -Новосибирск, НИЦ ОИГГМ СО РАН, 1998. - [Электронная книга].
94. Убин, И.И. Современные средства автоматизации перевода: надежды, разочарования и реальность. - Сб. «Перевод в современном мире».
- ВЦП, 2001. - С. 60-68.
95. Федоров, А.В. Основы общей теории перевода (лингвистические проблемы): для институтов и факультетов иностр. языков. Учеб. пособие. / 5-е изд. - СПб.: Филологический факультет СПбГУ; М.: ООО Издательский дом «ФИЛОЛОГИЯ ТРИ», 2002. - 416 с.
96. Федюченко, Л.Г. Терминологические цепочки в текстовом и словарном определении понятия «менеджмент» / Л. Г. Федюченко // Language and Literature. - Вып. 17. - С. 11.
97. Фролов, Н.К. Научные стили речи в компьютерном дискурсе // Language and Literature. - Вып. 17. - С. 6.
98. Хомский, Н. Аспекты теории синтаксиса - М.: Издательство МГУ, 1972. - 227 с.
99. Хохлова, М.В. Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов (на базе корпусов текстов) [Текст]: автореф. дис. ... канд. филол. наук / М.В. Хохлова. - СПб., 2010. - 26 с.
100. Что такое Открытый Корпус? / OpenCorpora. [Электронный ресурс]
- Режим доступа: http://opencorpora.org/?page=about.
101. Шарнин, М.М., Сомин, Н.В., Кузнецов, И.П., Морозова, Ю.И., Галина°И.В., Козеренко, Е.Б. Статистические механизмы формирования
ассоциативных портретов предметных областей на основе естественноязыковых текстов больших объемов для систем извлечения знаний // Информатика и ее применение. - Т. 7. Вып. 2. - М.: ИПИ РАН, 2013. - С. 9299.
102. Швейцер, А.Д. Перевод и лингвистика. - М., 1973. - С. 29-31.
103. Швейцер, А.Д. Теория перевода: статус, проблемы, аспекты. - М.: Наука, 1988. - 215с.
104. Щербак, А. Грамматический очерк языка тюркских текстов X-XIII вв. из Восточного Туркестана / А. Щербак - Ленинград: АН СССР, 1961. - 204 с.
105. Экономико-математический словарь: Словарь современной экономической науки. / Под ред. Л.И. Лопатникова. - М.: Дело., 2003. -[Электронная книга].
106. Юсупова, Н.И. Алгоритмическое и программное обучение для анализа тональности текстовых сообщений с использованием машинного обучения // Вестник УГАТУ, 2012. - [Электронная книга].
107. Языкознание: От Аристотеля до компьютерной лингвистики / Владимир Алпатов. - М.: Альпина нон-фикшн, 2018. - 253 с.
108. Якобсон, Р. Типологические исследования и их вклад в сравнительно-историческое языкознание // Новое в лингвистике. - М., 1963. -[Электронная книга].
109. Barsalou Lawrence W. et al. Language and simulation in conceptual processing. / Barsalou Lawrence W., Ava Santos, W. Kyle Simmons, Christine D. Wilson // In de Vega Manuel et al. - 2008. - P. 245-283.
110. Borovsky, A. Elman, J.L. Language input and semantic categories: A relation between cognition and early word learning. / Borovsky Arielle, Jeffrey L. Elman // Journal of Child Language. - 2006. - № 33. - P. 759-790.
111. Brants, T., Popat A.C., Xu, P., Och, F.J., Dean, J. Large language models in machine translation. - Proceedings of the EMNLP-CoNLL, 2007. - P. 858-867.
112. Brown, P.F., Pietra, S.A.D., Pietra, V.J.D., and Mercer, R.L. The mathematics of statistical machine translation. Computational Linguistics. - 1993. -P. 263-313.
113. Cannon, S., Daymude, J. A Markov Chain Algorithm for Compression in Self-Organizing Particle Systems. [Электронный ресурс]. - Режим доступа: https://arxiv.org/abs/1603.07991?context=cs.
114. Chen, S.F., Joshua, G. An Empirical Study of Smoothing Techniques for Language Modeling. Computer Speech and Language. - Vol. 13, 1999. - P. 359394. [Электронный ресурс] - Режим доступа: http://dx.doi.org/10.1006/csla. 1999.0128.
115. Church, K.W., Gale, W.A. A Comparison of the Enhanced Good-Turing and Deleted Estimation Methods for Estimating Probabilies of English Bigrams. Computer Speech and Language. - Vol. 5, 1991. - P. 19-54. [Электронный ресурс] - Режим доступа: http://dx.doi.org/10.1016/0885-2308(91)90016-J.
116. Collins, A.M., Quillian, M. R. Retrieval time from semantic memory. / Collins Allan M., M. Ross Quillian // Journal of Verbal Learning and Verbal Behaviour. - 1969. № 2(8). - P. 240-248.
117. Collins, M. Three generative, lexicalized models for statistical parsing. //In Proceedings of ACL 35. - 1997.
118. Diez, D.M., Barr, C.D., Cetinkaya-Rundel, M. Openlntro statistics. -CreateSpace, 2012. - Т. 12.
119. Dornyei, Z. Research Methods in Applied Linguistics. OUP, 2007. -[Electronic book].
120. Dorr, B.J., Klavans, J. Building lexicons for machine translation. - I. Machine translation № 9. - P. 221-250.
121. Elman, J.L. Distributed representations, simple recurrent networks, and grammatical structure / J.L. Elman // Machine Learning, 1991. - P. 195-224.
122. Elman, J.L. On the meaning of words and dionosaur bones: Lexical knowledge without a lexicon / J.L. Elman // Cognitive Science. - 2009. - 33. - P. 1-36.
123. Erk, K., Pado, S. A Structured Vector Space Model for Word Meaning in Context. / Erk Katrin, Sebastian Pado // Proceedings of EMNLP - 2008.
124. Farkas, I., Li, P. A self-organizing neural network model of the acquisition of word meaning. / Farkas Igor, Ping Li // Proceedings of the 4th International Conference on Cognitive Modeling, 2001.
125. Fellbaum Christiane WordNet: An electronic lexical database. -Cambridge, MA: MIT Press. - 1998.
126. Firth, J.R. A synopsis of linguistic theory 1930-1955. / J.R. Firth // Studies in Linguistic Analysis. Oxford: Philological Society, 1957. - P. 1-32.
127. Gale, W., Church, K.W. A Program for Aligning Sentences in Parallel Corpora. Proceedings of the 29th Annual Meeting on Association for Computational Linguistics (ACL'91). - 1991. - P. 177-184.
128. Germann, U., Jahr, M., Knight, K., Marcu, D., and Yamada, K. Fast decoding and optimal decoding for machine translation. In Proceedings of ACL 39. - 2001.
129. Ghaffari, A., Masoudi, R. Software defined networks: A survey Journal of Network and Computer Applications 67. - P. 1-25.
130. Glenberg, A., Robertson, D.A. Symbol grounding and meaning: a comparison of high-dimensional and embodied theories of meaning. / Glenberg Arthur M., David A. Robertson // Journal of Memory and Language. - 2000. - № 344). - P. 379-401.
131. Harnad, S. The symbol grounding problem. Physica D. - 1990. - № 43. - P. 335-346.
132. Harris, Z. Methods in Structural Linguistics. - Chicago: University of Chicago Press, 1951. - [Electronic book].
133. Jenkins, J.J. Transitional organization: association techniques / In Osgood, C.E. & Sebeok, T.A. (eds.) // Psycholinguistics. A Survey of Theory and Research Problems. - Bloomington: Indiana University Press, 1954. - P. 112-118.
134. Jurafsky, D., Martin, J.H. Speech and Language Processing. - NJ: Prentice Hall, 2000. - [Electronic book].
135. Kilgarriff, A. I don't believe in word senses. / A. Kilgarriff // Computers and the Humanities, 1997. - № 31. - P. 91-113.
136. Kintsch, W. Predication. / Kintsch Walter // Cognitive Science. - 2001.
- № 25. - P. 173-202.
137. Korobov, M. Morphological Analyzer and Generator for Russian and Ukrainian Languages // Analysis of Images, Social Networks and Texts. - 2015. [Электронный ресурс] - Режим доступа: http://link. springer. com/chapter/10.1007%2F978-3-319-26123-2_31.
138. Landauer, T.K., Danielle, S. et al. Handbook of Latent Semantic Analysis. - NJ: Lawrence Erlbaum, 2007. - 532 p.
139. Langacker, R. Conceptualization, symbolization and grammar. / R. Langacker // The New Psychology of Language. Cognitive and Functional Approaches to Language Structure. - NJ: Lawrence Erlbaum, 1998. - P. 1-39.
140. Lenci, A. Distributional semantics in linguistic and cognitive research / A. Lenci // From context to meaning: Distributional models of the lexicon in linguistics and cognitive science, special issue of the Italian Journal of Linguistics.
- 2008. № 1 (20). - P. 1-31.
141. Levin, B., Hovav, M.R. Argument Realization. - Cambridge: Cambridge University Press, 2005.
142. Li Ping, Curt Burgess & Kevin Lund. The acquisition of word meaning through global lexical co-occurrences. / Li Ping, Curt Burgess, Kevin Lund // Proceedings of the 31st Child Language Research Forum. - P. 167-178.
143. Louwerse, M., Jeuniaux, P. Language comprehension is both embodied and symbolic. / Louwerse Max & Patrick Jeuniaux // In de Vega Manuel et al. -2008. - P. 309-326.
144. Marconi, D. Lexical Competence. - Cambridge, MA: MIT Press, 1997.
145. Merlo, P., Stevenson, S. Automatic verb classification based on statistical distributions of argument structure. / P. Merlo & S. Stevenson // Computational Linguistics, 2001- № 3 (28). - P. 373-408.
146. Miller, G.A., Charles, W.G. / G.A. Miller, W.G. Charles // Contextual correlates of semantic similarity. Language and Cognitive Processes, 1991. - № 6.
- P.°1-28.
147. Mitchell, J., Lapata, M. Vector-based models of semantic composition. / Mitchell Jeff, Mirella Lapata // Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. - 2008.
- P. 236-244.
148. NLTK Book. S. Bird, E. Klein, E. Loper. - 2014. [Электронный ресурс]
- Режим доступа: http://www.nltk.org/book/.
149. Oldturkicmorph: морфологический анализатор старотюркского языка / В. Гречачин. [Электронный ресурс] - Режим доступа: http: //oldturkicmorph.herokuapp.com/.
150. Ontological Relativity and other Essays. Quine Willard V.O. - NY: Columbia University Press, 1969. - [Electronic book].
151. Pustejovsky, J. The Generative Lexicon. Cambridge, MA: MIT Press,
1995.
152. Quine, W.V. Philosophy of Logic. Harvard University Press, 1986 (ebook).
153. Rogers, T.T., Mathew, A. Lambon Ralph, Peter Garrard, Sasha Bozeat, James L. Mcclelland, John R. Hodges & Karalyn Patterson. The structure and deterioration of semantic memory: A neuropsychological and computational investigation // Psychological Review, 2004. - № 1 (111). - P. 205-235.
154. Rubinstein, H., Goodenough, J.B. Contextual correlates of synonymy. / H. Rubinstein, J.B. Goodenough / Computational Linguistics, 1965. - № 7. - P. 627-633.
155. Sahlgren, M. The Distributional Hypothesis. From context to meaning / M. Shalgren // Distributional models of the lexicon in linguistics and cognitive science (Special issue of the Italian Journal of Linguistics), Rivista di Linguistica. -2008. - № 1 (20). - P. 33-53.
156. Schulte Im Walde, S. Experiments on the automatic induction of German semantic verb classes. / Schulte Im Walde Sabine // Computational Linguistics -2006. № 2 (32). - P. 159-194.
157. Searle, J. Minds, brains and programs. Behavioural and Brain Sciences - 1980. - № 3. - P. 417-424.
158. Shapiro, L. Symbolism, embodied cognition, and the broader debate. / Shapiro Lewis // In de Vega Manuel et al. - 2008. - P. 57-74.
159. Widdows, D. Geometry and Meaning. - Stanford, CA: CSLI, 2004.
160. Zhukov, L. Complex Networks / Л. Жуков. [Электронный ресурс] -Режим доступа: http://www.leonidzhukov.net/hse/2013/lingnetworks/lectures/lecturepdf.
Приложение 1. Корпус русской поэзии XX века (краткая
информация)
ID date author title text
Любовь | «Камни планет \г\г\пЛЮБОВЬ\г\г\пДругу и
0 1921 Арватов Б.И. подымали на камни...» товарищу А.А. Касатк...
Артамонов Из полевых песен | «На \г\г\пиз ПОЛЕВЫХ ПЕСЕН\ЛЛпНа
1 1921 М.Д. поляны в полесовье...» поляны в полесо...
Бердников С работы | «Шагаю... Гудки \r\r\nC РАБОТЫ^ЛЛпШагаю...
2 1921 Я.П. прогудели...» Гудки прогудели.....
Волчанецкая «За други своя» | «Устало \r\r\n«3A ДРУГИ
3 1921 Е.Д. сердце жизни вторить... СВОЯ^УУ^.УУХпУстало сер...
Волчанецкая «Лед взломало... Не в \r\r\nЛед взломало... \r\r\n= Не в
4 1917 Е.Д. весеннюю перу бурливую...» весеннюю по...
Волчанецкая «В эти дни особенно \г\г\пВ эти дни особенно радостно
5 1921 Е.Д. радостно слушать...» слушать,\г\г...
Волчанецкая «Воскрес Великий Пан; УУ\пВячеславу
6 1921 Е.Д. смеясь, на нивы...» ИвановуУУ\пВоскрес Великий П...
УУ\пАндрею
Волчанецкая «Всходило сердце, полное БеломуУУ\пВсходило сердце,
7 1921 Е.Д. любви...» полн...
Волчанецкая «Хочется любви, простой и УУ\пХочется любви, простой и
8 1921 Е.Д. бесхитростной...» бесхитростной,\...
Волчанецкая «Желтокрылых мотыльков \r\r\nЖелтокрылых мотыльков
9 1921 Е.Д. шальная стая...» шальная стая\r\r\n...
Волчанецкая «На обрывистом, песчаном УУ\пНа обрывистом, песчаном
10 1921 Е.Д. берегу...» берегуУУ\пВ но...
Волчанецкая «Сердце -- разыгравшийся УУ\пСердце -- разыгравшийся
11 1921 Е.Д. школьник...» школьник,\r\r\n П...
Волчанецкая Зима | «Есть радость тайная в \г\г\пЗИМА\г\г\пЕсть радость
12 1921 Е.Д. сгорании...» тайная в сгорании...
Кузнецы | «Солнце -- \r\r\n КУЗ НЕЦЫУУ\пСолнце --
13 1920 Дегтярев Н.В. пламенный кузнец...» пламенный кузнец ...
В кузнице | «Горн горящей \г\г\пВ КУЗНИЦЕ\г\г\пГорн
14 1920 Дегтярев Н.В. пастью пышет...» горящей пастью пышет...
На окраине | «Серые \r\r\nHA ОКРАИНЕУУ\пСерые
15 1921 Долныков С. досчатые заборы...» досчатые заборы......
Дорогойченко На пасеке | «Застыл, как гриб \r\r\nHA ПАСЕКЕУУ\пЗастыл, как
16 1920 А.Я. среди поляны...» гриб среди по...
Дорогойченко Герострат | «Если дух твой в \г\г\пГЕРОСТРАТ\г\г\пОктя6рьской
17 1920 А.Я. огненный колос со... революции пос...
«Синь туман в снегах \г\г\пСинь туман в снегах
18 1922 Ерошин И.Е. упругих...» упругих,\г\г\пОт пол...
Сугдаальские девицы | \r\r\nCугдаальские
19 1929 Ерошин И.Е. «Девиц посмотреть хочу...» девицыУУУДевиц посмотрет...
Толкан | «В черной ступке \r\r\nТолкан\r\r\nВ черной ступке
20 1929 Ерошин И.Е. обтолкла...» обтолкла\r\r...
Череп | «Еду с песней по \r\r\nЧереп\r\r\nЕду с песней по
21 1929 Ерошин И.Е. долине...» долинеУУ\пБ...
«После смерти прах мой УУ\пПосле смерти прах мой
22 1929 Ерошин И.Е. схороните...» схоронитеУУ\пНа ...
На всё похож | «Хорошо, вот \г\г\пНа всё похож\г\г\пХорошо,
23 1929 Ерошин И.Е. хорошо!..» вот хорошо!\г\...
«Под окошком собака \г\г\пПод окошком собака
24 1921 Ершов Д. лаяла...» лаяла,\г\г\пКошка с ю...
Карандаш | «Кусочек дерева, \r\r\n КАРАНДАШ\г\г\п Кусочек
25 1921 Еферов В. графит и грани...» дерева, графит и г...
«Какая ты еще девочка \г\г\пКакая ты еще девочка
26 1921 Еферов В. глупая...» глупая...\г\г\пНа в...
Давно ли? | «Вся в цветах \г\г\пДАВНО ЛИ?\г\г\пВся в цветах
27 1922 Земляк Д. душистых ясная полян... душистых ясн...
Революционеру | «Ворот \г\г\пРЕВОЛЮЦИОНЕРУ\г\г\пВорот
28 1920 Ильина В.В. дней и тебе стал мучите... дней и тебе ста...
«Луну образком \г\г\пЛуну образком
29 1920 Ильина В.В. нательным...» нательным\г\г\пНавесил в т...
\г\г\пЗВЕЗДНОЕ
ВРЕМЯ\г\г\пПочему\г\г\пТак
49000 1964 Зенкевич М.А. Звездное время | «Почему...» томи...
Чудо | «Явление великого \г\г\пЧУДО\г\г\пЯвление великого
49001 1964 Зенкевич М.А. поэта...» поэта,\г\г\пК...
«Ну что ж! С Землей простясь, \г\г\пНу что ж! С Землей простясь,
49002 1964 Зенкевич М.А. постранствуй...» постранству...
«Радостью можно со всеми \г\г\пРадостью можно со всеми
49003 1964 Зенкевич М.А. делиться...» делиться\г\г\п Пр...
«Не вини человечество и не \г\г\пНе вини человечество и не
49004 1964 Зенкевич М.А. кори...» кори,\г\г\пА к...
\г\г\пКак это случилось,--
49005 1964 Зенкевич М.А. «Как это случилось,--...» \г\г\пЗачем, почему\...
Первооснова | «Жизнь не \г\г\пПЕРВООСНОВА\г\г\пЖизнь
49006 1965 Зенкевич М.А. бывает никогда мертва...» не бывает никогда...
\г\г\пИзмяты подушки,\г\г\пНет
49007 1965 Зенкевич М.А. «Измяты подушки...» сна / летучего....
«Все люди со дня \г\г\пВсе люди со дня
49008 1965 Зенкевич М.А. рожденья...» рожденья\г\г\пДо конца в...
\г\г\пАтомная смета
49009 1965 Зенкевич М.А. «Атомная смета физики...» физики,\г\г\пБесконечных ф...
\г\г\пНа темной улице\г\г\пЛишь
49010 1965 Зенкевич М.А. «На темной улице...» ветер встретит...
«Как беззащитны голые \г\г\пКак беззащитны голые
49011 1965 Зенкевич М.А. деревья!..» деревья!\г\г\пПред ...
«На пригородном поезде в \г\г\пНа пригородном поезде в
49012 1965 Зенкевич М.А. Москву...» Москву\г\г\пЯ ех...
\г\г\п...От души приветствуем
49013 1966 Зенкевич М.А. «Стал я сразу вдруг...» поэтического пат...
«Все было дано -- / светлый \г\г\пВсе было дано -- / светлый
49014 1966 Зенкевич М.А. ум, красота...» ум, красота,\...
\г\г\пМеченые
49015 1967 Зенкевич М.А. «Меченые атомы...» атомы\г\г\пМечутся в крови,\г\г\...
\г\г\пТОЖЕ БУРЯ\г\г\пКак в
49016 1967 Зенкевич М.А. Тоже буря | «Как в океане...» океане\г\г\пВ зыби ...
Под утро | «Очнись... Не \г\г\пПОД УТРО\г\г\пОчнись... Не
49017 1967 Зенкевич М.А. спи.» спи,\г\г\пХот...
УЧУДве --
неразлучницыДДЛпДве --
49018 1967 Зенкевич М.А. «Две -- неразлучницы...» светолу...
Перед судом | «Старик, \г\г\пПЕРЕД СУДОМ^ЛЛпСтарик,
49019 1967 Зенкевич М.А. словно облак, кудлатый...» словно облак, к...
Признание | «Жить только \r\r\n ПРИЗНАНИЕ\г\г\пЖить
49020 1967 Зенкевич М.А. стихами.» только стихами\r\r\n...
\г\г\пСколько стариков,
49021 1967 Зенкевич М.А. «Сколько стариков, старух...» старухУЧУШаркает по...
Чудо Грузии | «В подвалах \г\г\пЧУДО ГРУЗИИ\г\г\пВ
49022 1967 Зенкевич М.А. прохладных / в ночи ... подвалах прохладных /...
Гордость земли | «Не \r\r\nГОРДОСТЬ ЗЕМЛИ\ЛЛпНе
49023 1967 Зенкевич М.А. выпрашивай / и не моли.» выпрашивай / и не...
«Рассудком я могу / кой-как \ЛЛпРассудком я могу / кой-как
49024 1967 Зенкевич М.А. понять...» понять,\r\r\n...
\г\г\пА в вытрезвителе
49025 1967 Зенкевич М.А. «А в вытрезвителе науки...» наукиДЛЛпСвое сознан...
Не ворчи | «Не ворчи на то, / \r\r\nHE ВОРЧИ\ЛЛпНе ворчи на
49026 1968 Зенкевич М.А. что хмурый, серы... то, / что хмур...
Одна минута | «Придет \г\г\пОДНА МИНУТА^ЛпПамяти
49027 1968 Зенкевич М.А. минута.» недавно ушедших ...
\г\г\пкамень И
Камень и папирус | ПАПИРУС\г\г\пСроднился он с
49028 1968 Зенкевич М.А. «Сроднился он с веками...» век...
Забвение | «Пусть не так \г\г\пЗАБВЕНИЕ\r\r\nПусть не так
49029 1969 Зенкевич М.А. закален я и стоек.» закален я и с...
49030 rows х 5 columns
Приложение 2. Корпус башкирской поэзии XX века (краткая
информация)
ID author date title text
Кэмэлэ\ДпКласташ дygтaрыlмaV\nХyш бул,
0 Рэми Fарипов 1950 Кэмэлэ мэкт...
ЬчЫ1нау?ар?ан hyн\r\nБе? Салауат бaтссahынa
1 Рэми Fарипов 1950 ЬчЫ1нау?ар?ан hyH, инде...
Пилоттар маршы\ДпЭх, осабы?! 'Коштар арып,
2 Рэми Fарипов 1950 Пилоттар маршы ар...
Тормоштса юл\г\пАсытс тэ?рэлэр?эн айлы
3 Рэми Fарипов 1950 Тормоштса юл тенденЧ-.
hay бул, ефем!\r\nАлып китэм hине йерэгемдэ
4 Рэми Fарипов 1950 hay бул, ефем! —...
Ке? haFышы\r\nОсa тсоштар, оса
5 Рэми Fарипов 1950 Ке? haFышы бейектэнД^п^у...
Укытыусыма Утсытыусыма Мэрйэм aпaЙFa\r\nНиндэй бэхет
6 Рэми Fарипов 1950 Мэрйэм aпaЙFa —\r\...
Батссасытар^п^ояш сыFa, мин дэ
7 Рэми Fарипов 1950 Батссасытар сыFaм\r\nБaтсс...
Иркэмэ\г\пНинэ, иркэм, нинэ инде\r\nУт
8 Рэми Fарипов 1950 Иркэмэ haлдын...
hay бул, мэктэп! V\nhyнFЫ тсабат мин кластса
9 Рэми Fарипов 1951 hay бул, мэктэп! ин...
Баш тсала Баш тсала тyрahЫlндa yй?aр\r\nОлaтaйым
10 Рэми Fарипов 1951 тyрahындa уй?ар Иуру?энд...
Студент ке?е\Лп^айы1ндар?ан алтын япратс
11 Рэми Fарипов 1951 Студент ке?е яуа.\...
hеймэ мине,
hbmbiy, эгэр ?э hеймэ мине, hылыy, эгэр ?э
12 Рэми Fарипов 1951 hИ hин\r\nМaтyрлытстсa f...
^ы?ыл мaй?aндa\r\nИн шатлытслы
13 Рэми Fарипов 1951 ^ы?ыл май?анда минуттар?а\r\nh...
Повестка^п^айтауы^а минен кискэ
14 Рэми Fарипов 1951 Повестка тсaлын\r\nИн...
Бэхет йылFahы\r\n^ы?Faн тимер тедле тсояш
15 Рэми Fарипов 1951 Бэхет йылFahы батт...
Детдом, сэлэм Детдом, сэлэм мэскэY?эн\r\n^aлдын,
16 Рэми Fарипов 1952 мэскэу?эн мэктэп.\r\...
Таныш Таныш кYгэрсендэр\r\nКYKhел урман кейгэн
17 Рэми Fарипов 1952 кугэрсендэр тyFa...
Ер адты тсы?ынa\r\nhaлтсын тыштан ингэс тэ
18 Рэми Fарипов 1952 Ер адты тсы?ына 1пин,...
^элэм\г\п^элэм ята... Килмэд шaFир
19 Рэми Fарипов 1952 ^элэм тсaбaт,\r\n...
Минен бабай.
РСФСР-?ын
aттсa?aнFaн Минен бабай. РСФСР-?ын aттсa?aнFaн
20 Рэми Fарипов 1952 утсы1ты1усыты1 ... yтсытыyсыhы ...
Бэлэкэй Бэлэкэй дуçтарым\r\n !\ДпЯратам мин hэр сак
21 Рэми Fарипов 1952 дуçтарым
TыуFан ерзэрем'ДпСуйын юлы буйлап килэм
22 Рэми Fарипов 1953 ^^ан ер?эрем уйла...
Иыр\r\nИырларFа мин шэптэн тYгел,
23 Рэми Fарипов 1953 Иыр ДУÇтар,\r\n...
Tал, "камыштар,
^^ел нур€а Tал, камыштар, кYKhел нурFа сумып,\г\пОйоп
24 Рэми Fарипов 1953 сумып кал...
Студенттар Студенттар туйында^пАртык hый ?а, байлык
25 Рэми Fарипов 1953 туйында та...
Эсэм кулдары\r\nTэYге кабат бергэ бесэн
26 Рэми Fарипов 1953 Эсэм кулдары сапты...
Сэлэм fYмере.
Ун fYмер?е
бeтмэç йэшэY Сэлэм FYмере. Ун FYмер?е бeтмэç йэшэY
27 Рэми Fарипов 1953 дэртен ... дэртен ...
СаFан\r\nКYрэ KYKтэн Ke?re кояш:\r\nБойоFа
28 Рэми Fарипов 1953 Са€ан бе...
Кэн,эшV\nheймэ, ДУÇкай, Y?ен heйгэнде
29 Рэми Fарипов 1953 Кэнэш 1ПИН,\Г\...
Эляфиэ heйлэ эле...\r\nКY??эрендэн hинен мон
16050 Эсэ?уллина 0 heйлэ эле... тYгелэ.\...
Эляфиэ hунFЫ кистэ\г\пСит яктар?а таFЫ кис
16051 Эсэ?уллина 0 hуЦFЫ кистэ у^арам.у...
Эляфиэ Миллэттэшкэ Миллэттэшкэ eндэшеY\r\nЭй, миллэттэш,
16052 Эсэ?уллина 0 eндэшеY халкын к...
Эляфиэ Y?гэрмэм\r\n«Якшы KYнеллеhен, — ти?эр
16053 Эсэ?уллина 0 Y?гэрмэм минэ, —\...
Эляфиэ Tаптар хакында Tаптар хакында шиFыр\r\nAк кайындар ап-ак
16054 Эсэ?уллина 0 ШИFЫр кына...
Эляфиэ Сакырмасы, Сакырмасы, кайын..\r\nhыктай-hыктай тышта
16055 Эсэ?уллина 0 кайын.. ЯMFЫ...
Эляфиэ Яçмала карая Яçмала карая игендэр...'У\пЯуындар изгенэн
16056 Эсэ?уллина 0 игендэр... тYг...
Эляфиэ Иэйге иртэ'Дп^ояш нуры Yрелеп тау
16057 Эсэ?уллина 0 Иэйге иртэ артынан\r\n...
Эляфиэ ШуFалыр\r\nИe??эремдэ hаFЫш
16058 Эсэ?уллина 0 ШуFалыр hарыланhа:\r\n— 'Ка...
Эляфиэ Бер катлы сэп\г\пАйышынды анламайым,
16059 Эсэ?уллина 0 Бер катлы сэп тормош,\г...
Бeркeттэр?ец
Эляфиэ зэнгэр hауаhы Бeркeттэр?ен зэнгэр hауаhы
16060 Эсэ?уллина 0 бар барДДпКешелэрзен ...
Эляфиэ Япра^ы? саFЫ Япра^ы? œFbi аFастын\r\nAсык KYнелгэ
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.