Программная система комплексного анализа русских поэтических текстов: модели и алгоритмы тема диссертации и автореферата по ВАК РФ 05.13.17, доктор наук Кожемякина Ольга Юрьевна
- Специальность ВАК РФ05.13.17
- Количество страниц 288
Оглавление диссертации доктор наук Кожемякина Ольга Юрьевна
Введение
Глава 1. Системы лингвистических исследований. Исторический обзор, методы и алгоритмы
1.1. Становление и развитие применения количественных методов в исследованиях русской поэзии
1.2. Аналогичные системы по сбору, хранению и анализу результатов лингвистических исследований. Алгоритмы и методы систем анализа текста
Выводы к Главе
Глава 2. Фонетический анализ стихотворно-текстовой информации
2.1. Постановка задачи перевода поэтических текстов из дореформенной орфографии в современную
2.2. Общая концепция алгоритма перевода
2.3. Тестирование и сравнительный анализ морфологических анализаторов при работе с дореформенной орфографией
2.4. Адаптация библиотеки рутотрку2 к работе с дореформенной орфографией
2.5. Правила перевода
2.6. Результаты тестирования алгоритма перевода
Выводы к Главе
Глава 3. Фактуры и метрические справочники
3.1 Фактура: определение, математическая модель, типы
3.1.1. Определение фактуры
3.1.2. Математическая модель фактуры
3.1.3. Типы фактур
3.2. Модель метра и стопности и решение проблемы неоднозначной акцентуации
3.3. Алгоритмы определения строфики и рифмы
3.4. Метрические справочники
3.4.1. Подходы и методы к созданию метрических справочников
3.4.2. Программная реализация метрического справочника
Выводы к Главе
Глава 4. Процесс автоматизированного извлечения словосочетаний, составления конкордансов, справочников и словарей языка поэтов
4.1. Автоматическое выделение словосочетаний: проблемы и методы
4.1.1. Теоретические аспекты проблемы
4.1.2. Обзор экспериментальных исследований по тематике для славянских языков
4.2. Составление конкордансов, справочников и словарей языка поэтов
4.2.1. Подходы к созданию метрических словарей и конкордансов
4.2.2. Алгоритм снятия неоднозначности акцентуации методом "по аналогии" с учетом единства метрической характеристики
4.2.3. Общая постановка задачи построения словарной статьи
4.2.4. Неоднозначность при составлении конкордансов
4.2.5. Особенности существующих конкордансов в контексте
проблемы их составления
1338
4.2.6. Классификация случаев неоднозначности и способы ее разрешения
4.2.7. Алгоритм построения конкорданса
Выводы к Главе
Глава 5. Автоматизация исследований жанровых и стилистических характеристик поэтических текстов
5.1. Подходы к автоматизации исследований жанровых и стилистических характеристик текстов
5.2. Построение обучающей выборки
5.3. О возможности создания словаря стилистически дифференцированных лексем
5.4. Описание численного эксперимента
5.5. Извлечение лексических и метроритмических признаков, характерных для жанра и стиля и их комбинаций в процессе автоматизированной обработки текстов на русском языке
5.5.1. Постановка задачи и применяемый инструментарий
5.5.2. Алгоритм извлечения признаков и полученные результаты
5.6. Объяснение прогнозов нейросетей
5.6.1. Характеристика поэтического текста посредством набора признаков
5.6.2. Эффективность решения для экспертов-филологов
5.6.3. Объяснение прогнозов классификатора
5.6.4. Требования к системе
5.6.5. Инструменты реализации
5.6.6. Сценарий классификации
Выводы к Главе
Глава 6. Исследования характеристик верхних уровней поэтических текстов и их зависимости от характеристик нижних уровней
6.1. Методы машинного обучения в решении задачи автоматизированного определения жанра и стиля
6.1.1. Постановка задачи выбора модели
6.1.2. Аукционные эвристики
6.1.3. Результаты экспериментов
6.2. Определение признаков авторского стиля стихотворений А.С. Пушкина методами машинного обучения
6.2.1. Стилеметрия и авторский стиль
6.2.2. Определение групп признаков
6.2.3. Обзор исследований по стилеметрии
6.2.4. Подготовка данных и модели машинного обучения
6.2.5. Классификация по группам признаков
6.2.6. Результаты классификаций
Выводы к Главе
Глава 7. Информационная система представления результатов
автоматизированного комплексного анализа поэтических текстов
7.1. Обзор существующих информационных систем
7.2. Подход к проектированию и реализация информационной системы
7.3. Концептуальная модель системы
7.4. Интерфейс информационной системы
7.5. Методология
Выводы к Главе
Концептуальное описание программной системы
236
Заключение
Список литературы
Список публикаций автора
Приложения
Введение
Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Язык поэзии Д.В. Веневитинова: лингвографический и историко-лексикологический аспекты2020 год, кандидат наук Шайхутдинова Рузалина Ильясовна
Модели лингвистического анализа текстов таджикского языка: на материале газелей Хафиза2013 год, кандидат наук Джаъфарова, Давлатхоним Файзалиевна
Словоупотребление М. Кузмина и В. Хлебникова: Функцион.-типолог. анализ некоторых образ. микросистем1998 год, кандидат филологических наук Гик, Анна Владимировна
Поэзия Булата Окуджавы в немецких переводах: Исторические, стилистико-сопоставительные и типологические аспекты2002 год, кандидат филологических наук Христофорова, Светлана Борисовна
Рифма Д. Л. Андреева в лингвистическом аспекте: На материале сборника "Русские боги"2000 год, кандидат филологических наук Кочетков, Дмитрий Алексеевич
Введение диссертации (часть автореферата) на тему «Программная система комплексного анализа русских поэтических текстов: модели и алгоритмы»
Актуальность исследования.
Современный подход к исследованию текстовых сообщений предполагает использование многоуровневой модели информации, один из вариантов которой изложен в работе германского исследователя В. Гитта [1]. Структура модели представлена на Рисунке 1.
Рисунок 1. Пятиуровневая модель информации В. Гитта
Как отмечено в [1], самый нижний уровень представленной модели соответствует ставшему уже классическим определению информации К. Шеннона [2], далее, по возрастанию, идут уровни синтаксических, семантических
и прагматических данных. Для автоматизированного анализа текстов верхний уровень - апобетика - не рассматривается, так как либо он совпадает с предыдущим, т. е. действие соответствует цели, либо цель прописана явно, либо сообщения недостаточно для распознавания цели и нужно использовать дополнительные источники данных. Стоит отметить, что для наличия в сообщении информации высокого уровня необходимо, но недостаточно наличие информации всех предыдущих уровней, так как её объем зависит также и от мета-информации, включая характеристики адресата, контекст и т.д., что верно для всех уровней модели. Два нижних уровня сообщения (статистика и синтаксис) напрямую связаны с языком (здесь подразумевается язык как знаковая система; следует отличать её от подмножеств языка, которые называются аналогично, например: разговорный английский язык, литературный русский язык, язык Пушкина [3] и т.д.) и кодировкой сообщения. Их влияние на более высокие уровни под вопросом, за исключением художественных текстов, прежде всего, поэтических: в частности, Ю.М. Лотман утверждал, что "явление структуры в стихе всегда в конечном итоге оказывается явлением смысла" [4]. Для сообщения, например, научного стиля такого влияния не наблюдается: одна и та же статья может быть переведена на другой язык с незначительными изменениями, практически не потеряв при этом в содержании, особенно если речь идёт о точных науках. В поэтических же текстах уровни структуры произвольного сообщения можно отобразить в уровни структуры стиха, которые также имеют устойчивую иерархию [5]: метрика, ритмика, фонетика, лексика, грамматика, литературный стиль, тематика, литературный жанр; при этом уровни структуры произвольного сообщения и стиха можно сопоставить следующим образом: к статистическому уровню относится фонетика, к синтаксическому уровню — метрика и ритмика (что вполне коррелирует с Рисунком 1 (см. выше) из [1]), к семантическому - лексика и грамматика, на границе семантического и прагматического уровней находится тематика (см. Рисунок 2).
Рисунок 2. Соответствие уровней поэтического текста уровням схемы В. Гитта
Процесс анализа каждого поэтического текста состоит из рассмотрения уровней как самостоятельных смысловых единиц с последующим связыванием полученных данных с другими элементами структуры. Лексика формирует семантику данного конкретного стихотворения, метрика является общим фоном семантической традиции, на которой оно воспринимается. Таким образом, изучение влияния нижних уровней стихотворной структуры на высшие является актуальной проблемой русской филологии. Началом систематического изучения влияния низших уровней структуры стиха на высшие, несмотря на наличие отдельных исследований, можно считать работы К.Ф. Тарановского [6]. В своём выступлении на Пятом съезде славистов в 1963 году К.Ф. Тарановский представил доклад "О взаимодействии стихотворного ритма и тематики", в котором на основе анализа нескольких десятков русских стихотворных текстов было исследовано взаимодействие ритмических особенностей и жанрового применения пятистопного хорея и показано, что во многих стихах, написанных этим размером (начиная с "Выхожу один я на дорогу..." М.Ю. Лермонтова), "динамический мотив пути противопоставляется статическому мотиву жизни" (см. [6]). В указанной работе предложена методика определения семантики того или иного стихотворного размера, заключающаяся в исследовании не его единичного употребления, а традиции его жанрового и тематического
использования [5], что предполагает анализ корпусов поэтических текстов.
Одной из основных трудностей, возникающих при решении данной задачи, является необходимость анализа корпуса поэтических текстов большого объема. Эта задача чрезвычайно трудоемка, поэтому, как правило, в поле зрения исследователя попадает лишь сравнительно небольшой круг стихотворений поэтов классического периода, что существенно снижает полноту анализируемого материала и, следовательно, достоверность полученных результатов. Таким образом, возникает проблема автоматизации анализа различных уровней структуры стиха, которая освободит исследователя от рутинной работы и в то же время позволит расширить круг анализируемых произведений. Приведенная выше корреляция между уровнями структуры произвольного сообщения и стихотворения показывает, что в процессе автоматизации анализа стихотворений могут быть использованы многие технологии и математические методы, используемые в информатике. Безусловно, простейшие математические подходы давно используются в филологическом анализе русских стихотворений. Широко известны частотные словари языка поэтов-классиков. Многочисленные исследования статистики типов русской рифмы (в том числе, применительно к историческим изменениям) обобщены в [7]. Однако, статистическая информация по-прежнему собирается, в большинстве случаев, вручную. Некоторые исследования, описывающие комплексный подход к автоматизации характеристик русских поэтических текстов (см., например, [8]), обычно затрагивают весьма специфические жанры поэзии, такие, как фольклор, структурные характеристики которого, в частности, метрики и др., существенно отличаются от соответствующих структур литературного стиха. Следует отметить, что исследования зарубежных авторов в этой области применительно к русскому языку нам неизвестны. Лексический анализ стихотворения предусматривает [9] создание его лексического словаря, который используется, в частности, для выявления доминирующих частей речи, тематических (семантических) полей и поэтической фразеологии (в первую очередь, используемых метафор). Среди некоммерческих программных продуктов,
решающих задачу составления лексического словаря какого-либо текста, можно назвать стеммер Яндекса [10]. Он позволяет извлечь как слова, являющиеся заданной частью речи (что автоматически решает задачу идентификации доминирующих частей речи), так и фразы заданной структуры (например, (прилагательное) + (существительное) или (существительное) + (существительное в родительном падеже)). Также, последняя из этих функций может существенно обогатить традиционные словари языка поэта, дополнив их словосочетаниями.
Что касается задач идентификации тематических полей и метафор, то их решение требует, наряду с лексическими словарями слов и словосочетаний, ещё и дополнительной, зачастую слабо формализованной информации (например, о принадлежности лексем к определенному тематическому полю, семантическому архетипу и др.), вследствие чего эти задачи мы относим к перспективе исследований. Грамматический анализ текста включает в себя определение возможной принадлежности фрагмента текста к именному или глагольному типу (соответственно к непрерывным именным предложениям или перечислению действий), а также временного плана и предметной структуры стихотворения (что требует изучения использования категорий времени, залога и лица), именные и глагольные типы, в свою очередь, определяются прямым анализом лексического словаря, либо морфологическим анализом. Чтобы определить использование категорий времени, залога и лица, необходимо дополнительно использовать достаточно простые морфологические правила русского языка, позволяющие установить конкретные категории. Прямое определение тематики стихотворения является очень сложной задачей для автоматизированного решения, так как требует семантического анализа текстов на уровне, близком к восприятию человеком текстов на естественном языке. Однако, исследование зависимости тематики от нижних уровней стихотворной структуры является одним из наименее изученных направлений филологического анализа. Использование методов статистического анализа корпусов поэтических текстов большого объёма также может быть эффективным методом решения этих и подобных проблем. Важным направлением исследований является
использование многомерного анализа семантических, эмоциональных и прочих характеристик, масштабное применение которого практически невозможно без применения методов автоматизации. Работа с большими текстовыми корпусами предполагает использование методов интеллектуального анализа данных. Современные подходы к кластеризации текстовых документов с использованием нескольких шкал подобия представлены, например, в монографии [11].
Тем самым, исходя из потребностей исследователей-филологов, формируется одна из задач компьютерной лингвистики - создание удобного программного приложения (комплекса приложений) для автоматизации работы, обусловленного необходимостью включения в исследовательский процесс больших корпусов поэтических текстов с целью извлечения метаданных, соответствующих разным уровням представления информации.
Таким образом, весьма актуальна решаемая в диссертационной работе проблема создания программной системы, обеспечивающей автоматизированный многоуровневый анализ поэтических текстов, в том числе с целью исследования взаимозависимостей между структурами уровней поэтического текста.
Степень разработанности темы исследования. Разработки А.А. Маркова (старшего) - так называемые цепи Маркова, исследования А.Н. Колмогорова по выявлению метрических законов, классификации и статистики ритмических вариаций метра, анализу и оценки "остаточной энтропии", труды М.Л. Гаспарова по выразительным средствам поэтического языка, - классические методы XX века, успешно зарекомендовавшие себя в области количественного анализа текстов, ложатся в основу методов и алгоритмов при разработке программной системы, связанной с анализом текстов. Теоретические исследования в области языкознания, ставшие основой большинства современных алгоритмов автоматического анализа текстов на русском языке, представлены в работах А.А. Зализняка, Ю.Д. Апресяна, И.А. Мельчука, С.Е. Никитиной, И.М. Богуславского, О.С. Ахмановой, Е.В. Падучевой, В. А. Плунгяна,
А.А. Зализняк и др. Работы Дж.Т. Шоу с использованием компьютера по составлению конкорданса к стихам А.С. Пушкина стали эталоном для последующих исследований, в частности, работы В.Е. Холшевникова над словарем рифм Пушкина. Современные исследования, использующие наследие классических методов, получили новые векторы продолжения, благодаря развитию информационных технологий. Работа И.И. Дроздовой и А.Д. Обухова посвящена определению авторства текста по частотным характеристикам, исследование Е.А. Гречникова и др. - метод определения неестественного происхождения документа, основанный на изучении статистики встречаемости пар соседних слов. Некоторыми вопросами компьютерной лингвистики и исследованием различных уровней текста занимались в разные годы: Ю.И. Шокин, А.М. Федотов, В.Б. Барахнин, Н.В. Лукашевич, Д.Е. Пальчунов, М.К. Тимофеева, Ю.А. Загорулько, Т.В. Батура и др.
В зарубежном литературоведении выделяются исследования в области автоматизации анализа метроритмических характеристик поэтических текстов: в работе М. Хэйварда проведено компьютерное исследование особенностей метрики в стихах различных поэтов; Д. Каплан и Д. Блей, Дж. Као и Д. Джурафски проанализировали стили американских поэтов на основе орфографических, синтаксических и фонетических характеристик их стихов; в работе А. Курта и М. Кара предложен алгоритм распознавания и анализа стихотворений, написанных в характерной для восточной поэзии системе стихосложения аруд; система БРАВШАЯ из работы Р. Дельмонте предполагает автоматический комплексный анализ поэтических текстов с целью изучения
стиля; web-приложение Мейгса^ег , разработанное К. Боббенхаузеном и Б. Хаммерихом, позволяет производить автоматический анализ метрических характеристик немецких стихов. Среди новейших работ стоит отметить исследование О. Калена, в которой представлен количественный подход к поэзии, основанный на использовании нескольких статистических показателей (энтропия, информационная энергия, и-граммы и т.д.), применяемых к нескольким знаковым произведениям английской литературы.
Что касается исследований, связанных с автоматизированным анализом текста на русском языке, то, если на теоретическом уровне существуют некоторые исследования по автоматической спецификации стиха в информационно-аналитической системе (В.Н. Бойков и др.), то практически реализованных, с воспроизводимыми алгоритмами и отмеченных научными публикациями, полноценных систем нет. Отдельные исследования, описывающие комплексный подход к автоматизации характеристик русских поэтических текстов, затрагивают, как правило, весьма специфические жанры поэзии - например, фольклорные стихи, структурные характеристики которых, например, метрика, тематика и т. д., значительно отличаются от соответствующих структур "литературного" стиха. Широко известны частотные словари языка поэтов-классиков, проводились многочисленные исследования статистики типов русской рифмы (в том числе, и применительно ко временной динамике); известной в своем кругу системой является незаконченный проект "Конкорданс к текстам Ломоносова", построенный на основе корпуса авторских текстов, снабженных структурной, филологической и грамматической разметкой. Несомненно, важной является работа А. В. Козьмина "Автоматический анализ стиха в системе Starling", посвященная автоматизированному определению метроритмических характеристик русских поэтических текстов и опирающуюся на информационную систему, однако эти исследования были прекращены. Исследования И.А. Пильщикова и А.С. Старостина, в которой авторы используют компьютерный морфолого-акцентологический анализ, являются
принципиальными по автоматизации процесса распознавания метрических характеристик текста, однако подробностей реализации алгоритма и результатов его использования авторами не приведено.
Исследований, связанных с комплексным автоматизированным анализом поэтических текстов на русском языке, и апробированных в научных публикациях комплексных систем до наших разработок создано не было.
Цель диссертационного исследования: теоретическое обоснование, разработка и реализация принципов создания программных систем многоуровневого анализа поэтических текстов с целью исследования взаимозависимостей между структурами различных уровней поэтического текста.
Научно-техническая проблема, решаемая в диссертационном исследовании:
теоретическое обоснование и разработка технологических основ создания программных систем, обеспечивающих автоматизированный многоуровневый анализ поэтических текстов, в том числе с целью исследования взаимозависимостей между структурами различных уровней поэтического текста.
Задачи, решаемые в диссертационной работе:
1. Обоснование соответствия между уровнями многоуровневой модели информации и уровнями структуры поэтического текста.
2. Разработка структуры многоуровневого описания русского поэтического текста.
3. Разработка алгоритмов фонетического анализа стихотворно-текстовой информации.
4. Исследование принципов анализа метроритмических и строфических характеристик текста (фактур).
5. Исследование принципов и разработка алгоритмов составления конкордансов и справочников, извлечения словосочетаний, составления словарей языка поэтов.
6. Разработка алгоритмов автоматизированного извлечения жанровых и стилевых характеристик.
7. Разработка принципов создания программных систем автоматизированного многоуровневого анализа поэтических текстов.
Объект исследования: характеристики основных уровней поэтического текста, соответствующие различным уровням информации, рассматриваемые как метаданные.
Предмет исследования: модели и алгоритмы, описывающие программные системы, предназначенные для автоматизированного многоуровневого анализа поэтических текстов, в том числе с целью исследования взаимозависимостей между структурами уровней поэтического текста.
Методология и методы исследования. В диссертационном исследовании использовалась методология системного анализа и информатики, как науки о структуре и свойствах семантической информации. Для решения конкретных задач применялись методы теории информации, компьютерной лингвистики, математического моделирования, статистические методы, методы машинного обучения, методы автоматической обработки текста, методы теории моделирования баз данных, а также информационные технологии.
Научная новизна. Наиболее существенные научные результаты заключаются в следующем:
- Обосновано соответствие между уровнями многоуровневой модели информации и уровнями структуры поэтического текста.
- Разработана структура описания русского поэтического текста, отличительной особенностью которой является многоуровневость и наличие категориальных связей между уровнями.
- Предложены алгоритмы фонетического анализа стихотворно-текстовой информации, отличительной особенностью которых является использование информации о морфологической структуре анализируемых лексем.
- Исследованы принципы анализа метроритмических и строфических характеристик текста (фактур), впервые основанные на единстве метроритмики и строфики.
- Исследованы принципы и разработаны алгоритмы составления конкордансов и справочников, извлечения словосочетаний, составления словарей языка поэтов, автоматизирующие снятие проблемы омографии.
- Разработаны алгоритмы автоматизированного извлечения жанровых и стилевых характеристик, впервые основанные на методах машинного обучения и позволившие довести точность определения жанровых и стилевых характеристик до показателей в пределах от 95 до 100 %.
- Впервые сформулированы и обоснованы принципы создания программных систем автоматизированного многоуровневого анализа поэтических текстов, предназначенных для хранения поэтических текстов и их представления посредством широкого спектра извлеченных из них метаданных, что позволяет в автоматизированном режиме генерировать словари рифм, метроритмические справочники, словари языка поэтов, конкордансы.
Достоверность и обоснованность научных положений, результатов и выводов, приведенных в диссертационной работе, обеспечиваются применением надежных методов исследования, корректностью использования адекватного математического аппарата и филологической терминологии, и подтверждены результатами использования предложенных информационных моделей и структур при создании системы автоматизированного комплексного анализа русских поэтических текстов, программной системы "Стемматизация и генерация словоформ казахского языка", а также апробацией и обсуждением результатов работы на международных и всероссийских конференциях, рецензированием и предварительной экспертизой научных статей, опубликованных в ведущих научных изданиях.
Теоретическая значимость. Полученный в работе комплекс теоретических результатов, обобщений и исследований позволил решить научно-техническую проблему теоретического обоснования и разработки технологических основ создания программных систем, обеспечивающих автоматизированный многоуровневый анализ поэтических текстов, в том числе с целью исследования взаимозависимостей между структурами уровней поэтического текста.
Практическая значимость и внедрение.
На основе полученных в работе теоретических результатов и методических рекомендаций создан комплекс методов и алгоритмов, обеспечивающий решение важной научно-технической задачи: теоретического обоснования и разработки технологических основ создания программных систем, обеспечивающих автоматизированный многоуровневый анализ поэтических текстов, в том числе с целью исследования взаимозависимостей между структурами уровней поэтического текста.
Результаты работы использованы при выполнении проекта 122010800027-7 (ЕГИСУ) (2022-01-01 - 2024-12-31) в рамках базовой темы "Разработка, создание и исследование распределенных информационных систем для поддержки принятия решений и автоматизации процессов", при выполнении проекта 122010800027-7 (ЕГИСУ) (2020-01-01 - 2020-12-31) в рамках базовой темы "Разработка, создание и исследование распределенных информационных систем для поддержки принятия решений и автоматизации процессов", при выполнении проекта АААА-А17-117120670141-7 (2017-01-01 - 2020-12-31) в рамках базовой темы "Теоретические основы, алгоритмическое обеспечение и информационные технологии для решения фундаментальных и прикладных задач исследования сложных техногенных, природных и биологических систем", проекта IV.38.L1 (2012-01-01 - 2016-12-31) в рамках базовой темы "Создание технологий, алгоритмов и интегрированных систем информационно-вычислительной поддержки решения задач интеллектуального анализа и обработки потоков данных на основе распределенных гетерогенных ресурсов и "облачных"
вычислений", при выполнении проекта 19-18-00466 (2019-05-01 - 2021-1231) Российского научного фонда "Разработка и реализация информационной системы многоуровневого исследования стихотворных текстов", при выполнении проекта РЯАБ-2016-0015 (2016-01-01 - 2017-12-31) "Автоматизированное определение жанрового типа и стилистической окраски текстов на русском языке" в рамках Программ Президиума РАН, при выполнении проекта 43 в рамках Комплексного интеграционного проекта СО РАН "Модели и методы создания информационных систем, интегрирующих географическую и временную составляющие документов, согласованных с мировыми стандартами и тенденциями развития национальной и международной информационной инфраструктуры, интегрированных в открытое семантическое пространство", при выполнении проекта 19-37-90019 (2019-10-01 - 2020-01-01) Российского фонда фундаментальных исследований "Разработка моделей хранения метаданных русских художественных текстов в тематических базах данных и технологий их отображения", при выполнении проекта 13-07-00258-а (2013-01-01 - 2015-1231) Российского фонда фундаментальных исследований "Разработка моделей и алгоритмов, предназначенных для извлечения фактов из массивов естественноязыковых слабо структурированных текстовых документов", при выполнении проекта ПЦФ № ВЯ05236839 "Разработка информационных технологий и систем для стимулирования устойчивого развития личности как одна из основ развития цифрового Казахстана".
Результаты работы внедрены в системе комплексного анализа русских поэтических текстов, созданной в Федеральном исследовательском центре информационных и вычислительных технологий; в программной системе "Стемматизация и генерация словоформ казахского языка", созданной в Институте информационных и вычислительных технологий Комитета науки Министерства образования и науки Республики Казахстан, в учебный процесс кафедры математического моделирования Новосибирского государственного университета.
Основные положения, выносимые на защиту.
Обоснованы и разработаны технологические основы создания программных систем, обеспечивающих автоматизированный многоуровневый анализ поэтических текстов, в том числе с целью исследования взаимозависимостей между структурами уровней поэтического текста, включающие в себя:
- структуру описания русского поэтического текста, отличительной особенностью которой является многоуровневость и наличие категориальных связей между уровнями;
- модель программной системы комплексного анализа поэтических текстов, предназначенную для хранения и извлечения широкого спектра метаданных, позволяющую в автоматизированном режиме генерировать словари рифм, метроритмические справочники, словари языка поэтов, конкордансы;
- принципы и алгоритмы автоматизации анализа основных уровней русского поэтического текста, позволяющие извлекать широкий спектр метаданных, в том числе специфических для поэтических текстов.
Апробация результатов исследования.
Основные положения диссертации обсуждались на многих международных, всероссийских и региональных конференциях, в том числе на Всероссийской научной конференции RCDL-2012 "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" (Переславль-Залесский, 2012), на Международной конференции "Информационно-вычислительные технологии и математическое моделирование" (Кемерово, 2012), на Международной конференции ВИТ-2013 "Вычислительные и информационные технологии в науке, технике и образовании" (Усть-Каменогорск, Казахстан, 2013), на Российской конференции с международным участием DICR-2014 "Распределенные информационно-вычислительные ресурсы" (Новосибирск, 2014), на VI Международной конференции "Системный анализ и информационные технологии" САИТ-2015 (Светлогорск, 2015), на Международной конференции "Computational and Informational Technologies
Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Хоры a cappella Сергея Слонимского2009 год, кандидат искусствоведения Равикович, Лидия Леонидовна
Лексико-семантические параметры поэтики стихотворных текстов: Практика перевода1999 год, доктор филологических наук Дармодехина, Анна Николаевна
Поэзия Э.М. Ремарка в русских переводах: историко-типологические, стилистико-сопоставительные и переводоведческие проблемы2011 год, кандидат филологических наук Ковынева, Елена Александровна
Поэтический синтаксис П.А.Вяземского2016 год, кандидат наук Лебедев Александр Александрович
Поэтический текст на "спящем" языке в условиях многоязычия (на материале поэзии на иврите III-XIX вв.)2016 год, кандидат наук Полян Александра Леонидовна
Список литературы диссертационного исследования доктор наук Кожемякина Ольга Юрьевна, 2022 год
Список литературы
1. Gitt, W. Ordnung und information in technik und natur // Gitt W. (Hrsg.): Am Anfang war die Information. - Grâfeling: Resch KG, 1982. - P. 171-211.
2. Shannon C.E. A mathematical theory of communication // Bell system technical journal. -- 1948. - Т. 27. - No. 3. - С. 379-423.
3. Ожегов С. И. Толковый словарь русского языка. - М.: Мир и Образование, Оникс, 2011. - 736 с.
4. Лотман Ю.М., Структура художественного текста. - М: Искусство, 1970. - 384 с.
5. Магомедова ДМ. Филологический анализ лирического стихотворения. - М.: Академия, 2004. - 187 с.
6. Тарановский К. О взаимоотношении стихотворного ритма и тематики // Тарановский К. О поэзии и поэтике. - М.: Языки русской культуры, 2000. - С. 372-403.
7. Hayward M. Analysis of a corpus of poetry by a connectionist model of poetic meter // Poetics. - 1996. - Т. 24. - No. 1. - P. 1-11. - [Электронный ресурс] URL: http://www.english.iup.edu/mhayward/Metrics/Cormetrics.htm (дата обращения 21.03.2022).
8. Лапшина Н.В., Романович И.К., Ярхо Б.И. Метрический справочник к стихотворениям А. С. Пушкина. - М.; Л.: Academia, 1934. - 144 с.
9. Самойлов Д. Книга о русской рифме. - М.: Художественная литература, 1982. - 351 с.
10. Стеммер компании "Яндекс". - [Электронный ресурс] URL: https://tech.yandex.ru/mystem/ (дата обращения 21.03.2022).
11. Шокин Ю.И., Федотов А.М., Барахнин В.Б. Проблемы поиска информации. - Новосибирск: Наука, 2010. - 196 c.
12. Марков А.А. Пример статистического исследования над текстом "Евгения Онегина", иллюстрирующий связь испытаний в цепь // Известия Императорской академии наук. - 1993. - Серия 6. - Том 7. - Вып. 3. - С. 153-162.
13. Колмогоров в воспоминаниях / Под ред. А.Н. Ширяева. - М.: Физматлит, 1993. - 736 с.
14. Колмогоров А.Н., Прохоров А.В. К основам русской классической метрики // Содружество наук и тайны творчества. - М.: Искусство, 1968. - С. 397432.
15. Колмогоров А.Н. Труды по стиховедению. - М., 2016. - URL: [Электронный ресурс] URL: https://e.lanbook.com/book/71932 (дата обращения: 21.03.2022).
16. Гаспаров М.Л. Владимир Маяковский // Очерки истории языка русской поэзии ХХ века: Опыты описания идиостилей. - М.: Наследие, 1995. - С. 363-395.
17. Гаспаров М.Л., Скулачева Т.В. Статьи о лингвистике стиха. - М.: Языки славянской культуры, 2005. - С. 132.
18. Левин Ю.Д. Конкордация поэзии Пушкина // Русская литература. -1987. - №1. - С. 212-214.
19. Shaw J.Th., Pushkin: Poet and Man of Letters and His Prose. - Los Angeles, 1995. - 273 p.
20. Шоу Дж. Т. Конкорданс к стихам А. С. Пушкина. (А-Н). - М.: Языки русской культуры, 2000. - Т. 1. - 672 С.; Шоу Дж. Т. Конкорданс к стихам А. С. Пушкина. (О-Я). - М.: Языки русской культуры, 2000. - Т. 2. - 640 С.
21. Холшевников В.Е. О словаре рифм Пушкина // Временник Пушкинской комиссии. - 1973. - Л.: Наука, 1975. - С. 66-71.
22. Шоу Дж.Т. Поэтика неожиданного у Пушкина: Нерифмованные строки в рифмованной поэзии и рифмованные строки в нерифмованной поэзии / Под общ. рук. Т.В. Скулачева. - М.: Языки славянской культуры, 2002 . - 455 С.
23. Дроздова И.И., Обухова А.Д. Определение авторства текста по частотным характеристикам // Труды VII Международной научной конференции "Технические науки в России и за рубежом". - М.: Буки-Веди, 2017. - С. 18-21.
24. Гречников Е.А., Гусев Г.Г., Кустарев А.А., Райгородский А.М. Поиск неестественных текстов // Труды XXI Всероссийской научной конференции
"Электронные библиотеки: перспективные методы и технологии, электронные коллекции". - Петрозаводск: Транскрипт, 2009. - С. 306-308.
25. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В., Хаятова В.Д. Автоматизация комплексного анализа русского поэтического текста: модели и алгоритмы // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2015. - Т. 13. - № 3. - С. 5-18.
26. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В. Технология создания метрических справочников и конкордансов русских поэтических текстов // Труды Международной конференции "Вычислительные и информационные технологии в науке, технике и образовании". - Алма-Ата, 2015. - С. 244-245.
27. Альменова А.Б. Разработка и реализация алгоритма анализа метрических характеристик поэтических текстов. 2013. (диссертация) -Новосибирский государственный университет. - [Электронный ресурс] URL: http://www.nsu.ru/xmlui/handle/nsu/421 (дата обращения: 21.03.2022).
28. Барахнин В.Б., Кожемякина О.Ю. К проблеме аутентичности фонетического анализа в связи с возможными особенностями авторской орфографии (на примере чередования окончаний -ой/-ый в лирике А.С. Пушкина) // Вестник Томского государственного университета. Филология. -2016. - № 2 (40). - C. 5-28.
29. Kaplan D. M., Blei D. M. A computational approach to style in American poetry // 7th IEEE International Conference on Data Mining (ICDM 2007). - 2007. - Р. 553-558.
30. Kao J., Jurafsky D. A computational analysis of style, affect, and imagery in contemporary poetry // NAACL Workshop on Computational Linguistics for Literature. - 2012. - [Электронный ресурс] URL: http://web.stanford.edu/~jurafsky/kaojurafsky12.pdf (дата обращения: 21.03.2022).
31. Сайт Рифмовед. - [Электронный ресурс] URL: http://rifmoved.ru (дата обращения: 21.03.2022).
32. Fusi D. A Multilanguage, Modular Framework for Metrical Analysis: IT Patterns and Theorical Issues. Langages. - 2015. - V. 3. - № 199. - P. 41-66.
33. Fusi D. An Expert System for the Classical Languages: Metrical Analysis Components. Lexis. - 2008. - V. 27. - P. 25-45.
34. Мишина Ю. Е. Аппозитивные конструкции и смежные синтаксические явления английского языка: проблема разграничения // Филологические науки. Вопросы теории и практики. - Тамбов: Грамота. -2018. -№ 1. - Ч. 1. - С. 155-158. - [Электронный ресурс] URL: https://doi.org/10.30853/filnauki.2018-1-1.40 (дата обращения: 21.03.2022).
35. Mansilla R., Bush E. Increase of complexity from classical Greek to Latin poetry // Complex Systems. - V. 14. - Iss. 3. - [Электронный ресурс] URL: https://arxiv.org/pdf/cond-mat/0203135.pdf (дата обращения: 21.03.2022)
36. Rényi A. On measures of information and entropy // Proceedings of the 4th Berkeley Symposium on Mathematics, Statistics and Probability. - 1960. -P. 547-561.
37. Ярхо В.Н. Гомеровский вопрос // Литературная энциклопедия. - М.: Советская энциклопедия., 1987. - С. 78.
38. Navarro-Colorado B. A Computational Linguistic Approach to Spanish Golden Age Sonnets: Metrical and Semantic Aspects // 4th workshop on computational linguistics for literature. - 2015. - P. 105-113.
39. Navarro-Colorado B., Lafoz M. R., Sánchez N. Metrical Annotation of a Large Corpus of Spanish Sonnets: Representation, Scansion and Evaluation // 9th international conference on language resources and evaluation. - 2016. -[Электронный ресурс] URL: http://www.lrec-conf.org/proceedings/lrec2016/pdf/453_Paper.pdf (дата обращения: 21.03.2022).
40. Navarro-Colorado B., Lafoz M. R., Trigueros S. J., Sánchez, N. Compilación y Anotación Métrica de un Corpus de Sonetos del Siglo de Oro // II congreso internacional humanidades digitales hispánicas. - 2015. - [Электронный ресурс] URL: https://hispanismo.cervantes.es/congresos-y-cursos/ii-congreso-internacional-humanidades-digitales-hispanicas-innovacion-0 (дата обращения: 21.03.2022).
41. Text Encoding Initiative. - [Электронный ресурс] URL: https://tei-c.org/ (дата обращения: 21.03.2022).
42. Robinson J. R. Colors of Poetry: Computational Deconstruction. — Georgia State University. - 2006. - [Электронный ресурс] URL: https://getd.libs.uga.edu/pdfs/robinson_jason_r_200605_ma.pdf (дата обращения: 21.03.2022).
43. Gervás, P. A Logic Programming Application for the Analysis of Spanish Verse // 1st international conference on computational logic. - 2000. - P. 1330-1344.
44. Mittmann A. Escansâo automática de versos em portugués. Tese (doutorado). - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pôs-Graduaçâo em Ciência da Computaçâo. - Florianópolis. - 2016. -[Электронный ресурс] URL:
https://repositorio.ufsc.br/bitstream/handle/123456789/175819/345411.pdf7sequence=1 (дата обращения: 21.03.2022).
45. Robey D. Scanning Dante's the Divine Comedy. A Computer-based Approach // Literary and Linguistic Computing. - 1993. - V. 8. - №. 2. - P. 81-84.
46. Rainsford T. M., Scrivner O. Metrical Annotation for a Verse Treebank // 13th international workshop on treebanks and linguistic theories. - 2014. - P. 149-159.
47. Beaudouin V., Yvon F. The Metrometer: a Tool for Analysing French Verse // Literary and Linguistic Computing. - 1996. - V. 11. - № 1. - P. 23-31.
48. Beaudouin V. Mètre en règles // Revue française de linguistique appliquée. - 2004. - V. 9. - P. 119-137.
49. Delente É., Renault R. Annotation automatique de textes versifiés // Schedae. - 2011. - P. 39-52.
50. Delente É., Renault R. Projet Anamètre: Le calcul du mètre des vers complexes // Langages. - 2015. - V. 3. - № 199. - P. 125-148.
51. Delente É., Renault R. Traitement automatique des formes métriques des textes versifiés // 22ème conférence sur le traitement automatique des langues naturelles. - 2015. - P. 432-438.
52. Kurt A., Kara M. An algorithm for the detection and analysis of arud meter in Diwan poetry // Turkish journal of electrical engineering & computer sciences. -2012. - V. 20. - № 6. - P. 948-963.
53. Alnagdawi M. A., Rashideh H., Aburumman A. F. Finding Arabic Poem Meter using Context Free Grammar // Journal of Communications and Computer Engineering - 2013. - V. 3, № 1, P. 52-59.
54. Ayech H. E., Mahfouf A., Zribi A. Reconnaissance de la métrique des poèmes arabes par les réseaux de neurones artificiels // 13ème conférence sur le traitement automatique des langues naturelles. - 2006. - P. 462-472.
55. Almuhareb A., Alkharashi I., Saud L. A. L., Altuwaijri, H. Recognition of Classical Arabic Poems // 2nd workshop on computational linguistics for literature. -2013. - P. 9-16.
56. Ousaka Y.M., Yamazaki, M.M. Automatic Analysis of the Canon in Middle Indo-Aryan by Personal Computer. Literary and Linguistic Computing. - 1994. - V. 9. - № 2. - P. 125-136.
57. Ousaka Y.M, Yamazaki M.M. Automatic Analysis of the Canon in Middle Indo-Aryan by Personal Computer II. Literary and Linguistic Computing. - V.11. - № 1. - P. 9-17.
58. Rakshit G., Ghosh A., Bhattacharyya P., Haffari G. Automated Analysis of Bangla Poetry for Classification and Poet Identification // 12th international conference on natural language processing. - 2015. - [Электронный ресурс] URL: https://geetanjali-rakshit.github.io/research/homepage_papers/bangla_poetry.pdf (дата обращения: 21.03.2022).
59. Hidley, G. R. Some Thoughts Concerning the Application of Software Tools in Support of Old English Poetic Studies // Literary and Linguistic Computing. -1986. - V. 1. - № 3. - P. 156-162.
60. Hirjee H. Rhyme, Rhythm, and Rhubarb: Using Probabilistic Methods to Analyze Hip Hop, Poetry, and Misheard Lyrics. - University of Waterloo. - 2010. -[Электронный ресурс] URL:
https://uwspace.uwaterloo.ca/bitstream/handle/10012/5419/Hirjee_Hussein.pdf (дата обращения: 21.03.2022).
61. Agirrezabal M., Arrieta B., Astigarraga A., Hulden M. ZeuScansion: a Tool for Scansion of English Poetry // 11th international conference on finite state methods
and natural language processing. - 2013. - P. 18-24.
62. Delmonte R. Computing poetry style // Proceedings of 1st International Workshop ESSEM 2013 / CEUR Workshop Proceedngs. - 2013. -№ 1096. - P. 148155. - [Электронный ресурс] URL: http://ceur-ws.org/Vol-1096/paper11.pdf (дата обращения: 21.03.2022).
63. SPARSAR. - [Электронный ресурс] URL: https://sparsar.wordpress.com (дата обращения: 21.03.2022).
64. Delmonte R., Sara Tonelli, Marco Aldo Piccolino Boniforti, Antonella Bristot, Emanuele Pianta. 2005. "VENSES - a Linguistically-Based System for Semantic Evaluation" // Machine Learning Challenges. - Berlin: LNCS, Springer. -2005. - P. 344-371.
65. Bacalu C., Delmonte R. Prosodic Modeling for Speech Recognition // Atti del Workshop AI*IA, "Elab.Ling.e Ric", IRST Trento. - 1999. - P. 45-55.
66. Chishlom, D. Phonology and Style: A Computer-Assisted Approach to German Verse // Computers and the Humanities. - 1981. - V. 15. - P. 199-210.
67. Estes A., Hench C. Supervised Machine Learning for Hybrid Meter // 5th workshop on computational linguistics for literature. - 2016. - P. 1-8.
68. Metricalizer . - [Электронный ресурс] URL: https://metricalizer.de (дата обращения: 21.03.2022).
69. Bobenhausen K., Hammerich K. Métrique littéraire, métrique linguistique
et métrique algorithmique de l'allemand mises en jeu dans le programme Metricalizer . Traitement automatique des textes versifiés: problématiques et pratiques. // Languages.
- 2015. - V. 199. - № 3. - P. 67-87.
70. Freiburger Anthologie, Textgrid. - [Электронный ресурс] URL: https://metricalizer.de/en/about/ (дата обращения: 21.03.2022).
71. Wells J.C. Computer-coding the IPA: a proposed extension of SAMPA. -[Электронный ресурс] URL: https://www.phon.ucl.ac.uk/home/sampa/ipasam-x.pdf (дата обращения: 21.03.2022).
72. Sgallova, K. Vyuziti moderni techniky pri rozboru verse // Ceska literatura.
- 1964. - V. 12. - № 2. - P. 158-168.
73. Sgallová K. Thesaurus ceskych meter // Ceská literatura. - 1999. - V. 47. -№ 3. - P. 286-289.
74. Ibrahim R., Plechác P. Towards the Automatic Analysis of Czech Verse // Formal Methods in Poetics. - Lüdenscheid: RAM-Verlag, 2011. - P. 295-305.
75. Plechác, P. Czech Verse Processing System KVETA — Phonetic and Metrical Components // Glottotheory. - 2016. - V. 7. - № 7. - P. 159-174.
76. Plechác P., Kolár R. The Corpus of Czech Verse // Studia Metrica et Poetica. - 2015. - V. 2. - № 1. - 107-118.
77. Пильщиков И. А., Старостин А. С. Основные проблемы автоматизации базовых процедур ритмико-синтаксического анализа силлабо-тонических текстов // Национальный корпус русского языка: 2006-2008. Новые результаты и перспективы. - Санкт-Петербург: Нестор-История. - 2009. - С. 298-315.
78. Бойков В.Н., Каряева М.С., Соколов В.А., Пильщиков И.А. Об автоматической спецификации стиха в информационно-аналитической системе // CEUR Workshop Proceedings. - 2015. - V. 1536. - P. 144-151. - [Электронный ресурс] URL: http://ceur-ws.org/Vol-1536/paper22.pdf (дата обращения: 21.03.2022).
79. Гаспаров М. Л. Эволюция русской рифмы // Проблемы теории стиха. - Л.: Наука, 1984. - С. 3-6.
80. Поляков А.Е., Пильщиков И.А., Бергельсон М.Б. Конкорданс к текстам Ломоносова. - [Электронный ресурс] URL: http://feb-web.ru/feb/lomoconc/abc/ (дата обращения: 21.03.2022).
81. Поляков А.Е., Пильщиков И.А., Бергельсон М.Б. Конкорданс к текстам Ломоносова - концепция и реализация. - [Электронный ресурс] URL: http://www.dialog-21.ru/digests/dialog2009/materials/html/61.htm (дата обращения: 21.03.2022).
82. Ломоносов М. В. Полное собрание сочинений / АН СССР. - М.; Л., 1950—1983.
83. Электронное научное издание "Ломоносов" - [Электронный ресурс]
URL: http://feb-web.ru/feb/lomonos/default.asp7/feb/lomonos/texts/lo0/lo0.html (дата обращения: 21.03.2022).
54. Вавилонская Башня. Проект этимологической базы данных. Русские словари и морфология. - [Электронный ресурс] URL: http://starling.rinet.ru/indexru.htm (дата обращения: 21.03.2022).
55. Крылов С. А., Старостин С. А. Актуальные задачи морфологического анализа и синтеза в интегрированной информационной среде STARLING // Международная конференция "Диалог": Компьютерная лингвистика и интеллектуальные технологии. Архив. - 2003. - [Электронный ресурс] URL: http://www.dialog- 21.ru/Archive/2003/Krylov.htm (дата обращения: 21.03.2022).
56. Пильщиков И.А., Старостин А.С. Автоматическое распознавание метра: проблемы и решения // Славянский стих. - Т. 9. - М.: Рукописные памятники Древней Руси, 2012. - С. 492-498.
ST. Пильщиков И.А., Старостин А.С. Автоматическое распознавание стихотворных размеров: теория и практика // Поэтика и фоностилистика: Бриковский сборник. Выпуск 1: Материалы Международной научной конференции «I-е Бриковские чтения: Поэтика и фоностилистика. - М., 2010. - С. 41-49.
SS. Пильщиков И.А., Старостин А.С. Проблема автоматического распознавания метра: силлаботоника, дольник, тактовик // Отечественное стиховедение: 100-летние итоги и перспективы развития: Материалы Международной научной конференции 25-27 ноября 2010 г. Санкт-Петербург. -СПб. - 2010. - С. 397-406.
S9. Pilshchikov I., Starostin A. Automated Analysis of Poetic Texts and the Problem of Verse Meter // Current Trends in Metrical Analysis. Littera: Studies in Language and Literature = Studien Zur Sprache und Literatur; Vol. / Bd. 2. - Bern; Berlin. - 2011. - P. 133-140.
90. Pilshchikov I., Starostin A. Reconnaissance automatique des mètres des vers russes: Une approche statistique sur corpus // Langages. - 2015. - V. 3 - № 199. -P. 89-106.
91. Бойков В.Н., Захаров В. Е., Каряева М. С., Соколов В. А., Тезаурус по поэтологии как инструмент для информационного поиска и коллекции знаний // Моделирование и анализ информационных систем. - 2013. - Т. 20. - № 4. - С. 125-135. - [Электронный ресурс] URL: http://www.mathnet.ru/php/archive.phtml?wshow=paper&jrnid=mais&paperid=327&o ption_lang=rus (дата обращения: 21.03.2022).
92. Calin O. Statistics and machine learning experiments on English and Romanian Poetry // Applied Sciences. - 2020. - V. 2(4). - P. 92. - [Электронный ресурс] URL: https://doi.org/10.3390/sci2040092 (дата обращения: 21.03.2022).
93. Trask R. L. The Dictionary of Historical and Comparative Linguistics. -Edinburgh: University Press, 2000. - 403 p.
94. Барахнин В.Б., Федотов А.М., Бакиева А.М., Бакиев М.Н., Тажибаева С. Ж., Батура Т.В., Кожемякина О.Ю., Тусупов Д. А., Самбетаева М.А., Лукпанова Л.Х. Алгоритмы генерации стемматизации словоформ казахского языка // Cloud of Science. - 2017. - Т. 4. - № 3. - С. 434-449.
95. Barakhnin V.B., Kozhemyakina O.Yu., Ba^eva A.M., Sodboev M.K. The algorithms for complex analysis of the corpuses of poetic texts in the Kazakh language // Journal of Physics: Conf. Series. - 2018. - V. 1117. - 7 p. - [Электронный ресурс] URL: http://dx.doi.Org/10.1088/1742-6596/1117/1/012003 (дата обращения: 21.03.2022).
96. Barakhnin V.B., Fedotov A.M., Bakiyeva A.M., Bakiyev M.N., Tazhibayeva S.Zh., Batura T.V., Kozhemyakina O.Yu., Tussupov D.A., Sambetbaiyeva M.A., Lukpanova L.Kh. The software system for the study the morphology of the Kazakh language // The European Proceedings of Social & Behavioural Sciences. -2017. - V. XXXIII. - P. 18-27. - [Электронный ресурс] URL: http://dx.doi.Org/10.15405/epsbs.2017.12.3 (дата обращения: 21.03.2022).
97. Бакиева А.М. Программа генерации и стемматизации словоформ казахского языка. - [Электронный ресурс] URL: http://db4.sbras.ru/morpher
98. Грот Яков Карлович // Большая советская энциклопедия : [в 30 т.] / гл. ред. А. М. Прохоров. - 3-е изд. - М.: Советская энциклопедия, 1969-1978.
99. Декрет Совета Народных Комиссаров от 10 октября 1918 г. (по новому стилю) "О введении новой орфографии". - [Электронный ресурс] URL: https://ru.wikisource.org/wiki/Декрет_Наркомпроса_РСФСР,_СНК_РСФСР_от_10. 1 0.1918_«0_введении_новой_орфографии» (дата обращения: 21.03.2022).
100. Давыдов П.И. Справочник по старой орфографии русского языка. М.: Можайский полиграфический комбинат, 2013. - С. 11-13.
101. Славеница. - [Электронный ресурс] URL: http://slavenica.com/ (дата обращения: 21.03.2022).
102. Kozhemyakina O.Yu., Tagirova E.P. The translation algorithm from pre-reform spelling into modern spelling, taking into account the morphology of words // Journal of Physics: Conference Series. - 2019. - Vol. 1405. - Art. 012010. - ISSN 1742-6588. - EISSN 1742-6596.
103. Барахнин В.Б., Кожемякина О.Ю., Тагирова Е.П. Алгоритм перевода текстов из дореформенной орфографии в современную с учетом морфологии слов // Восьмая Международная конференция "Системный анализ и информационные технологии" САИТ - 2019: Труды конференции. -2019. - М.: ФИЦ ИУ РАН. - С. 199-206.
104. Segalovich I. A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine // Proceedings of the International Conference on Machine Learning; Models, Technologies and Applications. MLMTA. -2003. - P. 273-280.
105. Korobov M. Morphological Analyzer and Generator for Russian and Ukrainian Languages // Analysis of Images, Social Networks and Texts. AIST 2015. Communications in Computer and Information Science. - 2015. -V. 542. - P. 320-332.
- [Электронный ресурс] URL: http://dx.doi.org/10.1007/978-3-319-26123-2_31 (дата обращения: 21.03.2022).
106. Dereza O.V., Kayutenko D.A., Fenogenova A.S. Automatic morphological analysis for Russian: A comparative study // Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference "Dialogue". - 2016.
- [Электронный ресурс] URL: https://www.dialog-21.ru/media/3473/dereza.pdf (дата
обращения: 21.03.2022).
107. Морфологический анализатор pymorphy2. Руководство пользователя -https://pymorphy2.readthedocs.io/en/latest/user/guide.html#select-correct (дата обращения: 21.03.2022).
108. В.И. Барковский, П.С. Кузнецов. Историческая грамматика русского языка. - М.: КомКнига, 2006. - С. 152.
109. Барахнин В.Б., Кожемякина О.Ю., Кузнецова И.В., Карпова В.А. Модель фактуры русских поэтических текстов // Вычислительные технологии. -2021. - Т. 26. - № 3. - С. 107-117. - [Электронный ресурс] URL: https://doi.org/10.25743/ICT.2021.26.3.007 (дата обращения: 21.03.2022).
110. Квятковский А.П. Поэтический словарь. - М.: Советская энциклопедия, 1966. - 276 с.
111. Пушкин А.С. Полное собрание сочинений: В 6 т. (Приложение к журналу "Красная нива"). - М.; Л.: Гослитиздат, 1930-1931.
112. Барахнин В.Б., Кожемякина О.Ю., Карпова В.А, Кузнецова И.В. Программа определения фактур русских поэтических текстов // Свидетельство о государственной регистрации программы для ЭВМ № 2021664226 от 01.09.2021 г. - Заявка № 2021663325 от 24.08.2021 г. (Федеральная служба по интеллектуальной собственности). - [Электронный ресурс] https://new.fips.ru/ofpstorage/Doc/PrEVM/RUNWPR/000/002/021/664/226/202166422 6-00001/document.pdf (дата обращения: 21.03.2022).
113. Crockford D. The application / JSON media type for JavaScript Object Notation (JSON) // Internet Engineering Task Force. - 2006. -https://www.rfc-editor.org/rfc/pdfrfc/rfc4627.txt.pdf10 (дата обращения: 21.03.2022).
114. Common format and MIME type for Comma-Separated Values (CSV). -[Электронный ресурс] URL: https://www.rfc-editor.org/rfc/rfc4180 (дата обращения: 21.03.2022).
115. Зализняк А. А. Грамматический словарь русского языка: словоизменение: около 10000 слов. - М.: Русский язык, 1980. — 880 c.
116. Barakhnin V.B., Kozhemyakina O.Yu., Kuznetsova I.V. Development and
Implementation of the Algorithm for Automatic Analysis of Metrorhythmic Characteristics of Russian Poetic Texts // CEUR Workshop Proceedings. - 2019. - V. 2523. - P. 290-298.
117. Система анализа поэтических текстов ФИЦ ИВТ. - [Электронный ресурс] URL: http://poem.ict.nsc. ru/meterrhyme (дата обращения: 21.03.2022).
118. Большой словарь рифм. - [Электронный ресурс] URL: https://rifmovnik.ru/find.htm (дата обращения: 21.03.2022).
119. Жирмунский В.М. Рифма, ее история и теория. - Петроград: Academia, 1923. - 339 c.
120. Барахнин В.Б., Кожемякина О.Ю., Кузнецова И.В. Программа автоматического анализа метроритмических характеристик поэтических текстов на русском языке // Свидетельство о государственной регистрации программы для ЭВМ № 2020663072 от 22.10.2020 г. - Заявка № 2020662151 от 12.10.2020 г. (Федеральная служба по интеллектуальной собственности). -- [Электронный ресурс] URL:
https://www1.fips.ru/ofpstorage/Doc/PrEVM/RUNWPR/000/002/020/663/072/2020663 072-00001/document.pdf (дата обращения: 21.03.2022).
121. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В. Алгоритмы комплексного анализа русских поэтических текстов с целью автоматизации процесса создания метрических справочников и конкордансов // CEUR Workshop Proceedings. — 2015. — V. 1536. — P. 138-143. - [Электронный ресурс] URL: http://ceur-ws.org/Vol-1536/paper21.pdf (дата обращения: 21.03.2022).
122. Козьмин А.В. Автоматический анализ стиха в системе Starling // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции "Диалог 2006". - 2006. - С. 265-268.
123. Барахнин В.Б., Кожемякина О.Ю., Кузнецова И.В., Тагирова Е.П., Борзилова Ю.С. Разработка и практическая реализация алгоритмов создания электронных метроритмических справочников и конкордансов // Cloud of Science. - 2020. - Т. 7. - № 1. - С. 135-155.
124. Delmonte R. A Computational Approach to Poetic Structure, Rhythm and
Rhyme // Proceedings of CLiC-it - The First Italian Conference on Computational Linguistics, Pisa: University Press Delmonte R. - 2014. - V. 1. - P. 144-150.
125. Greene E., Bodrumlu T., Knight K. Automatic Analysis of Rhythmic Poetry with Applications to Generation // Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing. - 2010. - [Электронный ресурс] URL: https://www.semanticscholar.org/paper/Automatic-Analysis-of-Rhythmic-Poetry-with-to-and-Greene-Bodrumlu/a5e4c83b816f2f004ae5dfd600145cea9ea15724 (дата обращения: 21.03.2022).
126. Tánásescu (Margento) C., Paget B., Inkpen D. Automatic Classification of Poetry by Meter and Rhyme // Proceedings of AAAI 2016. - [Электронный ресурс] URL: https://aaai.org/ocs/index.php/FLAIRS/FLAIRS16/paper/viewFile/12923/12883 (дата обращения: 21.03.2022).
127. The Scandroid. - http://charlesohartman.com/verse/scandroid/index.php (дата обращения: 21.03.2022).
128. The Carnegie Melon University Pronouncing Dictionary. -http://www.speech.cs.cmu.edu/cgi-bin/cmudict (дата обращения: 21.03.2022).
129. SPSS Statistics. - [Электронный ресурс] URL: https://www.ibm.com/ru-ru/products/spss-statistics_(дата обращения: 21.03.2022).
130. Kaplan D., Blei D. Computational analysis and visualized comparison of style in American poetry. Unpublished undergraduate thesis. - 2006. - [Электронный ресурс] URL: https://www.semanticscholar.org/paper/Computational-Analysis-and-Visualized-Comparison-of-Kaplan-Blei/a465c9b65f3f99ec6ee9cb1bea0da9b5c46bd94a (дата обращения: 21.03.2022).
131. Mittmann A. Escansao Automático de Versos em Portugués. Tesis (Doctorado), Universidade Federal de Santa Catarina. - 2016. - P. 52-54. -[Электронный ресурс] URL: https://repositorio.ufsc.br/handle/123456789/175819 (дата обращения: 21.03.2022).
132. Гаспаров М.Л. Метр и смысл. Об одном из механизмов культурной памяти. - М., РГГУ. - 1999. - 297 c.
133. Лотман М.Ю. Между вещью и пустотой (Из наблюдений над
поэтикой сборника Иосифа Бродского «Урания») // О поэтах и поэзии. — С. -Петербург: «Искусство—СПБ», 1996. — С. 731-746.
134. Вахтель М. «Черная шаль» и ее метрический ореол // Русский стих: метрика, ритмика, рифма, строфика. - М.: РГГУ, 1996. - С. 61-80.
135. Червенка М. Смысл и стих: Труды по поэтике. - М., 2011. - 465 c.
136. Барахнин В. Б., Кожемякина О. Ю. Об автоматизации комплексного анализа русского поэтического текста // CEUR Workshop Proceedings. - 2012. - Т. 934. - С. 167-171. - [Электронный ресурс] URL: http://ceur-ws.org/Vol-934/paper27.pdf (дата обращения: 21.03.2022).
137. Мельчук И. А. Язык: от смысла к тексту. — М. : Языки славянских культур, 2012. - 176 c. - http://biblioclub.ru/index.php?page=book&id=219899 (дата обращения: 21.03.2022).
138. Барахнин В.Б., Кожемякина О.Ю., Рычкова Е.В., Борзилова Ю.С. Автоматическое выделение словосочетаний из текстов славянского происхождения: сравнение подходов // Cloud of Science. - 2018. - Т. 5. - № 4. - С. 713-728.
139. Ванюшкин А.С., Гращенко Л.А. Методы и алгоритмы извлечения ключевых слов // Новые информационные технологии в автоматизированных системах. - 2016. - № 19. - С. 85-93. - [Электронный ресурс] URL: https://cyberleninka.ru/article/v/metody-i-algoritmy-izvlecheniya-klyuchevyh-slov (дата обращения: 21.03.2022).
140. Vetulani Z., Obr^bski T., Vetulani G. Towards a Lexicon-Grammar of Polish: Extraction of Verbo-Nominal Collocations from Corpora // Proceedings of the Twentieth International Florida Artificial Intelligence Research Society Conference. -2007. - Р. 267-268. - [Электронный ресурс] URL: https://pdfs.semanticscholar.org/6a85/761345a366948cf9a30bffb808ffeaea67d5.pdf (дата обращения: 21.03.2022).
141. Instytut Podstaw Informatyki PAN. - [Электронный ресурс] URL: https://ipipan.waw.pl/ (дата обращения: 21.03.2022).
142. Broda B., Derwojedowa M., Piasecki M. Recognition of structured
collocations in an inflective language // Systems Science. - 2008. - V. 34(4). -[Электронный ресурс] URL:
https://www.researchgate.net/publication/266593107_Recognition_of_structured_colloc ations_in_an_inflective_language (дата обращения: 21.03.2022).
143. Толубко В. Б., Литвиненко Л. О. Розробка моделi автоматичного синтаксичного аналiзу i синтезу тексту в ^creMi машинного перекладу // Вюник Ки1вського нацюнального ушверситету iMem Тараса Шевченка. - 2013. - Вып. 2(31). - С. 57-59. - [Электронный ресурс] URL: http://www.library.univ.kiev.ua/ukr/host/10.23.10.100/db/ftp/visnyk/viyskovi_31_2013. pdf (дата обращения: 21.03.2022).
144. Khairova N., Petrasova S., Gautam A. P. S. The logic and linguistic model for automatic extraction of collocation similarity // Econtechmod. -2015. - V. 4. - № 4. - P. 43-48. - [Электронный ресурс]
URL:http://journals.pan.pl/dlibra/publication/99282/edition/85586/content (дата
обращения: 21.03.2022).
145. OpenCorpora: открытый корпус русского языка. - [Электронный ресурс] URL: http://opencorpora.org/ (дата обращения: 21.03.2022).
146. Морфологический анализатор pymorphy2 на сайте GitHub. -[Электронный ресурс] URL: https://github.com/ kmike/pymorphy2 (дата обращения: 21.03.2022).
147. Кощеева С. С. Сравнение методов автоматического выделения глагольно-именных словосочетаний // Технологии информационного общества в науке, образовании и культуре: сборник научных статей. Труды XVII Всероссийской объединенной конференции "Интернет и современное общество" (IMS-2014). — СПб. : Университет ИТМО. - 2014. - С. 298-303. - [Электронный ресурс] URL: http://ojs.ifmo.ru/index.php/IMS/article/view/270/266 (дата обращения: 21.03.2022).
148. Программное средство IntelliText - [Электронный ресурс] URL: http://corpus.leeds.ac.uk/it/ (дата обращения: 21.03.2022).
149. Москвина А. Д., Митрофанова О. А., Ерофеева А. Р., Харабет Я. К.
Автоматическое выделение ключевых слов и словосочетаний из русскоязычных корпусов текстов с помощью алгоритма RAKE // Труды международной конференции "Корпусная лингвистика-2017". — СПб. - 2017. - С. 268-274.
150. Соколова Е. В., Митрофанова О. А. Автоматическое извлечение ключевых слов и словосочетаний из русскоязычных текстов с помощью алгоритма KEA // Компьютерная лингвистика и вычислительные онтологии. Выпуск 1. Труды XX Международной объединенной научной конференции «Интернет и современное общество» (IMS-2017). — СПб. : Университет ИТМО. - 2017. - С. 157-165. - [Электронный ресурс] URL: http://openbooks.ifmo.ru/ru/file/6522/6522.pdf (дата обращения: 21.03.2022).
151. Москвина А. Д., Орлова Д., Паничева П. В., Митрофанова О. А. Разработка ядра синтаксического анализатора для русского языка на основе библиотек NLTK // Компьютерная лингвистика и вычислительные онтологии. Труды XIX Международной объединенной научной конференции «Интернет и современное общество» (IMS-2016). — СПб. : Университет ИТМО. - 2016. - С. 44-45. - [Электронный ресурс] URL: http://openbooks.ifmo.ru/ru/file/4103/4103.pdf (дата обращения: 21.03.2022).
152. Международная конференция по компьютерной лингвистике ДИАЛОГ. - [Электронный ресурс] URL: http://www.dialog-21.ru (дата обращения: 21.03.2022).
153. Enikeeva E. V., Mitrofanova O. A. Russian Collocation Extraction Based on Word Embeddings // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference "Dialogue 2017" - [Электронный ресурс] URL: http://www.dialog-21.ru/media/3908/enikeevaevmitrofanovaoa.pdf (дата обращения: 21.03.2022).
154. Kazennikov A. O. Part-of-Speech Tagging: The Power of the Linear SVM-based Filtration Method for Russian Language // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference "Dialogue 2017". - [Электронный ресурс] URL: http://www.dialog-21.ru/media/3916/kazennikovao.pdf (дата обращения: 21.03.2022).
155. Stepanova M. E., Budnikov E. A., Chelombeeva A. N., Matavina P. V., Skorinkin D. A. Information Extraction Based on Deep Syntactic-Semantic Analysis // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference "Dialogue 2016". - [Электронный ресурс] URL: http://www.dialog-21.ru/media/3431/stepanovameetal.pdf (дата обращения: 21.03.2022).
156. Барахнин В. Б., Ткачев Д. А. Кластеризация текстовых документов на основе составных ключевых термов // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2010. - Т. 8. - № 2. - С. 514. - [Электронный ресурс] URL: https://nsu.ru/xmlui/bitstream/ handle/nsu/284/01.pdf (дата обращения: 21.03.2022).
157. Барахнин В. Б., Пастушков И. С. Технология автоматизированного наполнения онтологии фактографической поисковой системы // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - 2015. - Т. 13. - № 4. - С. 5-13. - [Электронный ресурс] URL: https://nsu.ru/xmlui/bitstream/handle/nsu/10148/2015_13_4_01.pdf (дата обращения: 21.03.2022).
158. Лапшина Н.В., Романович И.К., Ярхо Б.И. Из материалов «Метрического справочника к стихотворениям М.Ю. Лермонтова» / Вступ. статья и публикация М.Л. Гаспарова // Вопросы языкознания. - 1966. - № 2. - С. 125137.
159. Баевский В. С. Справочные труды по поэзии Пушкина и его современников / Временник Пушкинской комиссии. АН СССР. Отделение литературы и языка. Пушкинская комиссия. - СПб.: Наука, 1991. - Выпуск 24. -С. 65-79.
160. Аношкина Ж.Г. Лингвистический программно-источниковый пакет UNILEX+. Тексто-ориентированная компонента UNILEX-T // Бюллетень Машинного фонда русского языка. - 1992. - Вып. 2. - С. 3-7.
161. Гик А.В. Конкорданс к стихотворениям М. Кузмина. Т. 1-4. - М.: Языки славянской культуры. - 2005-2015.
162. Бурлешин А.В. Из песеньки слов не выкинешь... (Рецензия на книгу Конкорданс к стихотворениям М. Кузмина. Т. 1. М., 2005) // Новое литературное обозрение. - 2006. - № 3. - С. 370-384.
163. Поляков А.Е. Словарь языка А.С. Грибоедова. - [Электронный ресурс] URL: http://feb-web.ru/feb/concord/abc/ (дата обращения: 21.03.2022).
164. Словарь полного фонетического разбора. - [Электронный ресурс] URL: http://slovonline.ru/slovar_el_fonetic/ (дата обращения: 21.03.2022).
165. Морфологический анализатор. - [Электронный ресурс] URL: http://starling.rinet.ru/cgi-bin/morphque.cgi?encoding=win (дата обращения: 21.03.2022).
166. Ефремова Т.Ф. Толковый словарь омонимов русского языка. М.: Аванта+. - 2007. - 1408 С.
167. Поляков А.Е., Пильщиков И.А. Конкорданс к текстам Ломоносова — концепция и реализация. - М., 2009 - [Электронный ресурс] URL: http://feb-web.ru/feb/lomoconc/abc/preface.htm (дата обращения: 21.03.2022).
168. Частотный словарь-конкорданс словоформ языка Ф. И. Тютчева. — [Электронный ресурс] URL: http://ruthenia.ru/tiutcheviana/stihi/freq/freq.html (дата обращения: 21.03.2022).
169. Зеленков Ю. Г., Сегалович И. В., Титов В. А. Вероятностная модель снятия морфологической омонимии на основе нормализующих подстановок и позиций соседних слов // Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара Диалог. — 2005. — С. 188-197.
170. Сокирко А. В., Толдова С. Ю. Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп) // В: Интернет-математика, 2005. Автоматическая обработка веб-данных. - М.: Яndex. - 2005. - С. 80-94.
171. Русский Викисловарь. - [Электронный ресурс] URL: https://ru.wiktionary.org/ (дата обращения: 21.03.2022).
172. Викисловарь: Список литературы. - [Электронный ресурс] URL:
https://ru.wiktionary.org/wiki/Викисловарь:Список_литературы (дата обращения: 21.03.2022).
173. Лесцова М.А. Определение ядра и периферии жанров оды, песни, послания, элегии и эпитафии на материале английских поэтов-сентименталистов XVIII века // Вестник Челябинского государственного педагогического университета. - 2014. - Вып. 4. - C. 196-205.
174. Орлов Ю.Н., Осминин К.П. Определение жанра и автора литературного произведения статистическими методами // Прикладная информатика. - 2010. - Т. 26. - № 2. - С. 95-108.
175. Орлов Ю.Н., Осминин К.П. Методы статистического анализа литературных текстов. - М.: URSS, 2012. - 300 с.
176. Barakhnin V.B., Kozhemyakina O.Yu., Pastushkov I.S. Automated Determination of the Type of Genre and Stylistic Coloring of Russian Texts // ITM Web of Conferences. - 2017. - Vol. 10. - Art. 02001. - [Электронный ресурс] URL: https://doi.org/10.1051/itmconf/20171002001 (дата обращения: 21.03.2022).
177. Vapnik V.N. The Nature of Statistical Learning Theory. - Springer-Verlag, 1995. - 314 p.
178. Грехнев В.А. Лирика Пушкина. О поэтике жанров. - Горький: Волго-Вятское книжное издательство, 1985. - С. 234.
179. Барахнин В.Б., Кожемякина О.Ю. К проблеме аутентичности фонетического анализа в связи с возможными особенностями авторской орфографии (на примере чередования окончаний -ой/-ый в лирике А.С. Пушкина) // Вестник Томского государственного университета. Филология. -2016. - Т. 13. - № 2. - С. 5-28.
180. Ломоносов М.В. Предисловие о пользе книг церковных в российском языке // Ломоносов М. В. Полное собрание сочинений. - Т. 7. - М.; Л.: Издательство АН СССР, 1952. - С. 585-592.
181. Свободина С.Ф. К вопросу о философской направленности и жанровых особенностях стихотворения А.С. Пушкина «Безверие» // Пушкинский музеум: альманах. Вып. 6. - СПб.: Всероссийский музей А.С. Пушкина, 2014. - С.
261-270.
182. Ахманова О.С. Очерки по общей и русской лексикологии. - М.: Учпедгиз, 1957. - 295 с.
183. Freund Y., Schapire R.E. and Abe, N., A Short Introduction to Boosting // Journal of Japanese Society for Artificial Intelligence. - 1999. - V. 14. - № 5. -P. 771780.
184. Friedman J.H. Stochastic gradient boosting // Computational Statistics and Data Analysis. - 2002. - V. 38. - Iss. 4. - P. 367-378.
185. Wolpert D.H. Stacked generalization // Neural Networks. - 1992. V. 5. -Iss. 2. - P. 241-259.
186. Chawla N.V. Data Mining for Imbalanced Datasets: An Overview // Data Mining and Knowledge Discovery Handbook' Springer-Verlag. - 2010. - P. 875-886.
187. Cover T.M., Hart P.E. Nearest Neighbor Pattern Classification // IEEE Transactions on Information Theory. - 1967. - V. 13. - Iss. 1. - P. 21-27.
188. Mikolov T., Kai Chen, Corrado G., Dean J. Efficient Estimation of Word Representations in Vector Space // Computation and Language, 2013. - [Электронный ресурс] URL: https://doi.org/10.48550/arXiv.1301.3781 (дата обращения: 21.03.2022).
189. Barakhnin V.B., Kozhemyakina O.Yu., Pastushkov I.S. Comparative analysis of methods of automated classification of poetic texts based on lexical signs // CEUR Workshop Proceedings. - 2017. - V. 2022. - P. 252-257. - [Электронный ресурс] URL: http://ceur-ws.org/Vol-2022/paper41.pdf (дата обращения: 21.03.2022).
190. Barakhnin V.B., Kozhemyakina O.Yu., Zabaykin A.V. Usage of modern computer technologies in the learning process of the philologists of complex analysis of Russian poetic texts // SHS Web of Conferences. - 2016. - V. 29. - Art.UNSP02002. -[Электронный ресурс] URL: http://dx.doi.org/10.1051/shsconf/20162902002 (дата обращения: 21.03.2022).
191. Mansurova M.E., Barakhnin V.B., Aubakirov S.S., Khibatkhanuly Ye., Mussina A.B. Parallel text document clustering based on genetic algorithm // CEUR
Workshop Proceedings. - 2017. -V. 1839. - P. 218-232. - [Электронный ресурс] URL: http://ceur-ws.org/Vol-1839/MIT2016-p20.pdf (дата обращения: 21.03.2022).
192. Мансурова М.Е., Барахнин В.Б., Аубакиров С. С., Хибатханулы Е., Мусина А.Б. Разработка параллельного алгоритма кластеризации текстовых документов FRiS-Tax на основе технологии MPI // CEUR Workshop Proceedings. -2016. -V. 1576. - P. 244-256. - [Электронный ресурс] URL: http://ceur-ws.org/Vol-1576/128.pdf (дата обращения: 21.03.2022).
193. Scikit-learn: Machine Learning in Python - [Электронный ресурс] URL: http://scikit-learn.org/ (дата обращения: 21.03.2022).
194. ELI5's documentation. - [Электронный ресурс] URL: http://eli5.readthedocs.io/ (дата обращения: 21.03.2022).
195. Барахнин В.Б., Кожемякина О.Ю., Рычкова Е.В., Пастушков И.С., Борзилова Ю.С. Извлечение лексических и метроритмических признаков, характерных для жанра и стиля и их комбинаций в процессе автоматизированной обработки текстов на русском языке // Современные информационные технологии и ИТ-образование. - 2018. - Т. 14. - № 4. - С. 876-883. -[Электронный ресурс] URL: https://doi.org/10.25559/SITITO.14.201804.888-895 (дата обращения: 21.03.2022).
196. Haykin S. Neural Networks: A Comprehensive Foundation. 2nd Edition. -Prentice Hall PTR Upper Saddle River, NJ, USA. - 1999. - 842 p.
197. Ribeiro M. T., Singh S., Guestrin C. Why should I trust you? Explaining the predictions of any classifier // Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. - 2016. - P. 1135-1144. -[Электронный ресурс] URL: https://doi.org/10.48550/arXiv.1602.0493 (дата обращения: 21.03.2022).
198. Forcier J., Bissex P., Chun W. Python Web Development with Django. -Addison-Wesley Professional. - 2008. - 377 p.
199. Spurlock J. (2013). Bootstrap: Responsive Web Development. - O'Reilly Media Inc. - 2013. - 128 p.
200. Obe R., Hsu L. PostgreSQL: Up and Running: A Practical Guide to the
Advanced Open Source Database. - O'Reilly Media Inc. - 2017. - 314 p.
201. Marrs, T. (2017). JSON at Work: Practical Data Integration for the Web. -O'Reilly Media Inc. - 2017. - 376 p.
202. Breiman L. 1999. Pasting small votes for classification in large databases and on-line // Machine learning. - 1999. - V. 36(1-2). - P. 85-103.
203. Kearney K. T., Torelli F. The SLA model Service Level Agreements for Cloud Computing. - New York: Springer, 2011. - P. 43-67.
204. Барахнин В.Б., Кожемякина О.Ю., Борзилова Ю.С. Проектирование информационной системы представления результатов комплексного анализа поэтических текстов // Вестник НГУ. Сер.: Информационные технологии. - 2019. - Т. 17. - Вып. 1. - С. 5-17. - [Электронный ресурс] URL: http://dx.doi.org/10.25205/1818-7900-2019-17-1-5-17 (дата обращения: 21.03.2022).
205. Silberschatz A., Galvin P.B. and Gagne G., Operating system principles. -John Wiley & Sons. - 2006. - 920 p.
206. Chen T., Guestrin C. Xgboost: A scalable tree boosting system // Proceedings of the 22nd ACM Sigkdd International Conference on Knowledge Discovery and Data Mining. - 2016. - P. 785-794.
207. Home Page for 20 Newsgroups Data Set. - [Электронный ресурс] URL: http://qwone.com/~jason/20Newsgroups/ (дата обращения: 21.03.2022).
208. McAfee R.P., McMillan J. Auctions and bidding // Journal of economic literature. - 1987. - V. 25(2). - P. 699-738.
209. Chard K, Caton S, Rana O., Bubendorfer K. Social cloud: Cloud computing in social networks // IEEE 3rd International Conference on Cloud Computing. - 2010. - P. 99-106.
210. Tanaev V. S., Gordon V. S., & Shafransky Ya. M. Schedule theory, singlestage systems. - Springer Science and Business Media, 1994. - 372 p. - [Электронный ресурс] URL: https://doi.org/10.1007/978-94-011-1190-4 (дата обращения: 21.03.2022).
211. Vickrey W. Counter speculation, auctions, and competitive sealed tenders
// The Journal of finance. - 1961. - V. 16(1). - P. 8-37.
212. Katok E., Kwasnica A. M. Time is money: The effect of clock speed on seller's revenue in Dutch auctions // Experimental Economics. - 2008. - V. 11 (4). - P. 344-357.
213. Барахнин В.Б., Кожемякина О.Ю., Пастушков И.С. Сравнительный анализ методов автоматической классификации поэтических текстов на основе лексических признаков // CEUR Workshop Proceedings. - 2017. - V. 2022. - P. 252257.
214. Sadman N., Gupta K.D., Haque A., Sen S., Poudyal S. Stylometry as a reliable method for fallback authentication // Proceedings of the 17th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology. - 2020. - 10.1109/ECTI-CON49241.2020.9158216.
215. Kwon H., Lee S. Textual Backdoor Attack for the Text Classification System Security and Communication Networks // Special Issue Artificial Intelligence for Cyberspace Security. - Volume 2021. - Article ID 2938386 - [Электронный ресурс] URL: https://doi.org/10.1155/2021/2938386 (дата обращения: 21.03.2022).
216. Kwon H. Dual-Targeted Textfooler Attack on Text Classification Systems // IEEE Access. - 2021. - PP (99). - V. 4. - [Электронный ресурс] URL: doi:10.1109/ACCESS.2021.3121366 (дата обращения: 21.03.2022).
217. Mamgain S., Balabantaray R.C., Das A.K. Author Profiling: Prediction of Gender and Language Variety from Document // Proceedings of the 2019 International Conference on Information Technology (ICIT). - 2019. - P. 473-477.
218. Гаспаров М.Л. Стихотворение // Литературный энциклопедический словарь. - М.: Советская энциклопедия, 1987. - 751 с.
219. Бельчиков Ю.А. Стих // Литературный энциклопедический словарь. -М.: Советская энциклопедия, 1987. - 751 с.
220. Anwar D., Bajwa I., Ramzan S. Design and Implementation of a Machine Learning-Based Authorship Identification Model // Scientific Programming. - 2019(3). - V. 14. - [Электронный ресурс] URL: DOI:10.1155/2019/9431073 (дата обращения: 21.03.2022).
221. Lagutina K., Lagutina N., Boychuk E., Vorontsova I., Shliakhtina E., Belyaeva O., Paramonov I., Demidov P.G. A Survey on Stylometric Text Features // Proceedings of the 25th Conference of Open Innovations Association (FRUCT). -2019. - P. 184-195. - [Электронный ресурс] URL: doi:10.23919/FRUCT48121.2019.8981504 (дата обращения: 21.03.2022).
222. Батура Т.В. Формальные методы установления авторства текстов и их реализация в программных продуктах // Программные продукты и системы. -2013. - № 4. - С. 286-295.
223. Plechac P., Bobenhausen K., Hammerich B. Versification and authorship attribution. A pilot study on Czech, German, Spanish, and English poetry // Studia Metrica et Poetica. - 2018. - V. 5. - № 2. - P. 29-54.
224. Timofeeva, M. Comparative Analysis of Reasoning in Russian Classic Poetry // Applied Sciences. - 2021. - V. 11. - 8665. - [Электронный ресурс] URL: https://doi.org/ 10.3390/app11188665 (дата обращения: 21.03.2022).
225. Halvani O., Graner L., Regev R. Cross-domain authorship verification based on topic agnostic features // Proceedings of the Working Notes of CLEF. - 2020.
- [Электронный ресурс] URL: http://ceur-ws.org/Vol-2696/paper_114.pdf (дата обращения: 21.03.2022).
226. PAN: Shared Tasks. - [Электронный ресурс] URL: https://pan.webis.de (дата обращения: 21.03.2022).
227. Jafariakinabad F., Hua K.A. A Self-Supervised Representation Learning of Sentence Structure for Authorship Attribution // arXiv 2020, arXiv:2010.06786. -[Электронный ресурс] URL: https://arxiv.org/abs/2010
228. Custodio J.E., Paraboni I. An ensemble approach to cross-domain authorship attribution // Proceedings of the International Conference of the Cross-Language Evaluation Forum for European Languages. - 2019. -P. 201-212.
229. Chashchin S.V. Application of "supervised" machine learning methods for text attribution: Individual approaches and intermediate results in identifying authors of Russian-language texts // Probl. Criminol. Forensic Sci. Forensic Exam. - 2018. - V. 1.
- P. 139-147.
230. Батура Т.В., Формальные методы определения авторства текстов // Вестник НГУ. Серия: Информационные технологии. 2012. - Т. 10. - IT Выпуск 4. - C. 81-94. - [Электронный ресурс] URL: https://lib.nsu.ru/xmlui/handle/nsu/258 (дата обращения: 21.03.2022).
231. Romanov A., Kurtukova A., Shelupanov A., Fedotova A., Goncharov V. Authorship Identification of a Russian-Language Text Using Support Vector Machine and Deep Neural Networks// Future Internet 2021. - V. 13(1):3. - [Электронный ресурс] URL: https://doi.org/ 10.3390/fi13010003 (дата обращения: 21.03.2022).
232. Yoon K. Convolutional Neural Networks for Sentence Classification // arXiv 2014. - [Электронный ресурс] URL: https://arxiv.org/pdf/1408.5882.pdf (дата обращения: 21.03.2022).
233. Barlas G., Stamatatos E. Cross-Domain Authorship Attribution Using Pre-Trained Language Models // Proceedings of the IFIP International Conference on Artificial Intelligence Applications and Innovations. - 2020. - P. 255-266. -[Электронный ресурс] URL: https://link.springer.com/content/pdf/10.1007%2F978-3-030-49161-1_22.pdf (дата обращения: 21.03.2022).
234. Hou R., Huang C.-R. Robust stylometric analysis and author attribution based on tones and rimes. // Natural Language Engineering. - 2020. V. 26. - P. 49-71.
235. Boychuk E., Lagutina K., Vorontsova I., Mishenkina E., Belyayeva O. Evaluating the Performance of a New Text Rhythm Analysis Tool // English Studies at NBU. - 2020. - V. 6. - Iss. 2. - P. 217-232.
236. Amancio D.R. A complex network approach to stylometry // PloS one. -2015. - V. 10. № 8. - [Электронный ресурс] URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0136076 (дата обращения: 21.03.2022).
237. Stanisz T., Kwapien J., Drozdz S. Linguistic data mining with complex networks: A stylometric-oriented approach // Information Sciences. - 2019. - V. 482. -P. 301-320.
238. Ferracane E., Wang S., Mooney R. Leveraging discourse information effectively for authorship attribution // Proceedings of the Eighth International Joint
Conference on Natural Language Processing. - 2017. - V. 1. - 2017, P. 584-593.
239. Rhetorical Structure Theory. - [Электронный ресурс] URL: https://www.sfu.ca/rst/01intro/intro.html (дата обращения: 21.03.2022).
240. Фундаментальная электронная библиотека "Русская литература и фольклор". - [Электронный ресурс] URL: http://feb-web.ru/ (дата обращения: 21.03.2022).
241. Русская виртуальная библиотека. - [Электронный ресурс] URL: https://rvb.ru/ (дата обращения: 21.03.2022).
242. UDPipe2. - [Электронный ресурс] URL: https://ufal.mff.cuni.cz/udpipe/2 (дата обращения: 21.03.2022).
243. Marneffe M.-C., Manning C., Nivre J., Zeman D. Universal Dependencies // Computational Linguistics, ISSN 1530-9312, 2021. - V. 47. - № 2. - P. 255-308. -[Электронный ресурс] URL: https://doi.org/10.1162/coli_a_00402 (дата обращения: 21.03.2022).
244. Welcome to the SHAP documentation. - [Электронный ресурс] URL: https://shap.readthedocs.io/en/latest/index.html#_(дата обращения: 21.03.2022).
245. Barakhnin V.B., Kozhemyakina O.Yu., Mukhamediev R.I., Borzilova Yu.S., Yakunin K.O. The design of the structure of the software system for processing text document corpus // Business Informatics. - 2019. - Vol. 13. - N 4. - P. 60-72. -[Электронный ресурс] URL: http://dx.doi.org/10.17323/1998-0663.2019.4.60.72 (дата обращения: 21.03.2022).
246. Barakhnin V., Kozhemyakina O., Grigorieva I.V. Determination of the Features of the Author's Style of A.S. Pushkin's Poems by Machine Learning Methods // Applied Sciences. - 2022. - 12. - 1674. - [Электронный ресурс] URL: https://doi.org/10.3390/ app12031674 (дата обращения: 21.03.2022).
247. Шокин Ю. И., Федотов А. М., Барахнин В. Б. Проблемы поиска информации.— Новосибирск: Наука, 2010. — 196 С. - С. 33.
248. Шокин Ю. И., Федотов А. М., Барахнин В. Б. Проблемы поиска информации.— Новосибирск: Наука, 2010. — 196 С. — С. 34.
249. Анализ поэтических текстов онлайн. - [Электронный ресурс] URL:
http://poem.ict.nsc.ru/ (дата обращения: 21.03.2022).
250. Запись доклада А. С. Старостина «Инструментальная среда для работы с русскоязычными стихотворными корпусами и их специализированной разметкой». - [Электронный ресурс] URL: https://youtu.be/TUWIzxtveNY (дата обращения: 21.03.2022).
251. Bulygin M. V., Sharoff S. A. Using Machine Translation for Automatic Genre Classification in Arabic // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference "Dialogue 2018". - 2006. -P.153-162.
252. Loukachevitch N.V., Rusnachenko N. Extracting Sentiment Attitudes from Analytical Texts // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference "Dialogue 2018". - 2018. - P. 459-468. -[Электронный ресурс] URL: https://www.dialog-21.ru/media/4317/loukachevitchnv_rusnachenkon.pdf (дата обращения: 21.03.2022).
253. Barakhnin V.B., Kozhemyakina O.Yu., Rychkova E.V., Gladkikh A.S., Pastushkov I.S. Software for learning to solve problems of classification using of machine learning // European Proc. of Social & Behavioural Sciences. - 2018. - P. 106-112. - [Электронный ресурс] URL: https://www.europeanproceedings.com/files/data/article/93/3694/article_93_3694_pdf_ 100.pdf (дата обращения: 21.03.2022).
254. Барахнин В.Б., Кожемякина О.Ю., Борзилова Ю.С. Оптимизация SQL-запросов на примере работы поискового модуля системы комплексного анализа художественных текстов // Cloud of Science. - 2020. - Т. 7. - № 4. - С. 749-763.
255. Барахнин В.Б., Кожемякина О.Ю., Борзилова Ю.С. Русские поэтические тексты и их комплексные стиховедческие метаданные // Свидетельство о государственной регистрации базы данных № 2020621889 от 15.10.2020 г. - Заявка № 2020621862 от 28.09.2020 г. (Федеральная служба по интеллектуальной собственности). -- [Электронный ресурс] URL: https://www.fips.ru/ofpstorage/Doc/PrEVM/RUNWDB/000/002/020/621/889/2020621 889-00001/document.pdf (дата обращения: 21.03.2022).
256. ГОСТ Р 7.0.10-2010 (ИСО 15836:2003). Набор элементов метаданных «Дублинское ядро» [Текст]. - Введ. 2011-07-01. - М. : Стандартинформ, 2011. -12 С. - (Система стандартов по информации, библиотечному и издательскому делу).
257. The Dublin Core Metadata Initiative. - [Электронный ресурс] URL: http://dublincore.org (дата обращения: 21.03.2022).
258. Электронные публикации Института русской литературы РАН (Пушкинского дома). - [Электронный ресурс] URL: http://lib.pushkinskijdom.ru (дата обращения: 21.03.2022).
259. Маглинец Ю.А. Анализ требований к информационным системам. -[Электронный ресурс] URL: https://ivan-shamaev.ru/wp-content/uploads/2013/06/Information-systems-analysis-and-requirements-analysis.pdf (дата обращения: 21.03.2022).
260. IEEE Recommended Practice for Software Requirements Specifications. -[Электронный ресурс] URL: https://ieeexplore.ieee.org/document/720574 (дата обращения: 21.03.2022).
261. Методология функционального моделирования IDEF0. Руководящий документ. - https://nsu.ru/smk/files/idef.pdf (дата обращения: 21.03.2022).
262. Business Process Model and Notation. - [Электронный ресурс] URL: http://www.bpmn.org (дата обращения: 21.03.2022).
263. Unified Modelling Language. - [Электронный ресурс] URL: http://www.uml.org (дата обращения: 21.03.2022).
264. Kozhemyakina O.Yu. Conceptual design of the software system for automated complex analysis of poetic texts // Вычислительные технологии. - 2022. -Т. 27. - № 2. - С. 122-137. - [Электронный ресурс] URL: https://doi.org/10.25743/ICT.2022.27.2.010 (дата обращения: 21.03.2022).
Список публикаций автора
1. Барахнин В.Б., Кожемякина О.Ю. Об автоматизации комплексного анализа русского поэтического текста // Труды Четырнадцатой Всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" (RCDL'2012). - Переславль-Залесский, 1518 октября 2012 г. - С. 213-217.
2. Барахнин В.Б., Кожемякина О.Ю. Об автоматизации комплексного анализа русского поэтического текста // CEUR Workshop Proceedings. - 2012. - V. 934. - P. 167-171. - [Электронный ресурс] URL: http://ceur-ws.org/Vol-934/paper27.pdf (дата обращения: 21.03.2022).
3. Барахнин В.Б., Кожемякина О.Ю., Соколова О.С., Альменова А.Б., Енсегенова А.А., Садуахас Н.С., Ыдырыс Ж.С. О применении компьютерных технологий в анализе поэтических текстов // Сборник трудов конференции "Информационно-вычислительные технологии и математическое моделирование" (ИВТ&ММ). Кемерово, 23-30 июня 2013). - Кемерово: КемГУ. - 2013. - Режим доступа: файл [Гос. регистр. № 0321302759].
4. Барахнин В.Б., Кожемякина О.Ю., Соколова О.С. Автоматизация процесса анализа метрических и ритмических характеристик русских поэтических текстов // Вестник Восточно-Казахстанского государственного технического университета им. Д. Серикбаева, сентябрь 2013. Вычислительные технологии. - Т. 18, совместный выпуск. - Информационные и телекоммуникационные технологии. - С. 248-258.
5. Забайкин А.В., Барахнин В.Б., Кожемякина О.Ю. Технология автоматизации создания метрических справочников русских поэтов // XV Российская конференция с международным участием "Распределенные
информационные и вычислительные ресурсы" (DICR'2014). Новосибирск, 2 декабря - 5 декабря 2014 г. Программа и тезисы докладов. - Новосибирск, 2014. -С. 21.
6. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В. Автоматизация процесса создания метрических справочников и конкордансов русских поэтических текстов // Труды Шестой международной конференции «Системный анализ и информационные технологии». - Светлогорск, 15-20 июня 2015 г. - Т. 1. - С. 125-131.
7. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В. Технология создания метрических справочников и конкордансов русских поэтических текстов // Abstracts of the International Scientific Conference "Computational and Informational Technologies in Science, Engineering and Education" (September 24-27, 2015). Almaty: KazNU, 2015. - Р. 244-245.
8. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В. Технология создания метрических справочников и конкордансов русских поэтических текстов // Вычислительные технологии, т. 20, Вестник КазНУ им.аль-Фараби, Серия математика, механика и информатика, № 3 (86), 2015, совместный выпуск.-Часть IV. - С. 54-60.
9. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В Алгоритмы комплексного анализа русских поэтических текстов с целью автоматизации процесса создания метрических справочников и конкордансов // Аналитика и управление данными в областях с интенсивным использованием данных: Семнадцатая Международная конференция DAMID/RCDL'2015. - Обнинск, 1316 октября 2015 г. - С. 253-266.
10. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В., Хаятова В.Д. Автоматизация комплексного анализа русского поэтического текста: модели и алгоритмы // Вестник НГУ. Сер.: Информационные технологии. - 2015 - Т. 13. -Вып. 3. - С. 5-18.
11. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В. Алгоритмы комплексного анализа русских поэтических текстов с целью автоматизации процесса создания метрических справочников и конкордансов // CEUR Workshop Proceedings. - 2015. - V. 1536. - P. 138-143.
12. Barakhnin V., Kozhemyakina O., Zabaykin A. Algorithms for automation of the complex analysis of Russian poetic texts // The 14th International Scientific Conference "Information Technologies and Management". - Riga, April 14-15, 2016. -Riga: ISMA University, 2016. - ISSN 1691-2489. - P. 133-135.
13. Барахнин В.Б., Кожемякина О.Ю. К проблеме аутентичности фонетического анализа в связи с возможными особенностями авторской орфографии (на примере чередования окончаний -ой/-ый в лирике А.С. Пушкина) // Вестник Томского государственного университета. Филология. - 2016. - Т. 13. -N 2. - С. 5-28.
14. Barakhnin V.B., Kozhemyakina O.Yu., Zabaykin A.V. Usage of modern computer technologies in the learning process of the philologists of complex analysis of Russian poetic texts // SHS Web of Conferences. - Volume 29 (2016). - 2016 International Conference "Education Environment for the Information Age" (EEIA-2016). - Moscow, Russia, June 6-7, 2016. - 5 p. - [Электронный ресурс] URL: http://dx.doi.org/10.1051/shsconf/20162902002 (дата обращения: 21.03.2022).
15. Barakhnin V.B., Kozhemyakina O.Yu., Skachkov D.M., Zhizhimov O.L. Technology of extraction of geographical names from biographical directories and
general indexes of names // Современные информационные технологии для научных исследований в области наук о Земле: Материалы IV Международной конференции, Южно-Сахалинск, 7-11 августа 2016 г. - 2016. - Владивосток: Дальнаука. - C. 62-63.
16. Barakhnin V.B., Kozhemyakina O.Yu., Zabaykin A.V., Pastushkov I.S. The algorithm of automated definition of genre type and stylistic coloring of the texts in Russian language // Международная конференция "Математические и информационные технологии, MIT-2016", Врнячка Баня, Сербия, 28-31 августа 2016 г., Будва, Черногория, 1-5 сентября 2016 г. Справочник конференции. - С. 100-101.
17. Барахнин В.Б., Кожемякина О.Ю., Забайкин А.В., Хаятова В.Д. Автоматизация процесса создания метрических справочников и конкордансов с использованием компьютерных алгоритмов анализа поэтических текстов на русском и казахском языках // Материалы Международной научной конференции "Информатика и прикладная математика", посвященной 25-летию независимости Республики Казахстан и 25-летию Института информационных и вычислительных технологий. Алматы, 21-24 сентября 2016 года. - Часть II. - С. 47-54.
18. Барахнин В.Б., Кожемякина О.Ю., Пастушков И.С. Разработка алгоритмов автоматизированного определения жанрового типа и стилистической окраски текстов на русском языке // Аналитика и управление данными в областях с интенсивным использованием данных: Восемнадцатая Международная конференция DAMID/RCDL'2016. - Ершово, Москва, 11-14 октября 2016 г. - С. 349-350.
19. Barakhnin V., Kozhemyakina O., Pastushkov I. Automated determination of the type of genre and stylistic coloring of Russian texts // ITM
Web of Conferences 10, 02001 (2017). - Volume 10 (2017). - 2017 Seminar on Systems Analysis. - Moscow, Russia, February 14-15, 2017. - 4 p. - [Электронный ресурс] URL: https://doi.org/10.1051/itmconf/20171002001 (дата обращения: 21.03.2022).
20. Barakhnin V., Kozhemyakina O., Pastushkov I. The approaches to the construction of a joint ("two-dimensional") classifier of genre types and stylistic colouring of poetic texts // The 15th International Scientific Conference "Information Technologies and Management". - Riga, April 27-28, 2017. - Riga: ISMA University, 2017. - ISSN 1691-2489. - P. 82-84.
21. Барахнин В.Б., Кожемякина О.Ю., Пастушков И.С. Использование метода опорных векторов для автоматизированного определения жанрового типа и стилистической окраски текстов на русском языке // Труды Седьмой международной конференции "Системный анализ и информационные технологии". - Светлогорск, 13-18 июня 2017 г. - С. 198-201.
22. Барахнин В.Б., Кожемякина О.Ю., Пастушков И.С., Рычкова Е.В. Автоматизированная классификация русских поэтических текстов по жанрам и стилям // Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация. - 2017. - Т. 15. - № 3. - С. 13-23.
23. Барахнин В.Б., Кожемякина О.Ю., Бакиева А.М., Содбоев М.К. Алгоритмы автоматизированной обработки поэтических текстов на казахском языке // Материалы II Международной научной конференции "Информатика и прикладная математика". - Алматы, 27-30 сентября 2017 года. - Часть II. - С. 5564.
24. Барахнин В.Б., Федотов А.М., Бакиева А.М., Бакиев М.Н., Тажибаева С.Ж., Батура Т.В., Кожемякина О.Ю., Тусупов Д.А., Самбетбаева М.А.,
Лукпанова Л.Х. Алгоритмы генерации и стемматизации словоформ казахского языка // Cloud of Science. - 2017. - Т. 4. - № 3. - С. 434-449.
25. Барахнин В.Б., Кожемякина О.Ю., Пастушков И.С. Сравнительный анализ методов автоматической классификации поэтических текстов на основе лексических признаков // Аналитика и управление данными в областях с интенсивным использованием данных: Девятнадцатая Международная конференция DAMDID/RCDL'2017. - Москва, МГУ, 10-13 октября 2017 г. - С. 325-330.
26. Barakhnin V.B., Fedotov A.M., Bakiyeva A.M., Bakiyev M.N., Tazhibayeva S.Zh., Batura T.V., Kozhemyakina O.Yu., Tussupov D.A., Sambetbaiyeva M.A., Lukpanova L.Kh. The software system for the study the morphology of the Kazakh language // The European Proceedings of Social & Behavioural Sciences. -2017. - V. XXXIII. - P. 18-27. - [Электронный ресурс] URL: http://dx.doi.org/10.15405/epsbs.2017.12.3 (дата обращения: 21.03.2022).
27. Барахнин В.Б., Кожемякина О.Ю., Пастушков И.С. Сравнительный анализ методов автоматической классификации поэтических текстов на основе лексических признаков // CEUR Workshop Proceedings. - 2017. - V. 2022. - P. 252257.
28. Барахнин В.Б., Кожемякина О.Ю., Пастушков И.С. Алгоритмы автоматической классификации поэтических текстов на основе лексических признаков // XVI Российская конференция "Распределенные информационно-вычислительные ресурсы. Наука - цифровой экономике" (DICR'2017): Новосибирск, Академгородок 4-7 декабря 2017 г.: Программа. Тезисы докладов. Алфавитный указатель участников. - 2017. - Новосибирск: ИВТ СО РАН. - С.17. - ISBN: 978-5-905569-09-8.
29. Barakhnin V., Kozhemyakina O., Pastushkov I. The approaches to the construction of a joint ("two-dimensional") classifier of genre types and stylistic colouring of poetic texts // The 16th International Scientific Conference "Information Technologies and Management". - Riga, April 26-27, 2018. - Riga: ISMA University, 2018. - ISSN 1691-2489. - P. 38-39.
30. Барахнин В.Б., Ергалиев Е.Н., Кожемякина О.Ю., Мухамедиев Р.И. Автоматическая обработка текстов на естественном языке. Некоторые библиометрические показатели современного состояния области исследования // Материалы III Международной научной конференции "Информатика и прикладная математика". Алматы, 26-29 сентября 2018 года. - Часть II. - С. 6070.
31. Barakhnin V., Kozhemyakina O., Rychkova E., Pastushkov I., Borzilova Yu. The extraction of the collocations from the corpus of texts in the process of automated processing of Russian poetic texts // Аналитика и управление данными в областях с интенсивным использованием данных: Двадцатая Международная конференция DAMDID/RCDL'2018. - Москва, МГУ, 9-12 октября 2018 г. - С. 289-293.
32. Barakhnin V.B., Duisenbayeva A.N., Kozhemyakina O.Yu., Yergaliyev Y.N., Muhamedyev R.I. The automatic processing of the texts in natural language. Some bibliometric indicators of the current state of this research area // Journal of Physics: Conf. Series. - 2018. - V. 1117. - 9 p. - [Электронный ресурс] URL: http://dx.doi.org/10.1088/1742-6596/1117/1/012001 (дата обращения: 21.03.2022).
33. Barakhnin V.B., Kozhemyakina O.Yu., Ba^eva A.M., Sodboev M.K. The algorithms for complex analysis of the corpuses of poetic texts in the Kazakh language // Journal of Physics: Conf. Series. - 2018. - V. 1117. - 7 p. - [Электронный
ресурс] URL: http://dx.doi.org/10.1088/1742-6596/1117/1/012003 (дата обращения: 21.03.2022).
34. Барахнин В.Б., Кожемякина О.Ю., Рычкова Е.В., Пастушков И.С., Борзилова Ю.С. Извлечение лексических и метроритмических признаков, характерных для жанра и стиля и их комбинаций в процессе автоматизированной обработки текстов на русском языке // Современные информационные технологии и ИТ-образование. - 2018. - Т. 14. - № 4. - С. 876-883. -[Электронный ресурс] URL: https://doi.org/10.25559/SITITO.14.201804.888-895 (дата обращения: 21.03.2022).
35. Barakhnin V.B., Kozhemyakina O.Yu., Rychkova E.V., Gladkikh A.S., Pastushkov I.S. Software for learning to solve problems of classification using of machine learning // The European Proceedings of Social & Behavioral Sciences. -2018. - V. XLIX. - P. 106-112. - http://dx.doi.org/10.15405/epsbs.2018.11.02.12 (дата обращения: 21.03.2022).
36. Барахнин В.Б., Кожемякина О.Ю., Рычкова Е.В., Борзилова Ю.С. Автоматическое выделение словосочетаний из текстов славянского происхождения: сравнение подходов // Cloud of Science. - 2018. - Т. 5. - № 4. - С. 713-728.
37. Барахнин В.Б., Кожемякина О.Ю., Борзилова Ю.С. Проектирование информационной системы представления результатов комплексного анализа поэтических текстов // Вестник НГУ. Сер.: Информационные технологии. - 2019. - Т. 17. - Вып. 1. - С. 5-17. - [Электронный ресурс] URL: http://dx.doi.org/10.25205/1818-7900-2019-17-1-5-17 (дата обращения: 21.03.2022).
38. Barakhnin V.B., Duisenbayeva A.N., Kozhemyakina O.Yu., Kuchin Ya.I., Yakunin K.O., Mukhamedyev R.I. The studies of dinamics' changes in publication
activity in the field of natural language processing// The 17th International Scientific Conference "Information Technologies and Management". - Riga, April 25-26, 2019. -Riga: ISMA University, 2019. - ISSN 1691-2489. - P. 71-74.
39. Барахнин В.Б., Кожемякина О.Ю., Тагирова Е.П. Алгоритм перевода текстов из дореформенной орфографии в современную с учетом морфологии слов // Восьмая Международная конференция "Системный анализ и информационные технологии" САИТ - 2019: Труды конференции. - 2019. - М.: ФИЦ ИУ РАН. - С. 199-206. - ISBN 978-5-904466-62-6.
40. Барахнин В.Б, Кожемякина О.Ю., Пастушков И.С. Использование алгоритма изменения порядка слов для анализа текстов на русском языке // Материалы IV Международной научной конференции "Информатика и прикладная математика". - Алматы, 25-29 сентября 2019 года. - Часть II. - С. 198-205. ISBN 978-601-332-384-8.
41. Барахнин В.Б., Мухамедиев Р.И., Мусабаев Р.Р., Кожемякина О.Ю., Исаева А., Кучин Я.И., Мурзахметов С.Б., Якунин К.О. Методы выявления деструктивных новостей в медиапространстве // Материалы IV Международной научной конференции "Информатика и прикладная математика". Алматы, 25-29 сентября 2019 года. - Часть II. - С. 205-219. ISBN 978-601-332-384-8.
42. Barakhnin V.B., Kozhemyakina O.Yu., Kuznetsova I.V. Development and Implementation of the Algorithm for Automatic Analysis of Metrorhythmic Characteristics of Russian Poetic Texts // Data Analytics and Management in Data Intensive Domains: XXI International Conference DAМDID/RCDL,2019 (October 1518, 2019, Kazan, Russia): Conference Proceedings. - Kazan: Kazan Federal University, 2019. - P. 363-371. - ISBN 978-5-00130-214-8.
43. Barakhnin V.B., Mukhamedyev R.I., Mussabaev R.R., Kozhemyakina O. Yu., Issayeva A., Kuchin Ya.I., Murzakhmetov SB., Yakunin K.O. Methods to identify the destructive information analysis // Journal of Physics: Conf. Series. - 2019. - V. 1405. - 9 p. - [Электронный ресурс] URL: http://dx.doi.org/10.1088/1742-6596/1405/1/012004 (дата обращения: 21.03.2022).
44. Barakhnin V.B., Kozhemyakina O.Yu., Kuznetsova I.V. Development and implementation of the algorithm for automatic analysis of metrorhythmic characteristics of Russian poetic texts // CEUR Workshop Proceedings. - 2019. - V. 2523. - P. 290298.
45. Barakhnin V.B., Kozhemyakina O.Yu., Mukhamediev R.I., Borzilova Yu.S., Yakunin K.O. The design of the structure of the software system for processing text document corpus // Business Informatics. - 2019. - Vol. 13. - N 4. - P. 60-72. -[Электронный ресурс] URL: http://dx.doi.org/10.17323/1998-0663.2019.4.60.72 (дата обращения: 21.03.2022).
46. Kozhemyakina O.Yu., Tagirova E.P. The translation algorithm from pre-reform spelling into modern spelling, taking into account the morphology of words // Journal of Physics: Conference Series. - 2019. - Vol. 1405. - Art. 012010. - ISSN 1742-6588. - EISSN 1742-6596.
47. Барахнин В.Б., Кожемякина О.Ю., Борзилова Ю.С. Проектирование структуры программной системы обработки корпусов поэтических текстов // Распределенные информационно-вычислительные ресурсы. Цифровые двойники и большие данные. (DICR-2019). Труды XVII Международной конференции. Новосибирск, 3-6 декабря 2019 г. - Новосибирск, 2019. - С. 102-106. -[Электронный ресурс] URL: http://dx.doi.org/10.25743/ICT.2019.56.22.015 (дата обращения: 21.03.2022).
48. Барахнин В.Б., Кожемякина О.Ю., Кузнецова И.В., Тагирова Е.П., Борзилова Ю.С. Разработка и практическая реализация алгоритмов создания электронных метроритмических справочников и конкордансов // Cloud of Science. - 2020. - Т. 7. - № 1. - С. 135-155.
49. Barakhnin V., Kozhemyakina O., Pastushkov I. The usage of the word order change algorithm for the identification of emotionally charged texts in Russian // The 18th International Scientific Conference "Information Technologies and Management". - Riga, April 23-24, 2020. - Riga: ISMA University, 2020. -ISSN 1691-2489. - P. 30-32. - [Электронный ресурс] URL: https://www.ismaitm.lv/images/Files/Theses/2020/01_NN/12_ITM2020_Barakhnin_Ko zhemyakina_Pastushkov.pdf (дата обращения: 21.03.2022).
50. Барахнин В.Б., Кожемякина О.Ю., Пастушков И.С., Кузнецова И.В., Борзилова Ю.С. Усовершенствования алгоритма автоматизированного определения рифмы // Информационные технологии и нанотехнологии (ИТНТ-2020). Сборник трудов по материалам VI Международной конференции и молодежной школы. Самара, 26-29 мая 2020 года. - Том. 4. - С. 344-350. - ISBN 978-5-7883-1514-0.
51. Barakhnin V., Kozhemyakina O., Pastushkov I., Kuznetsova I., Borzilova Yu. Improvement of the algorithm of automated definition of rhyme // CEUR Workshop Proceedings. - 2020. - V. 2667. - P. 36-41.
52. Barakhnin V., Kozhemyakina O., Borzilova Yu. Optimization of SQL-queries of the search module of the software system of the text document corpus processing // Тезисы докладов международной конференции "Вычислительные и информационные технологии в науке, технике и образовании" (CITech-2020). Казахстан, Алматы, 9-10 октября 2020 г.- C. 44.
53. Barakhnin V., Kozhemyakina O., Borzilova Yu. Optimization of SQL-queries of the search module of the software system of the text document corpus processing // Вычислительные технологии, т. 25, Вестник Национальной инженерной академии Республики Казахстан, № 3, 2020, совместный выпуск. -Часть I. - С. 69-81.
54. Барахнин В.Б., Кожемякина О.Ю., Борзилова Ю.С. Русские поэтические тексты и их комплексные стиховедческие метаданные // Свидетельство о государственной регистрации базы данных № 2020621889 от 15.10.2020 г. - Заявка № 2020621862 от 28.09.2020 г. (Федеральная служба по интеллектуальной собственности). - [Электронный ресурс] URL: https://www.fips.ru/ofpstorage/Doc/PrEVM/RUNWDB/000/002/020/621/889/2020621 889-00001/document.pdf (дата обращения: 21.03.2022).
55. Барахнин В.Б., Кожемякина О.Ю., Кузнецова И.В. Программа автоматического анализа метроритмических характеристик поэтических текстов на русском языке // Свидетельство о государственной регистрации программы для ЭВМ № 2020663072 от 22.10.2020 г. - Заявка № 2020662151 от 12.10.2020 г. (Федеральная служба по интеллектуальной собственности). - [Электронный ресурс] URL: https://www1.fips.ru/ofpstorage/Doc/PrEVM/RUNWPR/000/002/020/663/072/2020663 072-00001/document.pdf (дата обращения: 21.03.2022).
56. Барахнин В.Б., Кожемякина О.Ю., Борзилова Ю.С. Оптимизация SQL-запросов на примере работы поискового модуля системы комплексного анализа художественных текстов // Cloud of Science. - 2020. - Т. 7. - № 4. - С. 749-763.
57. Kozhemyakina O., Barakhnin V. Models and algorithms for complex analysis of large corpuses of Russian poetic texts // International Conference on Information Systems, 2020. - Special Interest Group on Big Data Proceedings. 2. -
[Электронный ресурс] URL: https://aisel.aisnet.org/sigbd2020Z2 (дата обращения: 21.03.2022).
58. Barakhnin V.B., Kozhemyakina O.Yu., Pastushkov I.S. The effective interaction of the models of classification with the usage of auction heuristics // Journal of Physics: Conference Series. - 2021. - Vol. 1727. - Art. 012012. - [Электронный ресурс] URL: http://doi.org/10.1088/1742-6596/1727/1/012012 (дата обращения: 21.03.2022).
59. Барахнин В.Б., Кожемякина О.Ю., Кузнецова И.В., Карпова В.А. Модель фактуры русских поэтических текстов // Вычислительные технологии. -2021. - Т. 26. - № 3. - С. 107-117. - [Электронный ресурс] URL: https://doi.org/10.25743/ICT.2021.26.3.007 (дата обращения: 21.03.2022).
60. Барахнин В.Б., Кожемякина О.Ю., Карпова В.А., Кузнецова И.В. Программа определения фактур русских поэтических текстов // Свидетельство о государственной регистрации программы для ЭВМ № 2021664226 от 01.09.2021 г. - Заявка № 20216163325 от 24.08.2021 г. (Федеральная служба по интеллектуальной собственности). - [Электронный ресурс] URL: https://new.fips.ru/ofpstorage/Doc/PrEVM/RUNWPR/000/002/021/664/226/202166422 6-00001/document.pdf (дата обращения: 21.03.2022).
61. Barakhnin V., Kozhemyakina O., Revun А., Shashok N. Technological features of cross-language migration from PHP to Python of software products working with intensive data // Book of Abstracts of the XXIII International Conference DAMDID / RCDL'2021. - Moscow, October 26-29, 2021. - P. 55-56. - ISBN 978-5907227-93-4.
62. Barakhnin V., Kozhemyakina O., Revun A., Shashok N. Technological features of cross-language migration from PHP to Python of software products working with intensive data // CEUR Workshop Proceedings. - 2021. - V. 3036. - P. 411-421.
63. Barakhnin V., Kozhemyakina O., Grigorieva I.V. Determination of the Features of the Author's Style of A.S. Pushkin's Poems by Machine Learning Methods // Applied Sciences. - 2022. - 12. - 1674. - [Электронный ресурс] URL: https://doi.org/10.3390/ app12031674 (дата обращения: 21.03.2022).
64. Kozhemyakina O.Yu. Conceptual design of the software system for automated complex analysis of poetic texts // Вычислительные технологии. - 2022. -Т. 27. - № 2. - С. 122-137. - [Электронный ресурс] URL: https://doi.org/10.25743/ICT.2022.27.2.010 (дата обращения: 21.03.2022).
RU2021664226
ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ
ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ
Номер регистрации (свидетельства):
2021664226 Дата регистрации: 01.09.2021 Номер и дата поступления заявки:
2021663325 24.08.2021 Дата публикации и номер бюллетеня: 01.09.2021 Бюл. № 9 Контактные реквизиты: ict@ict.nsc.ru, +7 (383) 330-61-50, ФИЦ ИВТ
Автор(ы):
Барахнин Владимир Борисович (Ди), Кожемякина Ольга Юрьевна (ДЩ Карпова Вера Алексеевна (Ди), Кузнецова Ирина Владимировна (Ди) Правообладатель(и):
Федеральное государственное бюджетное научное учреждение «Федеральный исследовательский центр информационных и вычислительных технологий» (ФИЦ ИВТ) (Ди)
Название программы для ЭВМ:
Программа определения фактур русских поэтических текстов Реферат:
Программа решает задачу определения фактуры стихотворения — совокупностей метроритмических характеристик поэтических текстов. Данные характеристики получены в результате работы программного комплекса автоматического анализа метроритмических характеристик русских поэтических текстов (Свидетельство о регистрации № 2020663072). В основе программы - excel-таблица всех фактур, встречающихся в стихотворениях А.С. Пушкина, с приведением примеров строф для каждого типа фактуры, а также алгоритм определения фактуры, на основе которого реализована программа, определяющая фактуру анализируемого стихотворения. Программа предназначена для специалистов в области компьютерной обработки текстов на русском языке и филологов. Программа разработана при поддержке Российского научного фонда, проект № 19-37-90019. Тип ЭВМ: IBM PC-совмест. ПК; ОС: Windows Server 2008R2/ Windows Server 2012 / Linux (Ubuntu 16.04).
Язык программирования: Python
Объем программы для ЭВМ: 126,4 И
Стр.: 1
RU2020663072
ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ
ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ
Номер регистрации (свидетельства):
2020663072 Дата регистрации: 22.10.2020 Номер и дата поступления заявки:
2020662151 12.10.2020 Дата публикации и номер бюллетеня: 22.10.2020 Бюл. № 11 Контактные реквизиты: E-mail: ict@ict.nsc.ru, +7(383)330-61-50, ФИЦ ИВТ
Автор(ы):
Барахнин Владимир Борисович (Ди), Кожемякина Ольга Юрьевна (ДЩ Кузнецова Ирина Владимировна (Ди) Правообладатель(и):
Федеральное государственное бюджетное научное учреждение «Федеральный исследовательский центр информационных и вычислительных технологий» (ФИЦ ИВТ) (Ди)
Название программы для ЭВМ:
Программа автоматического анализа метроритмических характеристик поэтических текстов на русском языке
Реферат:
Программа предназначена для определения акцентуации (ударений) в словах, метра, стопности, рифмы, числа мужских/женских окончаний в поэтических текстах на русском языке. Область применения программы — обработка поэтических текстов, имеющих более строгую по сравнению с прозаическими текстами структуру, на структурном уровне в рамках разрабатываемой в ФИЦ ИВТ системы комплексного анализа русских поэтических текстов. Модуль программы, связанный с определением ударений в словах, интегрирован в программу автоматического составления конкордансов, которая является частью разрабатываемой системы. Программа разработана при поддержке Российского научного фонда, в рамках проекта комплексного анализа поэтических текстов на русском языке № 19-18-00466. Тип ЭВМ: IBM РС-совмест. ПК. ОС: Windows, MacOS, Linux.
Язык программирования: Python
Объем программы для ЭВМ: 85 МБ
Стр.: 1
RU2020621889
ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ
ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ БАЗЫ ДАННЫХ, ОХРАНЯЕМОЙ АВТОРСКИМИ ПРАВАМИ
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.