Лингвистическое моделирование как инструмент атрибуции текста тема диссертации и автореферата по ВАК РФ 10.02.19, кандидат наук Хоменко Анна Юрьевна
- Специальность ВАК РФ10.02.19
- Количество страниц 583
Оглавление диссертации кандидат наук Хоменко Анна Юрьевна
Введение
Глава 1. Лингвистические модели и их свойства
1.1. Природа модели, вариации, содержание понятия, свойства моделей
1.2. Классификация моделей по разным основаниям
1.3. Критерии оценки качества модели с теоретической точки зрения
Выводы к главе
Глава 2. Проблема атрибуции текста. История вопроса
2.1. Атрибуция текста в конце XIX в. Зарождение стилостатистики
2.2. Атрибуция текста в начале XX века. Отечественная и зарубежная школы
2.3. Атрибуция текста в середине - второй половине XX века
2.4. Атрибуция текста в конце XX - начале XXI в
2.5. Современное состояние текстовой атрибуции
Выводы к главе
Глава 3. Оценка качества существующих квалификативных и квантитативных атрибуционных моделей
3.1. Общетеоретическое рассмотрение проблемы
3.2. Конкретные случаи применения формальных моделей
3.3. Конкретные случаи применения квалификативных моделей
3.3.1. Эксперимент
3.3.2. Эксперимент
3.3.3. Эксперимент
3.4. Интегрирование квантитативных и квалификативных моделей
2
3.4.1. Эксперимент
3.4.2. Эксперимент
3.4.3. Эксперимент
3.4.4. Эксперимент
Выводы к главе
Глава 4. Создание прототипа интегративного полуавтоматического алгоритма идентификации автора письменного текста
4.1. Описание алгоритма
4.2. Теоретическая оценка качества разработанной модели
4.3. Апробация алгоритма
4.3.1. Апробация методики на материале нежанровой художественной прозы
4.3.2. Апробация методики на материале сетевой художественной литературы
4.3.3. Апробация методики на материале сетевой публицистики
4.3.4. Апробация методики на материале корпоративной переписки
4.3.5. Апробация методики на материале развлекательной публицистики, коротких электронных комментариев
4.3.6. Апробация методики на разножанровом материале в рамках решения одной идентификационной задачи
Выводы к главе
Заключение
Библиографический список
Приложение 1. Материал для исследования: короткие сообщения из мессенджера, автор - женщина
Приложение 2. Аналитический материал: классификация ошибок и описок из выборок для Эксперимента 1.3 (глава 3)
Приложение 3. Материал для исследования: короткие сообщения из мессенджера, автор - мужчина
Приложение 4. Аналитический материал: лингвистические модели идиостиля как экспликации языковой личности пишущего для Эксперимента 3.3 (глава 3)
Приложение 5. Материал для исследования: документы юридического дискурса
Приложение 6. Аналитический материал: лингвистические модели идиостиля как экспликации языковой личности пишущего для Эксперимента 1.4 (глава 3)
Приложение 7. Материал для анализа: юридические документы и публицистические тексты, - и аналитика для Эксперимента 2.4 (глава 3)
Приложение 8. Материал для исследования: текст отзыва о компании для Эксперимента 3.4 (глава 3)
Приложение 9. Материал для исследования: дословное содержание устной речи коммуниканта и выборка из дословного содержания речи коммуниканта для Эксперимента 4.4 (глава 3)
Приложение 10. Список интенсификаторов, полученных в ходе практических исследований
Приложение 11. Формализованные правила поиска структур и элементов для реализации на ЯП Python
Приложение 12. Рейтерские таблицы для формирования выводов об авторстве на основе работы алгоритма
Приложение 13. Форма соглашения о некоммерческом использовании электронной служебной переписки
Приложение 14. Тексты электронной корпоративной переписки
Введение
В современной лингвистике преобладает междисциплинарный подход к исследованию языка, ученые применяют знания из разных научных сфер при анализе языковых реалий. Сходная тенденция имеет место и в области лингвистики, занимающейся вопросами атрибуции текстового материала. Данная отрасль в отечественной науке является достаточно консервативной. В судебной лингвистике в подавляющем большинстве случаев используются исключительно методы качественного лингвистического анализа1 [Вул 1973, 1977, 1982, 2007; Галяшина, Ермолова 2005, Рубцова, Ермолаева, Безрукова и др. 2007]. В сфере внесудебных, научных атрибуционных исследований методы качественного анализа на современном этапе развития науки практически не разрабатываются, в то время как количественные методики осваиваются очень активно [Захаров 2000а,б; Labbe, Labbe, 2001; Koppel, Schler, 2003; Coulthard 2004; Juola, Sofko, Brennan 200б; Марусенко 2003; Родионова 2008а, б; Романов 2010; Медведева 2010; Батура 2012; Мартыненко 2015; Korobov 2015; Wright 2017; Litvinova, Sboev, Panicheva 2018; Custodio, Paraboni 2018; Murauer, Tschuggnall, Specht 2018; Panicheva, Mirzagitova, Ledovaya 2018; Gomzin, Laguta, Stroev 2018; Bacciu, Morgia, La 2019; Muttenthaler, Lucas, Amann 2019 и пр.]. Эта тенденция сформировалась в англоязычной школе, где автороведение традиционно связано с количественными, стилометрическими методами анализа [Campbell L. 1867, Mendenhall 1887, Lutoslawski 1897, Jule 1944; Mosteller, Wallace 1984; Somers 1972; Foster 1989, 2000; Merriam 1989, 2003; Holmes 1994, 1998; Holmes, Forsyth 1995; Baayen, van Halteren, Tweedie, 199б].
Сейчас, на наш взгляд, существует острая необходимость интеграции качественного и количественного методов атрибуционного анализа.
1 Под качественным лингвистическим анализом в настоящем диссертационном исследовании понимается квалификативный лингвистический анализ, то есть анализ, выполненный с помощью методов интерпретирующей лингвистики
Становится все более очевидным, что построение моделей авторских идиостилей лишь на основании традиционных стилостатистических данных не может в полной мере удовлетворить атрибуционную лингвистику. Это происходит не столько в силу уровня неточности методик, основанных на стилеметрии, сколько в силу неполноты самих лингвистических моделей, которые лежат в основе означенных алгоритмов. Попытки интеграции разных подходов впервые предприняты в начале века в России и на Западе и продолжаются до настоящего момента [Баранов 2001: 43-52; Koppel, Schier 2003; Хоменко 2013; Хоменко, Романова 2014, Хоменко 2014а,б, в; Хоменко 2018а, б; Хоменко 2019а,б,в, г; Хоменко 2020а; Романова Т.В., Хоменко А.Ю., 2020; Pimonova, Durandin, Malafeev 2020].
В настоящей работе речь идёт именно об интегративной методике атрибуционного анализа текста, основанной на соединении результатов интерпретативного и квантитативного исследований. В ходе реализации алгоритма данные квалификативного анализа материала объективируются с помощью применения в конечной модели идиостиля методов математической статистики. Методика реализуется в следующей последовательности шагов: 1) автоматическое извлечение из текста параметров, описывающих идиостиль с точки зрения прагматикона, тезауруса и лексикона автора; 2) поиск традиционных стилеметрических текстовых данных; 3) присвоение веса каждому параметру; 4) построение математических моделей сравниваемых текстов; 5) сравнение математических моделей с целью выявления уровня их сходства/различия между собой.
Актуальность исследования определяется тем, что в современном обществе особое значение имеет аутентификация письменного материала. Так, методики атрибуции становятся необходимыми в филологических экспертизах при определении авторства известных художественных произведений (например, текстов Ф.М.Достоевского, М.А.Шолохова), в судебных автороведческих экспертизах при решении диагностических и идентификационных задач, при анализе контента сети Интернет на предмет
7
автоматического поиска содержания деликтной направленности (текстов, связанных с террористической, экстремистской деятельностью, педофилией и пр.), при решении научных задач, связанных с идентификацией лиц по письменной речи и определением характеристик пола, возраста, социального статуса этих лиц. Каждое из перечисленных научных и практических полей деятельности нуждается в использовании полных и всесторонних методик атрибуции, дающих объективные результаты. Использование количественных атрибуционных моделей имеет недостаток, связанный с неполнотой описания объекта моделирования - языковой личности автора через его индивидуальный стиль. Количественные модели обычно используют несколько легко вычленимых автоматически текстовых параметров (длины слов и предложений, распределение текстового материала по частям речи и пр.), делая конечную модель репрезентации языковой личности недостаточно полной, а значит, не в полной мере объективной. Квалификативные методы анализа могут конструировать полную модель языковой личности автора, но эта модель всегда интерпретативна, соответственно, тоже недостаточно объективна. Интеграция же двух этих подходов позволит сделать конечную модель достаточно полной, всесторонне имитирующей оригинал и одновременно объективной.
Степень разработанности проблемы. Атрибуционная лингвистика со
времен Л. Кэмпбелла [Campbell 1867] и В. Лютославского [Lutoslawski 1897]
на Западе и Н.А. Морозова [Морозов 1915] в России всегда шла двумя
параллельными путями: путем стилеметрии [Mendenhall 1887, Mosteller,
Wallace 1984, Захаров 2000а, б; Labbe, Labbe, 2001; Merriam 2003; Juola, Sofko,
Brennan 2006; Мартыненко 2015; Litvinova, Seredin, Litvinova, etc., 2017;
Wright 2017 и пр.] и путем качественного анализа текста [Вул 1973, 2007;
Горошко 2003, Комиссаров 2000, McMenamin 2002; Coulthard 2004; Галяшина,
Смотров, Шашкин 2005 и пр.]. На современном этапе развития
исследовательского поля координация двух указанных ветвей происходит
посредством объяснения стиметрических данных с точки зрения
8
традиционной квалификативной лингвистики: объяснение длины предложения как отражения уровня компетенций автора в письменной речи [Степаненко 2017:19-20], объяснение n-грамм как косвенной экспликации грамматических текстовых реалий [Захаров, Хохлова 2008: 41-42]. Разработкой вопроса формализации глубинных синтаксических структур занимается санкт-петербургская школа прикладной лингвистики [Марусенко 1990; Родионова 2008а, б и пр.]. Интегративный подход, основанный на сочетании анализа традиционных стилостатистических параметров (длин слов и предложений, наиболее частотных n-грамм, служебных слов и POS-tags) и анализа авторских идиосинкразем, одними из первых предложили М. Коппел и Дж. Шлер [Koppel, Schler 2003]. В России он разрабатывается на базе разных методик [Баранов 2001: 43-52; Koppel, Schler 2003; Хоменко 2018а, б; Хоменко 2019а,б,в, г; Хоменко 2020а; Романова Т.В., Хоменко А.Ю., 2020; Pimonova, Durandin, Malafeev 2020].
В настоящее время существует ряд значимых научных мероприятий, на которых обсуждаются результаты современных исследований в области автоматической обработки текста с целью его атрибуции. В России к таким мероприятиям относится ежегодная международная конференция «Диалог» (URL: http://www.dialog-21.ru/), международная конференция «AINL: Artificial Intelligence and Natural Language Conference» (URL: https://ainlconf.ru/), международная конференция «International Conference on Analysis of Images, Social Networks and Texts» (URL: https://aistconf.org/). За рубежом - серия мероприятий «PAN» в рамках «Conference and Labs of the Evaluation Forum, или Cross-Language Evaluation Forum», (URL: https://pan.webis.de/). В рамках данных мероприятий отмечается тенденция применения полностью автоматических систем, использующих разные модели, алгоритмы и метрики. Большой популярностью до сих пор пользуются различные модели и алгоритмы, основанные на исследовании n-граммного состава речи индивида [Bacciu, Morgia, La 2019], [Litvinova, Sboev, Panicheva 2018], [Custodio, Paraboni 2018], [Murauer, Tschuggnall, Specht 2018], [Muttenthaler, Lucas,
9
Amann 2019], частеречной отнесенности единиц [Litvinova, Sboev, Panicheva 2018], различного рода длин [Custodio, Paraboni 2018] с использованием кластеризационного подхода [Panicheva, Mirzagitova, Ledovaya 2018], традиционных [Gomzin, Laguta, Stroev 2018] и модифицированных [Korobov 2015] библиотек Python, алгоритмов векторных преобразований [Bacciu, Morgia, La 2019] и пр. Существуют также удачные попытки использования собственно лингвистических моделей (с применением векторного подхода к анализу текста) для определения авторства текста: [Pimonova, Durandin, Malafeev 2020].
Обсуждение атрибуционных методов анализа интерпретативной лингвистики происходит в рамках научного диалога на таких мероприятиях, как ежегодная Международная научно-практическая конференция «Язык. Право. Общество» (https://science.pnzgu.ru/nii fipi/ng/VI Conference 2020), Международная научная конференция «Современная теоретическая лингвистика и проблемы судебной экспертизы»
(https://www.pushkin.institute/science/konferencii/sovrem-lingv/2019/) и пр. В ходе этих мероприятий дискуссия ведется как о совершенствовании методов идентификационных исследований [Абрамкина 2019], [Ким 2019], так и о работе над диагностическими методиками [Огорелков 2018], [Сааков 2018].
В основе исследования лежит гипотеза о том, что интегративная атрибуционная модель, получаемая в результате ряда итераций обеспечивает а) построение моделей языковых личностей авторов сравниваемых текстов; б) объективацию данных посредством методов математической статистики; в) сравнение моделей с помощью разных статистических метрик, следовательно, способна успешно решать идентификационную задачу атрибуционной лингвистики на текстах любого объема.
Создание интегративной методики текстовой атрибуции, основанной на сочетании квантитативного и квалификативного подходов к анализу текста в рамках модельной лингвистики, и разработка прототипа программного
обеспечения на ее основе является целью настоящего исследования.
10
Достижение поставленной цели предполагает решение следующих задач:
- на основе анализа исследований в области теоретической лингвистики, лингвистики моделей и прикладной (в том числе компьютерной и судебной) лингвистики сформировать теоретическую базу исследования;
- сформулировать рабочее понятие модели, разработать ее структуру; применить их при создании автоматизированного программного комплекса по атрибуции текста;
- разработать проблему наиболее используемых квантитативных и квалификативных методов и методик анализа идиостиля как репрезентанта языковой личности автора; адаптировать их для применения в прототипе автоматизированного программного комплекса по атрибуции текста;
- создать свод формализованных правил для вычленения лингвистических характеристик, позволяющих идентифицировать автора письменного текста;
- собрать разножанровую коллекцию текстов в качестве материала для верификации результатов работы интегративной атрибуционной модели;
- создать эффективную модель для решения идентификационной задача текстовой атрибуции;
- апробировать модель на созданной коллекции разножанровых текстов; определить валидность выводов, получаемых при анализе текстов посредством разработанной интегративной модели;
- при необходимости разработать стратегию по повышению уровня эффективности модели.
Объектом исследования являются собственно модели лингвистического исследования, а именно: модели текстовой атрибуции; методы и методики текстовой атрибуции, имеющие квантитативную, квалификативную и интегративную основы.
Предметом исследования становится параметры текстовой атрибуции,
позволяющие создать полную и адекватную модель идиостиля автора как
экспликатора языковой личности пишущего.
Основным материалом для исследования стали следующие текстовые коллекции:
1) коллекция текстов художественной литературы, включающая тексты С.Д.Довлатова и В.П.Астафьева (С.Д.Довлатова «Наши», «Чемодан», «Иностранка», «Заповедник», «Зона: Записки надзирателя», «Встретились, поговорили»; В.П.Астафьева «Обертон», «Последний поклон», «Звездопад», «Так хочется жить»): 10 текстов, средний объем - 20,000 слов;
2) коллекция текстов современной сетевой беллетристики (авторские тексты, размещенные на ресурсе «Книга фанфиков»), включающая тексты 3 авторов-женщин, 4 авторов-мужчин: 187 текстов; средний объем - от 1,500 до 40,000 слов:
3) коллекция текстов сетевой публицистики (тексты электронной газеты «The Village»), включающая тексты 3 авторов-женщин, 3 авторов-мужчин: 600 текстов, средний объем - от 500 до 1,500 слов:
4) коллекция текстов электронных комментариев (тексты, размещенные на развлекательном портале «ЯПлакалЪ»), включающая тексты 3 авторов-женщин, 3 авторов-мужчин: 424 текста, средний объем - от 50 до 100 слов:
5) коллекция текстов корпоративной русскоязычной переписки,
включающая тексты 2 авторов-женщин, 2 авторов-мужчин: всего 236 текстов
(от 45 до 49 писем для одного автора); средний объем - от 50 до 500 слов, - а
также несколько текстов, использованных для последнего этапа апробации
методики (научная статья автора под псевдонимом Василиса, отрывок из
письма В.Астафьева, публицистическая статья В.Довлатова, сообщение
тематики «О себе» одного из авторов сетевой литературы). Всего 1 461 текст
(анализ данных текстов приводится в главе 4). Тексты сетевой литературы,
развлекательной и сетевой публицистики собраны в автоматическом режиме
(методами скрейпинга). Тексты художественной литературы и корпоративной
переписки собраны и размечены вручную. Описанные выше текстовые блоки
были использованы для апробации разработанной интегративной методики и
12
тестирования полуавтоматического алгоритма, созданного на ее основе.
Для поиска набора наиболее подходящих для интегративной методики параметров были использованы тексты, не собранные в размеченные коллекции. К ним относятся тексты выборок коротких сообщений в мессенджерах, юридизированные документы (жалобы, явка с повинной), публицистика, отзывы в сети Интернет, дословное содержание (транскрипт) устной речи обиходно-бытового дискурса, выполненное с применением орфографической транслитерации. Всего 10 текстовых блоков общим объемом более 115 938 слов (тексты, анализ которых приводится в главе 3).
Методико-методологическая база исследования представляет собой сочетание принципов когнитивной лингвистики, психолингвистики и структурной лингвистики в совокупности с исследованиями в области компьютерных наук. Методы когнитивной лингвистики и психолингвистики, как то: анализ языковой личности автора письменного текста по методике Ю.Н. Караулова, анализ компетенций языковой личности по методике С.М. Вула и Е.С. Горошко - помогают установить глубинную природу речевых структур, что позволяет объективно оценить сущность получаемой атрибуционной модели. Традиционный структуралистский подход к языку как уровневой системе (с применением морфологического, словообразовательного, лексического, синтаксического, семантического анализов) позволяет упростить сложные когнитивные структуры для их машинной формализации. Компьютерные методы анализа речевых структур (преимущественно автоматическая обработка текстов с целью вычленения идентификационных параметров) дают возможность преобразовать лингвистические модели в математические (с помощью методов математической статистики и теории вероятности) и сравнить их (посредством различных статистических метрик). Все указанные выше методы (когнитивные, компьютерные и психолингвистические) используются в рамках ведущего подхода диссертационного исследования - модельной лингвистики.
Основными инструментами исследования является язык программирования «Python» и разработанный с его помощью ресурс «ХоРом» (http: //khorom-attribution.ru/#/).
Научная новизна работы заключается в создании аутентичной атрибуционной методики, включающей в себя как методы традиционного анализа текста и исследования языковой личности с когнитивной точки зрения, так и машинный автоматический анализ речи пишущего. Важно, что настоящая методика не только разработана, но и формализована: на ее основе создан прототип атрибуционного программного обеспечения открытого доступа, основанный на принципах модельной лингвистики: http://khorom-attribution.ru/#/.
Теоретическая значимость исследования состоит в разработке структуры лингвистической модели, наиболее универсальной для атрибуции текстов любого объема и жанровой отнесенности и подходящей для формализации с помощью современных компьютерных инструментов. Теоретический вклад автора в разрабатываемую проблему также связан с созданием моделей анализа (формализованных правил для поиска) лингвистических конструкций и иных идентификационных компонентов языковой личности в автоматическом режиме. Также в работе была создана рейтерская таблица оценки любых лингвистических моделей, в том числе атрибуционных.
Практическая значимость работы обусловлена тем, что функционал
разработанных моделей анализа и модели исследования, а также созданного
на их основе электронного ресурса много шире изначально заложенных
возможностей. Наработки можно использовать не только для решения
идентификационной задачи атрибуционной лингвистики, но и для
исследования языковой личности писателей, журналистов, политиков и пр.,
при проведении диагностики языковой личности конкретного человека для
решения задач психолингвистики, психологии, для обследования обобщенной
языковой личности той или иной социальной группы, субкультуры и др. в
14
целях решения задач социолингвистики, социологии. Важно, что при использовании разработанной методики в любом из представленных выше случаев модель языковой личности будет отвечать принципам полноты, простоты, адекватности, технически точного и объективного описания оригинала, она будет экспланаторной, коммуникативной и интерпретируемой.
Результаты исследования были использованы в преподавании следующих научных дисциплин образовательной программы бакалавриата «Фундаментальная и прикладная лингвистика» НИУ ВШЭ (кампус в Нижнем Новгороде), образовательной программы «Политическая лингвистика» образовательной программы «Applied Linguistics and Text Analytics»: функциональные и когнитивные модели в лингвистике, лингвистическая экспертиза, компьютерные инструменты лингвистических исследований. Результаты исследования могут быть использованы также в преподавании таких дисциплин, как теория языка, корпусная лингвистика, психолингвистика и др.
На защиту выносятся следующие положения:
1. Моделирование языковой личности автора и моделирование языковых структур (на основе принципов семантического синтаксиса, грамматики конструкций, модельных схем предложений), используемых в тексте, является эффективным инструментом атрибуции текста;
2. Сочетание квалификативных и квантитативных методов атрибуционного анализа позволяет создать достаточно полную для решения идентификационной задачи, всесторонне имитирующую оригинал и одновременно объективную атрибуционную модель.
3. Для теоретической оценки качества любой модели, в том числе и модели атрибуции или модели идиостиля как репрезентации языковой личности, актуальны следующие критерии:
- полнота модели;
- простота модели;
- точность модели;
- экономичность модели;
- адекватность модели;
- единство в своей раздельности;
Рекомендованный список диссертаций по специальности «Теория языка», 10.02.19 шифр ВАК
Количественные критерии авторизации текста как проблема теоретической лингвистики2013 год, кандидат наук Верхозин, Степан Сергеевич
Речевой жанр протокола допроса: идентификационный аспект2020 год, кандидат наук Абрамкина Елена Евгеньевна
Проблемы стилеметрической идентификации субъкта идиолектной деятельности2022 год, доктор наук Литвинова Татьяна Александровна
Исследование лингвистических характеристик текста с целью определения пола автора на примере анализа письменных русскоязычных текстов политического дискурса2021 год, кандидат наук Огорелков Игорь Витальевич
Лингвистические методы атрибуции и датировки литературных произведений: к проблеме "Корнель - Мольер"2008 год, кандидат филологических наук Родионова, Елена Сергеевна
Введение диссертации (часть автореферата) на тему «Лингвистическое моделирование как инструмент атрибуции текста»
- цельность модели;
- структурность модели;
- экспланаторность;
- эвристичность модели (как частный случай экпланаторности);
- коммуникативность модели (с точки зрения языка);
- дедуктивность модели;
- интерпретируемость модели;
- математичность, точность, однозначность модели;
- уровень формализации модели;
- уровень технически точного отражения объекта моделирования;
- уровень реально-жизненного отражения объекта моделирования;
- уровень субъективизма в модели;
- уровень существенности модельных признаков (уровень абстракции (идеализации) модели);
- уровень действенности;
- уровень функциональной и практической направленности модели;
- «гипотезная мощность»;
- эстетические свойства модели (опционально).
4. Указанные критерии позволяют провести исследование валидности модели как с точки зрения общих обязательных свойств, так и по принципу типа модели.
5. Оценка моделей с помощью предложенной классификации релевантна не только на этапе выбора модели для решения практической или теоретической задачи, но и для обследования уже созданной и апробированной (экспериментально проверенной) модели, с целью объяснения продуктивности и непродуктивности компонентов этой модели.
6. Разработанная полуавтоматическая атрибуционная модель исследования языковой личности может быть успешно использована для решения идентификационной задачи автороведения для текстов разных жанров и объемов.
Апробация исследования.
2021: 1) Международный научно-практический семинар «Лингвистическая диагностика: методы исследования личности», Москва, Государственный институт русского языка имени А. С. Пушкина; 2) 27 -я Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2021», Москва.
2020: 1) X Международный конгресс по когнитивной лингвистике «Когнитивно-дискурсивная парадигма в лингвистике и смежных науках: современные проблемы и методология исследования» (Екатеринбург, Уральский государственный педагогический университет). Доклад: Компьютерные методы анализа для определения гендерной принадлежности текста. Опыт практического исследования; 2) Международная научная конференция «Русский язык в современном научном и образовательном пространстве». Доклад: Романова Т.В., Хоменко А.Ю. Лингвистическое моделирование как инструмент атрибуции текста (Москва, Российский университет дружбы народов); 3) VI Международная научно-практическая конференция «Язык. Право. Общество». Доклад: Моделирование идиолекта лица с помощью компьютерных инструментов в рамках судебной лингвистики (Пенза, Пензенский государственный университет); 4) XLIX Международная научная филологическая конференция, посвященная памяти Людмилы Алексеевны Вербицкой (1936-2019). Доклад: Моделирование языковой личности автора письменного текста с помощью методов текстомайнинга и модельной лингвистики (Санкт-Петербург, Санкт-Петербургский государственный университет).
2019 г.: 1) IX Международный конгресс по когнитивной лингвистике «Интегративные процессы в когнитивной лингвистике». Доклад:
17
Моделирование когнитивных структур на основе методик автороведческого анализа (Нижний Новгород, Высшая школа экономики); 2) Современная теоретическая лингвистика и проблемы судебной экспертизы. Доклад: Лингвистическая атрибуционная экспертиза в отечественной и зарубежной школах. перспективы развития автороведческих методик в России (Москва, Государственный институт русского языка имени А. С. Пушкина); 3) Artificial Intelligence and Natural Language (AINL). Доклад: Linguistic Modeling as a Technique in Forensic Authorship Attribution (Тарту, University of Tartu); 4) Лингвополитическая персонология: дискурсивный поворот. Доклад: Возможность идентификации лица по разнородному материалу — устной и письменной речи — в условиях одной экспертной задачи (Екатеринбург, Уральский государственный педагогический университет, Российская академия народного хозяйства и государственной службы при Президенте РФ, Уральский институт управления); 5) Языковая личность и эффективная коммуникация в современном поликультурном мире. Доклад: глобальный английский и интернет-сленг. Влияние на языковую личность современной молодежи (на материале русского и китайского языков) (Минск, Белорусский государственный университет).
2018: 1) V Международная научно-практическая конференция «Язык. Право. Общество». Доклад: Атрибуция текстов малого объёма. Статистические закономерности (Пенза, Пензенский государственный университет); 2) Массмедийная политическая коммуникация: методы и приемы лингвистического анализа и лингвистической экспертизы. Доклад: Лингвистическая атрибуционная экспертиза нехудожественного письменного текста (Екатеринбург, Уральский государственный педагогический университет);
2014; Проблемы языковой картины мира в синхронии и диахронии. Доклад: Анализ языковой личности автора текста с применением методов математической статистики как способ установления авторства текста
(Нижний Новгород, Мининский университет);
18
2013: 1) Язык. Право. Общество. Доклад: Апробация методов математической статистики при атрибуции текста в рамках судебного автороведения (Пенза, Пензенский государственный университет); 2) Artificial Intelligence and Natural Language (AINL). Доклад: Алгоритм автоматизации идентификации автора письменного речевого произведения в рамках судебного автороведения (Санкт-Петербург).
Всего опубликовано научных статей - 26; по теме диссертационного исследования - 20, из них статей, рецензируемых ВАК - 7; по теме диссертационного исследования - 7; 1 статья, опубликованная в журнале, рецензируемом в базе данных Scopus.
Диссертационное исследование поддержано Российским фондом фундаментальных исследований: грант РФФИ в рамках научного проекта № 19-31-27001 «Аспиранты» (№ 19-312-90022).
Структура работы. Работа состоит из Введения, четырёх глав, Заключения, библиографического списка, насчитывающего 259 наименования, в том числе 74 англоязычное. Результаты исследования представлены в виде 20 таблиц, 17 рисунков и 14 приложений.
Во Введении сформулированы цель и задачи исследования, его предмет и объект; обоснованы актуальность, новизна, теоретическая и практическая значимость, сформулированы положения, выносимые на защиту, приведены сведения об апробации научной работы.
В Главе 1 разработана проблема лингвистического моделирования, описаны имеющиеся типы лингвистических моделей, а также создана классификация модельных свойств для оценки эффективности модели с теоретической точки зрения.
В Главе 2 проводится анализ отечественных и зарубежных методов и
методик, алгоритмов и программных комплексов, предназначенных для
решения атрибуционных задач, а также анализ атрибуционных параметров
различных уровней, используемых в разных подходах. Оценивается
работоспособность перечисленных компонентов, описываются
19
положительные и отрицательные стороны их применения.
В Главе 3 вычленены наиболее эффективные компоненты и атрибуционные параметры рассмотренных в Главе 2 методик и программных комплексов, описаны результаты их апробации на аутентичном разнородном текстовом материале (тексты официально-делового стиля, корпоративная переписка, короткие текстовые сообщения, публицистика и пр.) с целью поиска наилучшего сочетания параметров для решения идентификационной задачи атрибуционной лингвистики.
В Главе 4 описывается созданный на основе сочетания идентификационных параметров и лингвистического моделирования прототип программного продукта как части полуавтоматической интегративной методики текстовой атрибуции. Приводятся результаты апробации аутентичной атрибуционной методики на разножанровом материале.
В Заключении подводятся итоги исследования, сформулированы рекомендации по улучшению ахритектуры моделей, лежащих в основе атрибуционного анализа по разработанной методике. В Приложениях содержится эмпирический материал.
Глава 1
Лингвистические модели и их свойства
Любая атрибуционная идентификационная методика, на наш взгляд, так или иначе связана с созданием модели текста, совокупности текстов, индивидуального авторского стиля или языковой личности автора. Модели при этом могут быть лингвистическими, математическими, статистическими и пр. Указанный постулат справедлив потому, что, используя какой бы то ни было набор параметров, исследователи с целью получения и (или) хранения информации аппроксимируют объект-оригинал до структуры, отражающей свойства, характеристики и связи объекта-оригинала произвольной природы, существенные для задачи, решаемой субъектом.
1.1. Природа модели, вариации, содержание понятия, свойства моделей
В традиционной отечественной лингвистике модель понимается
следующим образом: «модель [<фр. Моёе1е<шоёе11о<лат. modulus способ,
образец] <...> - абстрактное понятие эталона или образца грамматической,
фонологической или иной системы и представление самых общих
характеристик к.-л. языкового явления; общая схема описания системы языка
или его подсистем» [Жеребило 2010: 202]. Настоящее определение, на наш
взгляд, являет суть языковой модели. Вслед за классиком отечественной
модельной лингвистики А.Ф. Лосевым «языковую модель <...> можно было
бы определить как ту или иную схему конструирования языковых элементов»
[Лосев 2004: 20]. Термин модель был заимствован наукой о языке у точных
наук, он «был впервые употреблен математиками Евгением Бельтрами и
Феликсом Клайном в геометрии, а впоследствии Фреге и Расселом в их
теориях математической логики» [Лосев 2004: 13]. В лингвистике же впервые
этот термин был употреблен в 1944 г. З. Хэррисом в связи с описанием
некоторых методологических проблем. Более же привычное нам значение
термин приобрёл в интерпретации Ч. Хокетта (1954 г.) и Н. Хомского (1956
21
г.). Учёные понимали под моделью «обобщённую и формализованную структуру или процесс тех или иных фактов языка» [Лосев 2004: 13 - 14].
Содержание термина «модель» в современной лингвистике в значительной степени охватывалось ранее термином «теория» (особенно в понимании Л. Ельмслева). Считается, что наименования модель заслуживает лишь такая теория, которая достаточно эксплицитно изложена и в достаточной степени формализована (в идеале каждая модель должна допускать реализацию на ЭВМ) [Ельмслев 2005].
Так, языковую модель, на наш взгляд, следует воспринимать как структуру, описывающую некую языковую (отвлеченную, инвариантную, в достаточной мере абстрактную) сущность.
Лингвистическая модель часто является понятием синонимичным понятию языковая модель, некоторые исследователи говорят о том, что «понятия языковая модель и лингвистическая модель лингвисты используют как синонимы без каких-либо дополнительных комментариев» [Кудрявцева 2018: 135]. Хотя эмпирический опыт показывает, что данные термины всё же имеют каждый свой узус. Термин лингвистическая модель более применим к менее абстрактным, более конкретным явлениям, имеющим материальное выражение: в атрибуционной лингвистике, всегда имеющей дело с речевыми продуктами конкретных индивидов, чаще всего используется именно термин лингвистическая модель (linguistic model); лингвистическими называют модели текстов и их совокупностей, - хотя это и не всегда так (например, языковая личность тоже суть модель).
Тем не менее в современной доктрине языкознания, строящейся на больших корпусах текстов и вслед за, например, В.А. Плунгяном [Плунгян 2009], часто воспринимающей язык и речь как единое множество, видится логичным объединение абстрактного и конкретного. Именно поэтому мы считаем возможным применять все классификации языковых моделей и всю информацию о них в том числе к моделям лингвистическим.
Это дает возможность соединить постулаты и теоретические выкладки таких известных ученых, разрабатывавших проблемы модельной лингвистика, но использовавших разную терминологию в своих трудах, как А.Ф.Лосев, Ю.Д.Апресян, И.И. Ревзин, В.А.Штофф и пр.
В связи с этим определение модели Т.В. Жеребило, предложенное выше, можно считать подходящим и для лингвистической атрибуционной модели, построенной на идиостиле как экспликаторе языковой личности пишущего, поскольку идиолект конкретного автора можно рассматривать как вариант языка в целом.
А.Ф. Лосев в 60-е гг. XX в., в период создания монографии «Введение в общую теорию языковых моделей», высказывал опасения по поводу и зачастую некорректного использования термина модель и вообще приёмов моделирования в языке (см. [Лосев 2004: 11 - 20]). Тем не менее в современной лингвистике, а также смежных науках (психолингвистике, прикладной лингвистике и пр.) без приёмов языкового моделирования не обойтись. Чем же это обусловлено?
Т.Н. Медведева определяет модель в языкознании как «искусственно созданное лингвистом реальное или мысленное устройство, воспроизводящее, имитирующее своим поведением (обычно в упрощенном виде) поведение какого-либо другого («настоящего») устройства (оригинала) в лингвистических целях» [Медведева 2010: 4, цитата из [Лингвистический энциклопедический словарь 2002: https://les.academic.ru]]. [«Моделирование -это исследовательский приём, основанный на подмене оригинала его автономным аналогом - моделью» [Павловская 2010: 73].
В условиях компьютерной эпохи и объёмных баз данных различного рода упрощение оригинала, «подмена» исходного сложного объекта его аналогом более простой структуры - зачастую едва ли не единственный способ решения множества прикладных задач (грамматические и семантические модели для машинного перевода, текстовые модели для авторизации и датировки текстов и пр.). Опрощенные конструкты позволяют
23
наблюдать за языковыми явлениями сложной природы, анализировать их, структурировать для наилучшего их понимания, а в некоторых случаях и получать новые сведения об объекте наблюдения.
Понятие лингвистическая модель тесно связано с принципами моделирования и, как следствие, структурными свойствами моделей разных типов, а также универсалиями, присущими всем видам такого рода образований.
А.Ф. Лосев отмечал, что основная задача лингвистического моделирования - «установление тех или иных структур, но не разыскивание новых языковых фактов, приведение в систему полученных эмпирическим путём языковых данных, что делает языковые категории более ясными, определёнными, максимально чётко сформулированными и систематизированными» [Лосев 2004: 62]. Таким образом, одним из основных свойств модели является свойство «экспланаторности, или объяснительной силы» [Апресян 1966: 91].
Эта объяснительная сила понимается учёными по-разному. Ю.Д. Апресян утверждает, что модель обладает свойством экспланаторности, если она: «1) объясняет факты или данные специально поставленных экспериментов, которые необъяснимы с точки зрения старой теории, 2) предсказывает неизвестное раньше, но принципиально возможное поведение объекта, которое позднее подтверждается данными новых наблюдений или новых экспериментов» [Там же].
Если А.Ф. Лосев указывал на невозможность «разыскивания новых языковых фактов», то Ю.Д. Апресян, наоборот, говорит о возможности установления «неизвестного раньше <...> поведения объекта» посредством вероятностных методик в лингвистическом моделировании. В.А. Штофф пишет, что «под моделью понимается такая мысленно представляемая или материально реализованная система, которая, отображая или воспроизводя объект исследования, способна замещать его так, что его изучение даёт нам новую информацию о нём» [Штофф 1966: 19]. К.И. Белоусов отмечает, что
24
«модель, воспроизводя какой-либо онтологически языковой объект, должна не столько схематизировать его, сколько генерировать новые знания об объекте» [Белоусов 2010: 95]. Итак, идея об извлечении новых языковых фактов с помощью методов моделирования достаточно распространена и связана с объяснительной силой модели как одним из основных её свойств.
Ю.Д. Апресян постулирует, что моделировать можно только те свойства объекта, которые не определяются его физической природой [Апресян 1966: 79]. То есть успешно моделируются те характеристики, которые связаны со структурной организацией объекта. Тем не менее современные ученые утверждают, что моделирование неструктурных свойств, в принципе, возможно («Моделирование ментальной деятельности субъекта убеждения носит знаковый характер, порождая систему знаков, значениями которых являются структуры ментальной деятельность субъекта» [Брюшинкин 2009: 18]), однако при этом затруднено перенесение особенностей организации модели на моделируемый объект.
Так, метод моделирования ментальных конструктов (концептов, метафор) в политическом и социально ориентированном дискурсе успешно занимаются такие современные лингвисты, как Чудинов А.П., Королева И.А., Прохорова С.М., Чернышова Л.В., Бабенко Л.Г. и пр.
Итак, модель - (франц. modèle, от лат. modulus — мера) суть «функциональная аппроксимация объекта» [Апресян 1966: 81].
Что касается математической стороны свойств моделей, то Ю.Д. Апресян отмечает необходимость формализации любой лингвистической модели: «всякая модель, в том числе лингвистическая, должна быть формальной» [Апресян 1966: 88]. Модель считается формальной, если в ней в явном виде и однозначно заданы исходные объекты, связывающие их утверждения и правила обращения с ними (правила образования или выделения новых объектов и утверждений). Формальная модель связывается с опытными данными посредством той или иной интерпретации. Более того, Ю.Д. Апресян полагает, что «в идеале всякая формальна модель является
25
математической системой» [Там же: 89] и обладает свойствами точности, математичности, однозначности (в понимании Ю.Д. Апресяна синонимичны) [Там же]. Все математические, а соответственно, в идеальном случае и все лингвистические, модели представляют собой либо исчисления - систему разрешений (позволений), либо алгоритмы - последовательность приказов (команд) (см. [Апресян 1966: 108 - 111]).
А.Ф. Лосев проводил параллель между структурой любой модели и структурой математического множества. Множество, по А.Ф. Лосеву, есть «единораздельная целость, в которой точно фиксируется как она сама в своей самостоятельности и неделимости, так и все её элементы» [Лосев 2004: 21]. Так, по А.Ф. Лосеву, модель «представляет собой <...> упорядоченную последовательность тех или иных элементов» во главе с исходным, первичным элементов, задающим принцип конструирования [Там же: 22 - 23]. Этот элемент служит прототипом всех элементов модельного кортежа. Сам же кортеж для выполнения условия «единства в своей раздельности» должен состоять из подмножеств, то есть модель всегда предполагает разбиение на части внутри целого. Одновременно важно понимать, что во главе понятия модель в соответствии с принципом системности стоит понятие цельности.
Материал, из которого построена модель, назван А.Ф. Лосевым
субстратом, а принцип организации модели - её структурой. Следует отличать
структуры вообще и модели в частности: модель «получается тогда, когда
структуру данного субстрата мы перенесём на другой субстрат». Более того,
следует отметить тот факт, что перенесение это должно отвечать двум
критериям: 1) оно должно быть реально-жизненно, то есть отражать
главенствующие, ключевые особенности объекта моделирования; 2) оно
должно быть технически-точно, то есть воспроизводить свойства объекта
моделирования настолько точно, насколько это возможно [Лосев 2004: 28]. С
другой стороны, «всякая формальная, в том числе теоретико-множественная
структура и модель языка, по своей природе всегда коммуникативна» [Там же:
34]. Этот факт накладывает условия изучения всякой языковой структуры для
26
целей её моделирования «снизу», то есть с анализа эмпирически полученный языковых данных [Там же: 60]. Как следствие любая языковая модель должна быть дедуктивной и пользоваться методами традиционного языкознания для обследования данных. Но в силу сложности объекта моделирования - языка -сама модель не должна в точности повторять все языковые реалии, она должна лишь отображать значимые для исследователя и релевантные для практической задачи лингвистические факты [Там же: 61 - 62]. Задача любой модели - отражение реальности, а всякая модель строится «на основе гипотезы о возможном устройстве оригинала и представляет собой функциональный аналог оригинала, что позволяет переносить знания с модели на оригинал. «Критерием адекватности модели служит практический эксперимент» [Медведева 2010: 4]. Так, одним из важных свойств любой модели является её функциональность, поскольку модель суть отражение не всех фактов об объекте-оригинале, а только значимых, тех, которые помогают выполнять модели определенную функцию; уровень же значимости фактов можно проверить только экспериментально, поняв работает ли модель, выполняет ли она свою функцию.
Наличие этих конструктов обусловливает возможность и зачастую практическую необходимость процесса интерпретации. «Дать интерпретацию модели - значит указать правила, вероятностные или строгие, подстановки объектов некоторой предметной области, например, языка вместо объектов (символов) модели» [Там же: 89].
Процесс построения модели по Ю.Д. Апресяну предполагает несколько этапов:
«1) фиксирование фактов, требующих объяснения,
2) выдвижение гипотез для объяснения фактов,
3) реализация гипотез в виде моделей, не только объясняющих исходные факты, но и предсказывающих новые, ещё не наблюдавшиеся факты,
4) экспериментальная проверка модели» [Там же: 98 - 99].
Так, в любой модели фиксируются: объекты, соответствующие данным непосредственного наблюдения; объекты, конструируемые исследователем для описания, заранее заданные, строго ограниченные наборы категорий, признаков, элементарных смысловых структур и т. п. [Кравцова 2014: 183184].
К общим свойствам лингвистических моделей можно отнести следующие:
- модель - искусственный объект;
- условность, формализация модели (как структурная, так и сигнатурная);
- перенесение структуры одного субстрата на другой субстрат;
- техническая точность отражения оригинала;
- «единство в своей раздельности»;
- цельность;
- упрощённость по сравнению с оригиналом;
- центральное место занимает функция имитации поведения оригинала;
- наличие целевой определённости (модель всегда создаётся с определённой практически и теоретически направленной интенцией);
- коммуникативность модели;
- дедуктивность модели;
- любая лингвистическая модель требует применения как математических средств анализа, так и собственно лингвистических (обследование языковых фактов «снизу»);
- гипотетичность модели (в основе создания любой модели лежит построение некой гипотезы);
- математичность, точность, однозначность;
- интерпретируемость;
- экспланаторность;
- моделируемый образ может быть не только материальным, но и
мысленным и передаваться посредством знаковой системы;
28
- модель чаще всего является гомоморфной оригиналу (то есть многим элементам оригинала соответствует меньшее количество элементов модели в отличие от изоморфизма)2;
- предсказывающая сила.
В соответствии с принципом целевой определённости любой модели, а также с принципами моделирования вообще можно выделить ряд основные требования к лингвистической модели:
1. Полнота - способность отражать всю необходимую информацию;
2. Простота - использования относительно небольшого количества средств (сигнатуры, правил) для достижения поставленной научной цели;
3. Экономность - экономичное использование энергетических и временных ресурсов при применении модели;
4. Точность - возможность выполнения операций представляемым моделью формальным аппаратом;
5. Объяснительная сила (необходимое свойство) - способность модели давать информацию о причинах наблюдаемых фактов и предсказывать новые;
6. Эвристичность (как частный случай экспланаторности) - способность модели к поиску новых знаний об объекте;
6. Адекватность - свойство максимальной схожести с объектом-оригиналом;
7. Эстетические свойства (опционально).
1.2. Классификация моделей по разным основаниям
Классификаций видов моделей в лингвистике существует достаточно много, тем не менее, вероятно, наиболее распространенная в отечественной
2 Изоморфизм и гомоморфизм (греч. isos — одинаковый, Иошо^ — подобный и шогрИе — форма) — понятия, характеризующие соответствие междуструктурами объектов. Две системы, рассматриваемые отвлеченно от природы составляющих их элементов, являются изоморфными друг другу, если каждому элементу первой системы соответствует лишь один элемент второй и каждой связи в одной системе соответствует связь в другой и обратно. Такое взаимооднозначное соответствие называется изоморфизм. <.. .> Гомоморфизм отличается от изоморфизма тем, что соответствие объектов (систем) однозначно лишь в одну сторону. Поэтому ГОМОФОРМНЫЙ образ есть неполное, приближенное отображение структуры оригинала [Философский словарь 1991: 155].
науке классификация моделей по их типам принадлежит Ю.Д. Апресяну и выглядит следующим образом:
1) модели речевой деятельности человека, имитирующие конкретные языковые процессы и явления:
1.1. а) несемантические (собственно синтаксические, имитирующие грамматическую способность); б) семантические, имитирующие способность носителей языка понимать и строить осмысленные предложения;
Похожие диссертационные работы по специальности «Теория языка», 10.02.19 шифр ВАК
Методологические основы судебного речеведения2003 год, доктор филологических наук Галяшина, Елена Игоревна
Поэтическая картина мира М.А. Волошина и её отражение в слове2024 год, кандидат наук Иванченко Светлана Анатольевна
Репрезентация языковой личности автора художественно-исторического текста (на материале произведений И.И. Лажечникова)2019 год, кандидат наук Проскурнина Людмила Васильевна
Автоматический анализ ритмических характеристик текстов на естественном языке2022 год, кандидат наук Лагутина Ксения Владимировна
ЛЕКСИКО-КВАНТИТАТИВНОЕ МОДЕЛИРОВАНИЕ ЯЗЫКОВОЙ ЛИЧНОСТИ В ИДЕНТИФИКАЦИОННОМ АСПЕКТЕ (НА МАТЕРИАЛЕ РУССКОЯЗЫЧНЫХ ИНТЕРНЕТ-ДНЕВНИКОВ)2015 год, кандидат наук Напреенко Галина Викторовна
Список литературы диссертационного исследования кандидат наук Хоменко Анна Юрьевна, 2021 год
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Абрамкина Е. Е. Протокол допроса как объект автороведческой идентификационной экспертизы: задачи, проблемы, методика анализа // Сборник материалов Международной научная конференция «Современная теоретическая лингвистика и проблемы судебной экспертизы», г. Москва, 1-2 октября 2019 г. - М.: Государственный институт русского языка им. А.С. Пушкина, 2019. С. 492-506.
2. Аврорин В.А. Проблемы изучения функциональной стороны языка: (К вопросу о предмете социолингвистики) / В. А. Аврорин: АН СССР, Ин-т языкознания. - Л: «Наука», 1975. - 276 с.
3. Андреев Н.Д., Зиндер Л.Р. О понятиях речевого акта, речи, речевой вероятности и языка // «Вопросы языкознания», 1963, № 3. С.15-21.
4. Апресян Ю.Д. Идеи и методы современной структурной лингвистики. - М., 1966. 305 с.
5. Арутюнова Н.Д. Предложение и его смысл : логико-семантические проблемы / Н. Д. Арутюнова. - Изд. 6-е. - Москва: URSS, 2009. - 382.
6. Баранов А.Н. Введение в прикладную лингвистику: Учебное пособие. - М.: Эдиториал УРСС, 2001. — 360 с.
7. Батов В.И. Другому как понять тебя? - М.: Знание. - 1991. — URL: http://bookap.info/okolopsy/batov drugomu kak ponyat tebya/ (дата обращения: 05.08.2018 г.).
8. Батов В.И., Сорокин Ю.А. Опыт построения методики для установления авторства текстов // Изв. АН СССР. Сер. Лит. и языка. Т. 36.1977, №4. С. 345—347; Обзоры. — С. 348—361.
9. Батура Т. В. Формальные методы определения авторства текстов // Вестник НГУ. Серия: Информационные технологии. Т. 2, 2012. №24. С.81-94.
10. Белоусов К.И. Модельная лингвистика и проблемы моделирования языковой реальности. Модельная лингвистика и проблемы
моделирования языковой реальности // Вестник Оренбургского государственного университета, 2010, № 11 (117). С.94-97.
11. Белянин В. П. Психолингвистика: учебник / В. П. Белянин; Российская акад. образования, Московский психолого-социальный ин-т. - 5-е изд. - М.: Флинта: Московский психолого-социальный ин-т, 2008. - 226.
12. Белянин В.П. Основы психолингвистической диагностики: модели мира в литературе / В.П. Белянин; Российская акад. наук, Ин-т языкознания, Фонд Чтения им. Н. А. Рубакина. - М.: Тривола, 2000. - 247 с.
13. Бессмертный И.А., Нугуманова А.Б. Метод автоматического построения тезаурусов на основе статистической обработки текстов на естественном языке // Известия томского политехнического университета. 2012. № 5. С. 125-130.
14. Болдырев Н.Н. Язык и структура сознания // Когнитивные исследования языка. 2016. Вып. XXIV. С. 35-48.
15. Бринев К.И. Лингвистическая экспертиза: типы экспертных задач и методические презумпции // Юрислингвистика - 9: Истина в языке и праве: межвузовский сборник научных трудов. - Кемерово, Барнаул: Изд-во Алт. унта, 2008. С. 232-249.
16. Брюшинкин В.Н. Когнитивный подход к аргументации // РАЦИО.ги. 2009. № 2. С. 2-22. — URL: https://j ournals.kantiana. ru/upload/iblock/66a/
Брюшинкин%20В.Н.%20Когнитивный%20подход.pdf (дата обращения: 05.07.2020 г.).
17. Булгакова Е.В. Автоматизированная система экспертного анализа в задачах верификации диктора : автореферат дис. ... кандидата технических наук : 05.13.01 / Булгакова Елена Владимировна; [Место защиты: С.-Петерб. нац. исслед. ун-т информац. технологий, механики и оптики]. - СПб., 2016. -122 с.
18. Буров А.А. К вопросу об идиостиле современного оратора как языковой личности // Записки Горного института. Т.160. Часть 1. 2017. С.8-9.
231
19. Василевич А.П. Цветонаименования как характеристика языка писателея // Лингвистика текста и стилистика: Уч. Зап. Тартуского гос. Университета, 1981. № 585. С. 135-143.
20. Виноградов В. В. Проблема авторства и теория стилей / В. В. Виноградов. - М.: Гослитиздат, 1961. - 614 с.
21. Воркачев С.Г. Лингвокультурология, языковая личность, концепт: становление антропоцентрической парадигмы в языкознании // Филологические науки. 2001. № 1. С. 64-72.
22. Воробьев В.В. Языковая личность в лингвокультурологии // Тез. докл. Языковая личность: Лингвистика. Лингвокультурология. Лингводидактика. БашГУ. Ноябрь 2011 г. Уфа: РИЦ БашГУ, 2011. С. 234-237.
23. Воскобойников Ю.Е., Тимошенко Е.И. Математическая статистика с примерами в Excel: Учебное пособие. - Новосибирск: Изд.НГАСУ, 2006. - 154 с.
24. Вул С.М. Горошко Е.И. Судебно- автороведческая классификационная диагностика: установление половой принадлежности автора документа // Материалы научно-практической конференции Современные достижения науки и техники в борьбе с преступностью. -Минск, 1992. С. 139-141.
25. Вул С.М. Криминалистическое исследование признаков письменной речи / М-во юстиции УССР. Харьк. науч.-исслед. ин-т судебных экспертиз им. заслуж. проф. Н. С. Бокариуса. - Киев: [М-во юстиции УССР], 1973. - 44 с.
26. Вул С.М. Особенности оценки следователем и судом заключения идентификационной судебно-автороведческой экспертизы // Криминалистика и судебная экспертизы, 1982. №24. С.81-84.
27. Вул. С.М. Судебно-автороведческая идентификационная экспертиза: методические основы: Методическое пособие. — Харьков: ХНИИСЭ, 2007. — 64 с.
28. Вул. С.М. Теоретические и методические вопросы криминалистического исследования письменной речи: Метод. пособие / М-во юстиции СССР. ВНИИ судебных экспертиз. - Москва: [б. и.], 1977. - 109 с.
29. Галяшина Е.И. Основы судебного речеведения: Монография / Под ред. проф. М. В. Горбаневского. - М.: СТЭНСИ, 2003. - 236 с.
30. Галяшина Е.И. Проблемы дифференциации спонтанной и подготовленной речи // Труды международного семинара «Диалог 2002». В 2-х томах (Протвино, 06-11 июня 2002 года). - М.: Наука, 2002. С.68-79.
31. Галяшина Е.И., Ермолова Е.И. Перспективы развития автороведческой экспертизы в России // Судебная экспертизы, 2005. №2 3. С. 510.
32. Галяшина Е.И., Смотров С.А., Шашкин и др. Э.П. Теория и практика судебной экспертизы. - СПб.: Питер, 2003. - 697 с.
33. Гнеденко Б.В. Курс теории вероятностей. Учебник. - Изд. 6-е, перераб. и доп. - М.: Наука, 1988. - 448 с.
34. Голев Н. Д., Напреенко Г. В. Предлоги и падежные формы русского языка как предмет идентификационной лингвистики // Вестник Кемеровского государственного университета. 2019. Т. 21. № 3. С. 801-810. 001: https://doi.org/10.21603/2078-8975-2019-21-3-801-810
35. Головин Б. Н. Язык и статистика. - М.: Просвещение, 1970. - 190
с.
36. Горошко Е. И. Особенности мужского и женского стиля письма // Сб. науч. тр. конф. «Гендерный фактор в языке и коммуникации».- М.: МГЛУ, 1999.
37. Горошко Е. И. Судебно-авторовдческая классификационная экспертиза // Теорiя та практика судово! експертизи i кримшалютики. - Харюв: Право, 2003, №3.
38. Гришунин А. Л. Опыт обследования употребительности языковых дублетов, в целях атрибуции // Вопросы текстологии : сб. статей / отв. ред. В. С. Нечаева. М: Изд. Акад. наук СССР, 1960, №2. С. 28-41.
233
39. Губаева Т., Ситдикова Р. Определяет ли автороведческая экспертиза автора? — URL: http://siberia-expert.com/publ/satti/stati/opredeliaet li avtorovedcheskaja ehkspertiza avtora t
gubaeva r sitdikova/4-1-0-165 (дата обращения: 17.01.2018 г.)
40. Ельмслев Л. Пролегомены к теории языка / Л. Ельмслев ; пер. с англ. [В. А. Звегинцев и др.]. - Москва : URSS, 2005. - 243, Пер.: Hjelmslev, Louis Prolegomena to a theory of language.
41. Зализняк, А. А. Проблема подлинности «Слова о полку Игореве» / А. А. Зализняк // Электронный журнал «Мир истории». - № 1. - 2008. — URL : http://www.historia.ru/2008/01/slovo.htm (дата обращения: 17.01.2018).
42. Захаров В.Н. Захаров В.Н., Леонтьев А.А., Рогов А.А., Сидоров Ю.В. Программная система поддержки атрибуции текстов статей Ф.М. Достоевского // Труды Петрозаводского государственного университета. Сер. «Прикладная математика и информатика», Петрозаводск: Изд-во ПетрГУ, 2000. №9. C.113-122. - Соавт.: Леонтьев А. А., Рогов А. А., Сидоров Ю. В.
43. Захаров В.Н. Поиск грамматического инварианта Ф. М. Достоевского методами статистического анализа // Труды Петрозаводского государственного университета. Сер. «Прикладная математика и информатика». — Петрозаводск : Изд-во ПетрГУ, 2000. № 9. C. 67—80. — Соавт. : Рогов А. А., Сидоров Ю. В.
44. Захаров В.П., Богданова С.Ю. Корпусная Лингвистика. Учебник. Иркутск ИГЛУ 2011. - 136 с.
45. Захаров, В. П., Хохлова, М. В. Статистический метод выявления коллокаций // Языковая инженерия: в поиске смыслов: Доклады семинара «Лингвистические информационные технологии в Интернете»: XI Всероссийская объединенная конференция «Интернет и современное общество». - СПб.: Издательство Санкт-Петербургского университета, 2008. - С. 40-54.
46. Иванова И. Н. Фанфикшен (fan fiction) как жанр массовой литературы : стереотипы гендерного сознания «аффтаров» / И. Н. Иванова, А.
234
С. Иванова // Культтовары : феномен массовой литературы в современной России : сборник научных статей / И. Л. Савкина, М. А. Черняк. — СПб: СПГУТД, 2009. — С. 135—137.
47. Ивченко Г.И., Медведев Ю.И. Математическая статистика: Учебное пособие. - М.: Высшая школа, 1984. - 600 с.
48. Ионова С. В., Огорелков И. В. Речевая диагностика личности по гендерному признаку в автороведении: квантитативный подход // Вестник Волгоградского государственного университета. Серия 2, Языкознание. -2020. - Т. 19, № 1. С. 115-127. - DOI: https://doi.Org/10.15688/jvolsu2.2020.1.10.
49. Каганов А.Ш. Криминалистическая идентификация личности пот голосу и звучащей речи: монография / А. Ш. Каганов. - 2-е изд., перераб. и доп. - Москва: Юрлитинформ, 2012. - 292.
50. Калугина Е.Н. Гендер в антропоориентированных науках. // Актуальные проблемы гуманитарных и естественных наук. 2013. №5. С.251-254.
51. Карасик В.И. Языковой круг: личность, концепты, дискурс / В. И. Карасик; Науч.-исслед. лаб. «Аксиол. Лингвистика». - М.: ГНОЗИС, 2004 (ГУП Смол. обл. тип. им. В.И. Смирнова). - 389 с.
52. Караулов Ю. Н. «Четыре кита» современной лингвистики или о предпосылках включения «языковой личности» в объект науки о языке (от содержания науки - к ее истории) // Соотношение частнонаучных методов и методологии в филологической науке: Сб. науч. Трудов. - М.: 1986. С. 33-52.
53. Караулов Ю.Н. Русский язык и языковая личность. Изд. 7-е. — М.: Издательство ЛКИ, 2010. — 264 с.
54. Ким Л. Г. Холистические принципы проведения идентификационной автороведческой экспертизы разножанровых текстов // Международная научная конференция «Современная теоретическая лингвистика и проблемы судебной экспертизы». М.: Государственный институт русского языка им. А.С. Пушкина, 2019. С. 507-516.
55. Кирилина А. В. Новый этап развития отечественной лингвистической гендерологии // Гендерные исследования и гендерное образование в высшей школе: Материалы международной научной конференции, Иваново, 25-26 июня 2002 г.: В 2 ч. - Ч. II. История, социология, язык, культура. - Иваново: Иван. гос. ун-т, 2002. С.238-242.
56. Колесов В.В. Язык «Слова» / В.В. Колесов // Энциклопедия «Слова о полку Игореве» : в 5 т. / чл. -корр. РАН Л. А. Дмитриев, академик РАН Д. С. Лихачев, канд. филол. наук. С. А. Семячко, д-р филол. наук О. В. Творогов. Т. 5. - СПб. : Дмитрий Буланин, 1995. - С. 277 - 279.
57. Колпакова Л. В. Лексические средства репрезентации эмоций (гендерный аспект) // Вестник ТГПУ (TSPU Bulletin). 2016. № 7 (172). С. 96100.
58. Комиссаров А.Ю. Криминалистическое исследование письменной речи : Учеб. пособие / А.Ю. Комиссаров; М-во внутренних дел Рос. Федерации. Эксперт.-криминалист. центр. - М. : Эксперт.-криминалист. центр МВД России, 2000. - 103 с.
59. Кравец Т. В. Фоностилистика и фоносемантика как основные направления прикладной лингвистики / Т. В. Кравец // Обучение иностранному языку студентов высших и средних общеобразовательных учреждений на современном этапе : материалы Всерос. науч.-метод. видеоконф. (с междунар. участием), 16 янв. 2015 г. / отв. ред. О. Н. Морозова. - Благовещенск : Изд-во Амур. гос. ун-та, 2015. - С. 135-142
60. Кравцова Ю. В. Моделирование в современной лингвистике // Вюник Житомирського державного ушверситету. Фшолопчш науки, 2015. № 5 (77). С.181-189, URL: http://eprints.zu.edu.ua/17284/1/31 .pdf (дата обращения: 12.08.2019).
61. Красных В.В. «Свой» среди «чужих»: миф или реальность? - М.: ИТДГК «Гнозис», 2003. - 375 с.
62. Красных В.В. Виртуальная реальность или реальная виртуальность?: Человек. Сознание. Коммуникация / В. В. Красных; Моск. ун-
236
т им. М. В. Ломоносова, Филол. фак. - М. : Изд-во АО "Диалог-МГУ", 1998. -350 с.
63. Кристалл Д., Дейви Д. Стилистический анализ // Новое в зарубежной лингвистике,1980. №9. С.148-165.
64. Кронгауз М.А. Русский язык на грани нервного срыва / Максим Кронгауз. - Москва : Знак : Языки славянских культур, 2008. - 229 с.
65. Кудрявцева Е.Г. Понятие «языковая модель» в лингвистике, философии и культурологии // Культура и цивилизация. 2018. Том 8. № 1А. С. 134-141.
66. Кукушкина О. В. Определение авторства текста с использованием буквенной и грамматической информации / О. В. Кукушкина, А. А. Поликарпов, Д. В. Хмелев // Проблемы передачи информации. 2001. Т. 37. № 2. С. 96-08.
67. Курьянович А.В. К вопросу о жанрово-стилистических особенностях русской эпистолярной публицистики (на материале писем В.П. Астафьева) /А.В. Курьянович // Вестник Томского государственного педагогического университета. 2013. № 3 (131). С. 183-187.
68. Кучмезова Л.О. Вставные конструкции в аспекте гендерной лингвистики // Вестник КГУ им. Н.А. Некрасова. № 2, 2011.С. 175-179.
69. Леденева В. В. Идиостиль (к уточнению понятия) // Филологические науки, 2001. №5. С.38-41.
70. Леонтьев А. А. Некоторые проблемы обучения русскому языку как иностранному. — М: МГУ, 1970.
71. Лингвистика конструкций / Отв. ред. Е. В. Рахилина. — М.: «Издательский центр «Азбуковник», 2010. — 584 с.
72. Литвинова Т. А. Идиолект как объект корпусной идиолектологии: к становлению нового лингвистического направления. // Ученые записки Новгородского государственного университета имени Ярослава Мудрого. No 7 (25). С. 1-5.
73. Лихачев Д.С. Слово о полку Игореве: ист.-лит. очерк. — М.: Просвещение, 1976. —175 с. — (2-е изд., испр. и доп. — 1982).
74. Лосев А.Ф. Введение в общую теорию языковых моделей. / Под ред. И.А. Василенко. Изд. 2-е, стереотипное. - М.: Едиториал УРСС, 2004. -296 с.
75. Ляшевкая О.Н. Индексы удобочитаемости как мера оценки сложности текста, URL: https://ling.hse.ru/data/2016/12/15/1111563794/Readability%20talk.pdf. - Дата публикации: 15. 12. 2016 (дата обращения: 05.07.2020 г.).
76. Манаенкова М.Р. Речевая компетентность личности: содержание и структура. // Социально-экономические явления и процессы. Тамбов, 2014. Т.9. № 10. С. 223-231.
77. Марков А. А. Опыт статистического исследования текста романа «Евгений Онегин» // Изв. Имп. Академии наук. СПб., 1913. Серия 6. Т. 7.
78. Марков А. А. Об одном применении статистического метода /А. А. Марков // Известия Императорской Академии наук. Сер. 6. - 1916. - Т. 10, № 4. - С. 239-242. URL: http://www.textology.ru/ (дата обращения: 12.01.2018).
79. Мартыненко Г.Я. Многомерный синтаксический анализ художественной прозы // Структурная и прикладная лингвистика. Л.: Изд-во ЛГУ, 1983. №. 2. С. 58-72.
80. Мартыненко Г. Я. Основы стилеметрии/ Г. Я. Мартыненко. - Л.: Изд-во Ленингр. ун-та, 1988. - 173 с.
81. Мартыненко Г. Я. Стилеметрия: возникновение и становление в контексте междисциплинарного взаимодействия. // Структурная и прикладная лингвистика. Вып. 11: межвуз. сб. / под ред. А. С. Герда и И. С. Николаева. — СПб.: Изд-во С.-Петерб. ун-та, 2015. С. 9 - 28.
82. Марусенко М. А. Атрибуция анонимных и псевдонимных литературных произведений методами распознавания образов. — Л.: Изд-во Ленингр. ун-та, 1990. — 164 с.
83. Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами теории распознавания образов : автореферат дис. ... кандидата филологических наук: 10.02.19 / Ленинградский ун-т. - Ленинград, 1991. - 26 с.
84. Марусенко М.А. Атрибуция анонимных и псевдонимных текстов как типичная задача распознавания образов // Историография и источниковедение отечественной истории. 2003. №. 3.
85. Медведева Т.Н. Формальные модели в лингвистике : Учебное пособие / Т.Н. Медведева. - Саратов: Научная книга, 2010. - 56 с.
86. Милов Л.В., Бородкин Л.И., Иванова Т.В. и др. От Нестора до Фонвизина: Новые методы определения авторства / [Л. В. Милов, Л. И. Бородкин, Т. В. Иванова и др.]; Под ред. Л. В. Милова. - М. : Прогресс, 1994. - 443 с.
87. Морозов А.В. Автороведческая экспертиза текста договора // Юрислингвистика, Юридические аспекты языка и лингвистические аспекты права. - URL: http://siberia-expert.com/load/nomera zhurnalov/1-1-0-11 - Дата публикации: 1.10.2011 г. (дата обращения: 12.01.2018).
88. Морозов Н. А. Лингвистические спектры: Средство для отличения плагиатов от истинных произведений того или другого известного автора : Стилеметрический этюд / Н. А. Морозов // Известия Отдела русского языка и словесности Императорской Академии наук. 1915. Т. 20, кн. 4. С. 93-127. -URL: http://feb-web.ru/feb/izvest/1915/04/154-093.htm (дата обращения: 12.01.2018).
89. Нестерова О. А. Психолингвистический анализ мотивационных ориентиров языковой личности как инструмент выявления социально -политических взглядов говорящего (на примере публицистического дискурса В. П. Астафьева) // Политическая лингвистика. 2015. № 3 (53). С. 218-223.
90. Нестерова О.А. Психолингвистический и лингвокогнитивный анализ языковой личности : на примере публицистического дискурса В.П. Астафьева : диссертация ... кандидата филологических наук : 10.02.01 /
239
Нестерова Ольга Александровна; [Место защиты: Нижегор. гос. ун-т им. Н.И. Лобачевского]. - Нижний Новгород, 2015. - 330 с.
91. Огорелков И.В. Исследование лингвистических характеристик письменного текста политического дискурса с целью определения пола автора. // Язык. Право. Общество: сб. ст. V Междунар. науч.-практ. конф. Пенза : ПГУ, 2018. С. 88-91.
92. Остин Дж. Слово как действие. Перевод с англ. Макеевой Л.Б., Руднева В. П. — М.: Идея-Пресс, Дом интеллектуальной книги, 1999. - 332 с.
93. От Нестора до Фонвизина. Новые методы определения авторства / Л. В. Милов, Л. И. Бородкин, Т. И. Иванова и др. - М.: Прогресс, 1994. - 443 с.
94. Падучева Е.В. О семантике синтаксиса. М.: Наука, 1974.
95. Павловская Н.Ю. Моделирование языковых категорий в свете когнитивно ориентированной парадигмы научного знания. // Модели в современной науке: единство и многообразие: сб. науч.тр. / под ред. С.С. Ваулиной, В.И. Грешных. - Калининград: Изд-во РГУ им. И.Канта, 2010 - 472 с. С. 73 - 80.
96. Плунгян В.А. Почему современная лингвистика должна быть лингвистикой корпусов. Лекция. Дата публикации: 23.10. 2009. - URL: http: //polit.ru/article/2009/10/23/corpus/.
97. Поликарпов А.А., Поддубный В.В., Кукушкина О.В., Кубарев А.И., Варламов А.А., Суровцева Е.В., Пирятинская Е.Ф. Комплексная тексто-аналитическая система «СтилеАнализатор-2», основанная на Web-технологиях: разработка, наполнение данными и тестирование на прикладных задачах. М., 2013. 66 с.
98. Радбиль Т. Б., Маркина М. В. Вероятностно-статистические модели в производстве автороведческой экспертизы русскоязычных текстов/ Т. Б. Радбиль, М. В. Маркина // Политическая лингвистика. 2019. № 2 (74). С. 156-166.
99. Ревзин И. И. Современная структурная лингвистика: Проблемы и методы / И.И. Ревзин ; АН СССР, Ин-т славяноведения и балканистики. -Москва : Наука, 1977. - 263 с.
100. Резанова З.И., Романов А.С., Мещеряков Р.В. Задачи авторской атрибуции текста в аспекте гендерной принадлежности (к проблеме междисциплинарного взаимодействия лингвистики и информатики) // Вестник Томского государственного университета. 2013. № 370. С. 24-28.
101. Родионова Е.С. Лингвистические методы атрибуции и датировки литературных произведений : к проблеме «Корнель - Мольер»: автореферат дис. ... кандидата филологических наук : 10.02.21 / Родионова Елена Сергеевна; [Место защиты: Рос. гос. пед. ун-т им. А.И. Герцена]. - Санкт-Петербург, 2008. - URL: http://epir.ru/pragmatl/proiects/corneille/files/autoreferat.pdf (дата обращения: 12.01.2018 г.).
102. Родионова Е.С. Методы атрибуции художественных текстов // Структурная и прикладная лингвистика. Вып. 7: Межвуз. сб. / Под ред. А.С. Герда. - СПб.: Изд-во С.-Петерб. Ун-та, 2008. С. 118-127.
103. Романов А. С. Методика и программный комплекс для идентификации автора неизвестного текста : автореферат дис. ... кандидата технических наук : 05.13.18 / Романов Александр Сергеевич; [Место защиты: Том. гос. ун-т систем упр. и радиоэлектроники (ТУСУР) РАН]. - Томск, 2010. - 26 с.
104. Романова Т.В. Человек и время: Язык. Дискурс. Языковая личность. Н. Новгород: Нижегородский государственный лингвистический ун-т им. Н.А. Добролюбова, 2011.
105. Романова Т. В. Методы выявления классификаторов толерантности/нетолерантности речевого поведения в целях решения лингвоэкспертных задач // Политическая лингвистика. 2016. № 6(60). С. 237243.
106. Романова Т. В. Моделирование как метод верификации в когнитивной лингвистике // Когнитивные исследования языка Вып. XVI: Языковое сознание и когнитивное моделирование. Издательский дом ТГУ им. Г.Р. Державина, 2014. С. 322-327.
107. Романова Т. В. Моделирование языкового сознания на основе данных когнитивного эксперимента // В кн.: Нелинейная динамика в когнитивных исследованиях - 2015. Труды IV всероссийской конференции. Н. Новгород: ИПФ РАН, 2015. С. 198-201.
108. Романова Т. В. Социо- и психолингвистические основания для типологической характеристики русской языковой личности // В кн.: Социальные варианты языка - VI: Материалы международной научной конференции 16-17 апреля 2009 года. Нижний Новгород / Отв. ред.: М. Грачёв. Н. Новгород: Нижегородский государственный лингвистический университет им. Н.А. Добролюбова, 2009. С. 23-29.
109. Романова Т. В. Социолингвистические, корпусные, компьютерные инструменты исследования лингвокультурного феноменаТОЛЕРАНТНОСТИ // Когнитивные исследования в гуманитарных науках: материалы Всероссийской научной конференции с международным участием. Вып. XXXIII. Принт-Сервис, 2018. С. 550-554.
110. Романова Т. В. Структуры и модели в когнитивной лингвистике. // Когнитивные исследования языка: Международный конгресс по когнитивной лингвистике 10-12 октября 2012 года: сборник материалов / Отв. ред.: Н. Болдырев. Вып. 11. М., Тамбов : Институт языкознания РАН; Издательский дом ТГУ им. Г.Р. Державина, 2012. С. 183-186.
111. Романова Т. В. Языковое сознание молодого россиянина эпохи глобализации и методы его исследования // Когнитивная лингвистика: новые парадигмы и новые решения: сборник статей Вып. 15. М. : ИЯ РАН, 2011. С. 177-183.
112. Романова Т. В., Хоменко А. Ю. Функционирование элементов
семантического поля социальная значимость в русском и английском языках
242
по данным словарных и корпусных источников // Вестник Санкт-Петербургского университета. Язык и литература. 2020. Т. 17. № 1. С. 49-73.
113. Романова Т.В., Хоменко А.Ю. Лингвистическое моделирование как инструмент атрибуции текста. // Сборник материалов: Международная научная конференция «Русский язык в современном научном и образовательном пространстве», посвященной 90-летию профессора Серафимы Алексеевны Хаврониной: сб. ст. Междунар. науч. конф. Москва, РУДН, 28-29 октября 2020 г. / под общ. ред. В. М. Шаклеина. М.: РУДН, 2020. С. 250-252.
114. Романов А. С. Программная система для идентификации автора письменной речи «Авторовед» // Хроники объединенного фонда электронных ресурсов «Наука и образование». 2009. № 7. С. 7.
115. Романов А. С., Мещеряков Р. В. Идентификация автора текста с помощью аппарата опорных векторов // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог 2009» (Бекасово, 27-31 мая 2009 г.). М.: РГГУ, 2009. Вып. 8 (15). С. 432-437.
116. Россинская Е. Р., Галяшина Е. И. Настольная книга судьи: судебная экспертиза. — Москва : Проспект, 2010. — 464 с.
117. Рубцова И.И., Ермолаева Е.И., Безрукова А.И. и др. Комплексная методика производства автороведческих экспертиз: Методические рекомендации. - М:ЭКУ МВД России, 2007. — 192 с.
118. Русская грамматика: научные труды: в 2 т. URL: http://rusgram.narod.ru/index.html (дата обращения: 12.01.2021 г.).
119. Сааков Т.А. К вопросу о понятии демографических характеристик автора в судебной автороведческой экспертизе. // Язык. Право. Общество: сб. ст. V Междунар. науч.-практ. конф. Пенза : ПГУ, 2018. С. 99-102.
120. Седов К.Ф. Становление структуры устного дискурса как выражение эволюции языковой личности: дис. ... д-ра филол. наук. Саратов, 1999.
121. Севбо И. П. Графическое представление синтаксических структур и стилистическая диагностика / И. П. Севбо. - Киев : Наукова думка, 1981. -192 с.
122. Сидоров Ю.В., Леонтьев А.А., Рогов А.А., Захаров В.Н. Компьютерная автоматизированная система для лингвистического разбора литературных текстов. // Четвертая Санкт-Петербургская Ассамблея молодых ученых и специалистов. Тезисы докладов. СПб., 1999. С. 66.
123. Степаненко А.А. Гендерная атрибуция текстов компьютерной коммуникации: статистический анализ использования местоимений. // Вестник Томского государственного университета. 2017. № 415. С. 17-25. 001: 10.17223/15617793/415/3.
124. Структурная и прикладная лингвистика. Вып. 11: межвуз. сб. / под ред. А. С. Герда и И. С. Николаева. — СПб.: Изд-во С.-Петерб. ун-та, 2015. — 304 с.
125. Суровцова Т. Г., Чистяков С. П. О построении статистических критериев для атрибуции авторства литературных текстов // Вестник санкт-петербургского университета. 2009. Сер. 10. №. 3. С. 137 - 142.
126. Сухих С. А. Личность в коммуникативном процессе. Краснодар: ЮИМ, 2004. — 156 с.
127. Тамбовцев Ю. А. Фонотипологическая близость лингвистических объектов по критерию «хи-квадрат» // Вестник НГУ. Серия: Информационные технологии. 2010. Том 8, выпуск 3. С.46 - 54.
128. Тарнопольская И. О. Диграммная энтропия текста и атрибуция анонимных текстов: результаты тестирования методики / И. О. Тарнопольская // Информационный бюллетень ассоциации «История и компьютер» / отв. ред. Л. И. Бородкин. - М., 1998. - № 23. С. 65—68.
129. Тулдава Ю. А. Проблемы и методы квантитативно-системного исследования лексики / Юхан Тулдава; Тарт. гос. ун-т. - Тарту : ТГУ, 1987. -203 с.
130. Федотова М. А. К вопросу о разграничении понятий идиостиль и идиолект языковой личности // Записки романо-германской филологии,2013. №1. С.220-226.
131. Фоменко В. П., Фоменко Т. Г. Авторский инвариант русских литературных текстов // Новая хронология Греции: Античность в Средневековье. М.: МГУ, 1995. - URL: http://lib.ru/FOMENKOAT/greece.txt#40 (дата обращения: 10.01.2018).
132. Фукунага К. Введение в статистическую теорию распознавания образов. - М. Наука, 1979 - 368 с.
133. Хетсо Г. Принадлежность Достоевскому : к вопросу об атрибуции Ф. М. Достоевскому анонимных статей в журналах «Время» и «Эпоха» / Г. Хетсо. - Oslo: Solum Forlag A.S , 1986. - 82 c.
134. Хетсо Г., Густавссон С., Бекман Б., Гил С. Кто написал «Тихий Дон»?: (Проблема авторства «Тихого Дона») / Пер. А. В. Ващенко, Н. С. Ноздриной. — М.: Книга, 1989. — 186 с. - URL: http://feb-web.ru/feb/sholokh/default.asp?/feb/sholokh/critics/h89/h89.html (дата обращения: 10.01.2018).
135. Хлупина М.А., Особенности языковой личности С.Д. Довлатова.
— Москва, 2014. - 255 с.
136. Хмелев Д. В. Лингвоанализатор. Электронный ресурс. - М., 2002.
- URL: http: //www.rusf.ru/books/analysis/ (дата обращения: 16.11.2017 г.).
137. Хоменко А. Ю. Анализ языковой личности автора текста с применением методов математической статистики как способ установления авторства текста. Проблемы языковой картины мира в синхронии и диахронии. Проблемы языковой картины мира в синхронии и диахронии. Сборник статей по материал Всероссийской научной конференции молодых учёных Вып. 12. Н. Новгород : Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Нижегородский государственный педагогический университет имени Козьмы Минина", 2014. С. 293-297.
138. Хоменко А. Ю. Апробация методов математической статистики при атрибуции текста в рамках судебного автороведения // В кн.: Язык. Право. Общество: сб.ст.Всерос.науч.-практ.конф. Пенза : Издательство ПГУ, 2013. Гл. 52. С. 356-369.
139. Хоменко А. Ю. Атрибуция текстов малого объёма. Статистические закономерности. Язык. Право. Общество: сб. ст. V Междунар. науч.-практ. конф. Пенза : ПГУ, 2018. С. 123-127.
140. Хоменко А. Ю. Возможность идентификации лица по разнородному материалу - устной и письменной речи - в условиях одной экспертной задачи. Лингвополитическая персонология: дискурсивный поворот : материалы Междунар. науч. конф. (Екатеринбург, 29—30 нояб. 2019 г.), 2019. С. 214-218.
141. Хоменко А. Ю. К вопросу об исследовании письменного речевого произведения в рамках автороведческой экспертизы на предмет его оригинальности // Политическая лингвистика. 2014. № 4. С. 306-312.
142. Хоменко А. Ю. Лингвистическая атрибуционная экспертиза в отечественной и зарубежной школах. Перспективы развития автороведческих методик в России. Международная научная конференция «Современная теоретическая лингвистика и проблемы судебной экспертизы». М. : Государственный институт русского языка им. А.С. Пушкина, 2019. С. 536-550.
143. Хоменко А. Ю. Лингвистическое атрибуционное исследование коротких письменных текстов: качественные и количественные методы // Политическая лингвистика. 2019. № 2 (74). С. 177-187.
144. Хоменко А. Ю. Лингвистическое моделирование как инструмент выявления искажений речевых навыков автора письменного речевого произведения. Опыт практического исследования // Вопросы психолингвистики. 2018. № 2 (36). С. 209-226.
145. Хоменко А. Ю. Моделирование когнитивных структур на основе методик автороведческого анализа. Когнитивные исследования языка. Вып.
246
XXXVII: Интегративные процессы в когнитивной лингвистике: материалы международного конгресса по когнитивной лингвистике / Отв. ред.: Т. В. Романова. Т. XXXVII: Интегративные процессы в когнитивной лингвистике: материалы международного конгресса по когнитивной лингвистике. Деком,
2019. С. 1069-1074.
146. Хоменко А. Ю., Корсаков К. Судебный PR в России: понятие и его суть, явление и его социально-государственная значимость // Вестник Воронежского государственного университета. Серия: Право. 2019. № 4 . С. 284-300.
147. Хоменко А. Ю., Романова Т. В. Алгоритм автоматической атрибуции письменного текста в лингвокриминалистик. Современные проблемы в области экономики, менеджмента, бизнес-информатики, юриспруденции и социально-гуманитарных наук: материалы XII-ой научно-практической конференции студентов и преподавателей НФ НИУ ВШЭ / Сост.: Е. А. Асланян. Н. Новгород : Национальный исследовательский университет Высшая школа экономики в Нижнем Новгороде, 2014. С. 220-223.
148. Хоменко А.Ю. Алгоритм для автоматической идентификации автора письменного речевого произведения в судебном автороведении. // Юрислингвистика. Барнаул: Из-во Алтайского государственного университета. 2014. №. 3 (14). С. 83-93.
149. Хоменко А.Ю. Компьютерные методы анализа для определения гендерной принадлежности текста. Опыт практического исследования. Когнитивные исследования языка. Вып. XXXVIII: Когнитивно-дискурсивная парадигма в лингвистике и смежных науках: современные проблемы и методология исследования: материала X Конгресса по когнитивной лингвистике 17-20 сентября 2020 г./ Отв. ред. вып.: А.П.Чудинов: Екатеринбург: Уральский государственный педагогический университет,
2020. С. 892-896. - URL: https://uspu.ru/upload/medialibrarv/42a/42ae59185a3e07d02e4b39be5ac98f5b.pdf
150. Хоменко А.Ю. Моделирование идиолекта лица с помощью компьютерных инструментов в рамках судебной лингвистики. // Язык. Право. Общество: сб. ст. VI Междунар. науч.-практ. конф. Пенза : ПГУ, 2020. С. 123127.
151. Хоменко А.Ю. Моделирование языковой личности автора письменного текста с помощью методов текстомайнинга и модельной лингвистики. // Сб. ст. XLIX Международная научная филологическая конференция, посвященная памяти Людмилы Алексеевны Вербицкой (19362019). СПб: б.и., 2021. С. 123-127.
152. Хоменко А.Ю., Зиновьев Д.Е., Цыганов А.А. и др. Многообъектные исследования в судебной фоноскопической экспертизе. Язык. Право. Общество: сб. ст. II Междунар. науч.-практ. Конф. Пенза: Издательство ПГУ, 2014. С. 404-417.
153. Хоменко, А. Ю. Автоматическая обработка текста и лингвистическое моделирование как способы решения проблем атрибуционной лингвистики / А. Ю. Хоменко, Е. Р. Бенькович, Д. И. Гайнутдинова, Л. Р. Гасанова, А. А. Костина, З. О. Мазунина, А. С. Николаева, Е. В. Пимонова // Политическая лингвистика. 2020. № 3 (81). С. 215-224. Б01 10.26170/р120-03-22.
154. Цена слова: из практики лингвистических экспертиз текстов СМИ в судебных процессах по защите чести, достоинства и деловой репутации / Гильдия лингвистов-экспертов по док. и информ. спорам, Фонд защиты гласности ; [авт.-сост. А. Н. Баранов и др.]. - 3-е изд., испр. и доп. - Москва : Галерия, 2002. - 423 с.
155. Чупров А. А. Теория статистики. - М., 1910- 443 с.
156. Шевелёв О. Г. Методы автоматической классификации текстов на естественном языке: Учеб. пособие. - Томск: ТМЛ-Пресс, 2007. 144 с.
157. Шмелев Д.Н. Русский язык в его функциональных разновидностях. - М., 1977. - 166 с.
158. Штофф В.А. Моделирование и философия / В.А. Штофф. - М.; Л.: Наука, 1966. - 304 с.
159. Якобсон P.O. Изучение «Слова о полку Игореве» в Соединенных Штатах Америки, 2 изд. в кн.: Jakobson, Roman, Selected Writings, vol. IV, Slavic Epic Studies, The Hague - Paris, 1958 г., 1966., с. 499-517.
160. Якубайтис Т. А. Скляревич А. Н. Корреляционные характеристики частей речи в связных текстах / Т. А. Якубайтис, А. Н. Скляревич. - Рига: Зинатне, 1980. - 135 с.
161. Якубайтис Т. А. Вероятностная атрибуция типа текста по нескольким морфологическим признакам / Т. А. Якубайтис, А. Н. Скляревич. - Рига : ИЭВТ, 1982. - 53 с.
162. Якубинский Л.П. О языке «Слова о полку Игореве» // Доклады и сообщения Института русского языка АН СССР. - М., 1948 г. №2. С. 69-79.
163. Angouri J. Quantitative, Qualitative or Both? Combining Research Methods in Linguistic Research // Research methods in linguistics, 2010. №29. Pp. 31-34.
164. Argamon Sh., Koppel M., Pennebaker J. W., Schler J. Automatically Profiling the Author of an Anonymous Text // Communications of the ACM -Inspiring Women in Computing, 2009 .Vol. 52 Issue 2. Pp. 119-123.
165. Argamon-Engelson Sh., Koppel M., Avneri G. Style-based Text Categorization: What Newspaper Am I Reading? // Proc. of AAAI Workshop on Learning for Text Categorization, 1998. Pp. 1-4.
166. Baayen H., van Halteren H., Tweedie F. Outside the cave of shadows: using syntactic annotation to enhance authorship attribution // Literary and Linguistic Computing, 1996. Vol. 11, Issue 3. Pp. 121-132, https://doi.org/10.1093/llc/1L3.121.
167. Bacciu A., Morgia M. La, Mei A., Nemmi E. N., Neri V., Stefa J. CrossDomain Authorship Attribution Combining Instance-Based and Profile-Based Features // Notebook for PAN at CLEF 2019, 2019. - URL: http://ceur-ws.org/Vol2380/paper_220.pdf (дата обращения: 05.07.2020 г.).
249
168. Badryzlova Y. Exploring Semantic Concreteness and Abstractness for Metaphor Identification and Beyond // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 17 июня - 20 июня 2020 г.). М.: Изд-во РГГУ, 2020. P. 33-47.
169. Bloch, B. A set of postulates for phonemic analysis // Language, №24(1), 1948. Pp. 3-46.
170. Bloomfield, L. A set of postulates for the science of language // Language, 1926. №2 (3). Pp. 153-164. - URL: https://pure.mpg.de/rest/items/item_2282987_2/component/file_2282986/content doi: 10.2307/408741 (дата обращения: 05.07.2018 г.).
171. Borisov L. A., Orlov Y. N., Osminin K. P. Authorship attribution by the distribution of letter combination frequencies // Keldysh Institute Preprints. -(Preprinty IPM im. M. V. Keldysha), 2013. Vol. 27. Pp. 3-26.
172. Burrows, J.F. 'Delta': A measure of stylistic difference and a guide to likely authorship. Literary and Linguistic Computing, 17(3). 2002. 267-287.
173. Campbell L. The Sophisties and Polilicus of Plato / L. Campbell. -Oxford : Clarendon, 1867. - 170 p.
174. Coulthard, M. Author identification, idiolect, and linguistic uniqueness // Applied Linguistics, 2004. №24(4). Pp. 431-447.
175. Custodio J. E., Paraboni I. EACH-USP Ensemble Cross-domain Authorship Attribution // Notebook for PAN at CLEF 2018, 2018. - URL: http://ceur-ws. org/Vol-2125/paper_76.pdf (дата обращения: 05.07.2020 г.).
176. De Vel O., Anderson A., Corney M. and Mohay G. Mining Email Content for Author Identification Forensics // ACM SIGMOD Record, 2001. №30(4). Pp.55-64.
177. Eder M., Rybicki J., Kestemont M. // The R Journal, 2016. Vol. 8/1. Pp. 107 - 121.
178. Elliot W., Valenza R. J. And then there were none: Winnowing the Shakespeare claimants // Computers and the Humanities, 1996. Vol. 30. Pp. 191 -245.
179. Elliot W., Valenza R. J. The professor doth protest too much, methinks // Computers and the Humanities, 1998. Vol. 32. Pp. 425-490.
180. Elliot W., Valenza R. J., So many hardballs so few over the plate // Computers and the Humanities, 2002. Vol. 36. Pp. 455-460.
181. Foster D., An Elegy by W.S.: A Study in Attribution. - Newark: University of Delaware Press, 1989. - 318 p.
182. Foster D., Author Unknown: On the Trail of Anonymous. - New York: Henry Holt and Company, 2000. - 320 p.
183. Friginal E., Hardy J. Corpus-Based Sociolinguistics: A Guide for Students. London: Taylor & Francis. 2014. - 167 p.
184. Fucks W. On the mathematical analysis of style // Biometrika, 1952. Vol. 39. Pp. 122-129.
185. Gomzin, A., Laguta, A., Stroev, V., Turdakov, D. Detection of author's educational level and age based on comments analysis // Paper presented at Dialogue 2018, Moscow, 30 May-2 June 2018. - URL: http://www.dialog-21.ru/media/4279/gomzin_turdakov.pdf (2018) (дата обращения: 05.07.2020 г.).
186. Hidalgo, J. M. G., Diaz, A. A. C. Combining Predation Heuristics and Chat-Like Features in Sexual Predator Identification // Notebook for PAN at CLEF, Rome, Italy, September 17-20, 2012. - URL: http://pan.webis.de/clef12/pan12-web/index.html (дата обращения: 05.07.2019 г.).
187. Hoey M. Lexical Priming: A New Theory of Words and Language. London: Routledge, 2005. - 220 p.
188. Holmes D. I. Authorship attribution // Computers and the Humanities, 1994. Vol. 28, №. 2. Pp. 87-106.
189. Holmes D. I. The evolution of stylometry in humanities computing // Literary and Linguistic Computing, 1998. Vol. 13, №. 3. Pp. 111-117.
190. Holmes D., Forsyth R. The Federalist Revisited: New Directions in Authorship Attribution // Literary and Linguistic Computing, 1995. Vol.10, Issue 2, Pp. 111-127, https://doi.org/10.1093/llc/10.2.111 (дата обращения: 05.07.2019
г.).
191. Jakobson R. The Archetype of the First Edition of the Igor' Tale // Harvard Library Bulletin, 1952. Vol. IV, № 1. Pp. 5-14.
192. Jakobson R. The Puzzles of the Igor' Tale on the 150th Anniversary of its First Edition, 2. ed. // Jakobson, Roman, Selected Writings, vol. IV, Slavic Epic Studies, The Hague -Paris, 1952. Pp. 380-410.
193. Jule G. U. The Statistical study of Literary Vocabulary. Camdridge: University press, 1944. - 306 p.
194. Juola P. Authorship Attribution // Foundations and Trends in Information Retrieval, 2006. Vol. 1, No. 3. Pp. 233-334.
195. Juola P., J. Sofko., P. Brennan. A Prototype for Authorship Attribution Studies // Literary and Linguistic Computing, 2006. Vol. 21, Issue 2. Pp. 169-178.
196. Khomenko A., Baranova Yu., Romanov A., Zadvornov K. Linguistic Modeling as a Basis for Creating Authorship Attribution Software. Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference "Dialogue 2021" Moscow, June 16-19, 2021, URL: http: //www.dialog-21.ru/media/5315/khomenkoaplusetal048.pdf (дата обращения: 23.06.2021).
197. Kjell B. Authorship Determination using Letter Pair Frequency Features with Neural Network Classifiers // Literary and Linguistic Computing, 1994. №9(2). Pp. 119-124.
198. Klimt B., Yiming Ya. The Enron Corpus: A New Dataset for Email Classification Research // CiteSeerX 10.1.1.61.1645, 2004. Pp: 217-226.
199. Koppel M., Schler J. Exploiting Stylistic Idiosyncrasies for Authorship Attribution // Proceedings of IJCAI'03 Workshop on Computational Approaches to Style Analysis and Synthesis, 69, 2003. Pp. 72-80.
200. Korobov M.: Morphological analyzer and generator for Russian and Ukrainian languages / Khachay, M.Y., Konstantinova, N., Panchenko, A., Ignatov,
252
D.I., Labunets, V.G. (eds.) // AIST 2015. CCIS, vol. 542, 2015. Pp. 320-332. - URL: https://doi.org/10.1007/978-3-319-26123-2_31 (дата обращения: 05.07.2020 г.).
201. Kruh L. The Beale cipher as a bamboozlement: Part II // Cryptologia, 1988. Vol. 12, no. 4. Pp. 241-246.
202. Labbe C., Labbe D. Inter-Textual Distance and Authorship Attribution. Corneille and Molière // Journal of Quantitative Linguistics, 2001. №8 (3). Pp.213231.
203. Langacker, R.W. The Contextual Basis of Cognitive Semantics / R.W. Langacker // Language and Conceptualization / ed. by J. Nuyts, E. Pederson. -Cambridge: Cambridge University Press, 1997. Pp. 229-252.
204. Leonard R. A. Forensic Linguistics, in Handbook of behavioral criminology: contemporary strategies and issues (Vincent B. Van Hasselt & M. L. Bourke eds), 2017. - URL: https://www.researchgate.net/publication/324314663 Forensic Linguistics Applyi ng the Science of Linguistics to Issues of the Law (дата обращения: 05.07.2019 г.).
205. Leonard, R.A., Ford, J.E., Christensen,T.K. Forensic linguistics: Applying the science of linguistics to issues of the law // Hofstra L. Rev., 2017, 45. Pp. 881-897.
206. Litvinova T. A., Sboev A. G., Panicheva P. V. (2018), Profiling the Age of Russian Bloggers // Proceedings of the 7th International Conference, AINL 2018, St. Petersburg, 2018. Pp. 167-177.
207. Litvinova T., Rangel F., Rosso P., Seredin P., Litvinova O. Overview of the RusProfiling // PAN at FIRE Track on Cross-genre Gender Identification in Russian, Working notes of FIRE 2017 — Forum for Information Retrieval Evaluation, Bangalore, India, 8th — 10th December, 2017. Vol-2036. Pp. 1-7. -URL: http://ceur-ws.org/Vol-2036/T1-1.pdf (дата обращения: 05.07.2019 г.).
208. López-Escobedo F., Méndez-Cruz C-F., Sierra G., Solórzano-Soto J. Analysis of Stylometric Variables in Long and Short Texts // Procedia - Social and Behavioral Sciences 95, 2013. Pp. 604 - 611.
253
209. Love H. Attributing Authorship: An Introduction. Cambridge: Cambridge University Press, 2002. - 271 p.
210. Lutoslawski W. The origin and growth of Plato's logic. London. Longmans, Green and Co.1897.
211. Mann R. A note on the Text of the Igor Tale // Slavic Review, 1980. Vol. 39, № 2. Pp. 281-285.
212. Matthews R. Neural Computation in Stylometry II: An Application to the Works of Shakespeare and Marlowe // Literary and Linguistic Computing, 1994. №9(1). Pp. 1-6.
213. McColly W. B., Weier, D. Literary Attribution and Likelihood Ratio Tests —the Case of the Middle English Pearl-poems // Computers and the Humanities, 1983. № 17. Pp. 65-75.
214. McMenamin G.R. Forensic Linguistics: advances in forensic stylistics. / G.R. McMenamin. 2002. - 331 p.
215. Mendenhall T. The characteristic curves of composition // Science, , 1887. №9. Pp. 237-249.
216. Merriam T. An Application of Authorship Attribution by Intertextual Distance in English / T. Merriam // Corpus, 2003. №2. Pp. 142-168.
217. Merriam T. An Experiment with the Federalist Papers // Computers and the Humanities, 1989. №23. Pp. 251-254.
218. Mosteller F., Wallace D. L. Applied Bayesian and Classical Inference: The Case of the Federalist Papers. New York: Springer, 1984. - 303 p.
219. Murauer B., Tschuggnall M., Specht G. Dynamic Parameter Search for Cross-Domain Authorship Attribution // Notebook for PAN at CLEF 2018, 2018. -URL: http://ceur-ws.org/Vol-2125/paper_84.pdf (дата обращения: 05.07.2020 г.).
220. Muttenthaler L., Lucas G., Amann J. Authorship Attribution in Fan-Fictional Texts given variable length Character and Word N-Grams // Notebook for PAN at CLEF 2019, 2019. - URL: http://ceur-ws.org/Vol-2380/paper_49.pdf (дата обращения: 05.07.2020 г.).
221. Panicheva, P., Mirzagitova, A., Ledovaya, Y.: Semantic feature aggregation for gender identification in Russian Facebook. // Filchenkov, A., Pivovarova, L., Zizka, J. (eds.) AINL 2017. CCIS, 2018. Vol. 789. Pp. 3-15. - URL: https://doi.org/10.1007/978-3-319-71746-3_1 (дата обращения: 05.07.2020 г.).
222. Pimonova E., Durandin O., Malafeev A. Doc2vec or better interpretability? А method study for authorship attribution // Paper presented at Dialogue 2020, Moscow, June 15-20, 2020, 2020. . - URL: http://www.dialog-21.ru/media/4955/pimonovaeplusetal-132.pdf (дата обращения: 05.08.2020 г.).
223. Reed D. W. A Statistical Approach to Quantitative Linguistic Analysis // Word, 1949. N 5. Pp. 235-247.
224. Romanov A., Kurtukova A., Fedotova A., Shelupanov A., Goncharov V. Authorship Identification of a Russian-Language Text Using Support Vector Machine and Deep Neural Networks // Future Internet. - 2021. - Volume 13. - Issue 1. - 3. - 16 p.
225. Romanov A.S., Sobolev A.A., Kurtukova A.V, Fedotova A.M., Shelupanov A.A. Determining the Age of the Author of the Text Based on Deep Neural Network Models // Information. - 2020. -Volume 11. - Issue 12. - 589. -12 p.
226. Ross A. S. Philological probability problems // Journal of the Royal Statistical Society, 1950. Ser. B12. Pp. 19-50.
227. Ruseti S., Rebedea T.. Authorship Identification Using a Reduced Set of Linguistic Features // Notebook for PAN at CLEF 2012, 2012. - URL: http://www.uni-weimar.de/ (дата обращения: 05.08.2018 г.).
228. Sapkota U. S. Sub-Profiling by Linguistic Dimensions to Solve the Authorship Attribution Task // Notebook for PAN at CLEF 2012, 2012. URL: http://www.uni-weimar.de/ (дата обращения: 05.08.2018 г.).
229. Shetty J., Adibi J. (2005) Discovering important nodes through graph entropy the case of Enron email database // Proceedings of the 3rd international workshop on Link discovery - LinkKDD, 2005. Pp. 74-81. doi: 10.1145/1134271.1134282.
230. Shuy R. W. Creating language crimes: How law enforcement uses (and misuses) language. New York: Oxford University Press, 2005. - 194 p.
231. Somers H. Statistical methods in literary analysis // The Computer and Literary Style, (J. Leed, ed.), Kent, OH: Kent State University Press, 1972.
232. Stamatatos E. A survey of modern authorship attribution methods // Journal of the American Society for Information Science and Technology, 2009. Vol. 60 Issue 3. Pp.538-556.
233. Stamatatos E. Authorship attribution using text distortion // Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics, 2017. Voto 1, Long Papers. Pp. 1138-1149.
234. Stamatatos E. On the robustness of authorship attribution based on character n-gram features // Journal of Law and Policy, 2013. № 21(2). Pp. 421439.
235. Ule L. Recent progress in computer methods of authorship determination // Association for Literary and Linguistic Computing Bulletin, 1982. Vol. 10. Pp. 73-89.
236. Vickers B. Counterfeiting' Shakespeare : evidence, authorship, a. John Ford's Funerall elegye / Brian Vickers. - Cambridge [etc.] : Cambridge univ. press, 2002. - 568 с.
237. Wray A. Formulaic Language and the Lexicon. Cambridge: Cambridge University Press, 2002.
238. Wright D. Using word n-grams to identify authors and idiolects: A corpus approach to a forensic linguistic problem // International Journal of Corpus Linguistics, 2017. № 22(2). Pp. 212-241. - URL: https://benjamins.com/#catalog/journals/ijcl.22.2.03wri/details (дата обращения: 05.08.2019 г.).
239. Zipf G. K. Human behavior and the principle of least eff ort. Addison-Wesley Press, 1949.
Словари и справочники
1. Большая советская энциклопедия : в 30 т. / гл. ред. А.М. Прохоров. - М. : Сов. энцикл., 1970-1981. - 30 т. - URL: https://gufo.me/dict/bse/ (дата обращения: 12.01.2018 г.)
2. Жеребило Т.В. Словарь лингвистических терминов. Изд. 5-е, испр. и доп. - Назрань: ООО «Пилигрим», 2010. - 486 с.
3. Кожина М.Н. Стилистический энциклопедический словарь русского языка / [Л.М. Алексеева и др.]; Под ред. М.Н. Кожиной. - М.; Наука : Флинта, 2003 (ГУП ИПК Ульян. Дом печати). - 694 — URL: https://stylistics.academic.ru (дата обращения: 10.01.2020).
4. Комлев Н.Г. Словарь иностранных слов. М.: Эксмо-Пресс, 2006. -URL: https://dic.academic.ru/dic.nsf/dic fwords/ (дата обращения: 17.03.2018 г.).
5. Лингвистический энциклопедический словарь / Гл. ред. В. Н. Ярцева. - 2-е изд., доп. - М. : Большая Рос. энцикл., 2002. - 709 с. : табл. -Указ.: с. 627-707. URL: https://les.academic.ru/ (дата обращения: 05.07.2020 г.).
6. Новый словарь методических терминов и понятий (теория и практика обучения языкам). М.: Издательство ИКАР. 2009. - 448 с. - URL: http: //l inguistics-
online.narod.ru/olderfiles/1/azimov e g shukin a n novyy slovar-21338.pdf (дата обращения: 12.01.2018).
7. Панов М.И. Эффективная коммуникация: история, теория, практика : слов.-справ. / [отв. ред. М. И. Панов]. - М. : Олимп, 2005 (ООО Агентство КРПА Олимп). - 959 с.
8. Популярная художественная энциклопедия. В 2-х томах. Гл. ред. Полевой В.М. / М.: Советская энциклопедия, 1986. - 447 с. - URL: https://rus-pictures-enc.slovaronline.com/ (дата обращения: 12.01.2018 г.)
9. Словарь иностранных слов : [более 4500 слов и выражений] / Н. Г. Комлев. - Москва : Эксмо, 2006. - URL: https://dic.academic.ru/ (дата обращения: 12.01.2018 г.)
10. Толковый словарь русского языка: 72500 слов и 7500 фразеологических выражений / С. И. Ожегов, Н. Ю. Шведова ; Российская АН,
257
Ин-т рус. яз., Российский фонд культуры. - 2-е изд., испр. и доп. - М.: Азъ, 1994. - 907 с. - URL: http://www.slovopedia.com/4/1927640227.html (дата обращения: 12.01.2018 г.).
11. Философский словарь / [Адо А. В. и др.]; Под ред. И. Т. Фролова. - 6-е изд., перераб. и доп. - М. : Политиздат, 1991. - 559 с.
12. Энциклопедия судебной экспертизы / [Авт.-сост.: Т. В. Аверьянова и др.]; Под ред. Т. В. Аверьяновой, Е. Р. Россинской. - М. : Юристъ, 1999. - 551 с.
13. Энциклопедический словарь по психологии и педагогике. 2013. -URL: http://psychology pedagogy.academic.ru/19183/ (дата обращения
10.10.2019).
Нормативные акты
1. Арбитражный процессуальный кодекс Российской Федерации от 24.07.2002 N 95-ФЗ. - URL: http://www.consultant.ru/document/cons doc LAW 37800/ (дата обращения:
03.05.2020).
2. Гражданский процессуальный кодекс Российской Федерации от 14.11.2002 N 138-ФЗ. - URL: http://www.consultant.ru/document/cons doc LAW 39570/ (дата обращения: 03.05.2020).
3. Кодекс Российской Федерации об административных правонарушениях от 30.12.2001 N 195-ФЗ. - URL: http://www.consultant.ru/document/cons doc LAW 34661/ (дата обращения: 03.05.2020).
4. Приказ от 27 декабря 2012 года N 237 «Об утверждении Перечня родов (видов) судебных экспертиз, выполняемых в федеральных бюджетных судебно-экспертных учреждениях Минюста России, и Перечня экспертных специальностей, по которым представляется право самостоятельного производства судебных экспертиз в федеральных бюджетных судебно-экспертных учреждениях Минюста России» (с изменениями на 13 сентября
258
2018 года). Официальный интернет-портал правовой информации. - URL: www.pravo.gov.ru (дата обращения: 03.05.2020).
5. Уголовно-процессуальный кодекс Российской Федерации от 18.12.2001 N 174-ФЗ. - URL: http://www.consultant.ru/document/cons doc LAW 34481/ (дата обращения: 03.05.2020).
6. Уголовный кодекс Российской Федерации от 13.06.1996 N 63-ФЗ. -URL: http://www.consultant.ru/document/cons doc LAW 10699/ (дата обращения: 03.05.2020).
7. Федеральный закон от 31 мая 2001 г. N 73-ФЗ «О государственной судебно-экспертной деятельности в Российской Федерации», Российская газета, N 256 от 31.12.2001. - URL: https://base.garant.ru/12123142/ (дата обращения: 03.05.2020).
Иточники
1) Тексты коротких сообщений из мессенджера, автор-женщина, обиходно-бытовой дискурс, всего около 37 000 слов, выборка 4 632 слов (Приложение 1);
2) Тексты коротких сообщений из мессенджера, автор-мужчина, обиходно-бытовой дискурс: всего 65 466 слов, выборка 9 318 слов (Приложение 3);
3) тексты сетевой газеты «The Village» (https://www.the-village.ru/); всего 600 текстов следующих авторов: Юлия Рузманова, Алена Дергачева, Ольга Карасева, Андрей Яковлев, Лёва Левченко, Кирилл Руков; всего 710 997 слово;
4) тексты развлекательного портала «ЯПлакалЪ» (https://www.yaplakal.com/); всего 424 текста следующих авторов: автор под псевдонимом KalinAKalina, автор под псевдонимом Изюбрина, автор под псевдонимом motya, автор под псевдонимом
SESHOK, автор под псевдонимом OBrian, автор под псевдонимом InGrib.
5) тексты ресурса сетевой литературы «Книга фанфиков» (https://ficbook.net/); всего 187 текстов следующих авторов: автор под псевдонимом Хана Вишнёвая, автор под псевдонимом Кицунэ Миято, автор под псевдонимом Ктая, автор под псевдонимом миха француз, автор под псевдонимом Аллесий, автор под псевдонимом Tigrewurmut, автор под псевдонимом Rakot; всего 7 200 847 слов.
6) тексты художественной литературы (нежанровая художественная проза), включающий тексты С.Д.Довлатова и В.П.Астафьева 10 текстов: С.Д.Довлатова «Наши», «Чемодан», «Иностранка», «Заповедник», «Зона: Записки надзирателя», «Встретились, поговорили»; В.П.Астафьева «Обертон», «Последний поклон», «Звездопад», «Так хочется жить».
5) тексты корпоративной русскоязычной переписки; всего 236 текстов; всего 11 680 слов. (Приложение 14).
Приложение 1.
Материал для исследования: короткие сообщения из мессенджера,
автор - женщина
№ Текст
+7 *** (к 1) Не гони. И перестань себя вести со мной как мальчик
меряющийся со мной ***ями.
Меряться ***ями с девушкой глупо.
Ой, да не ***ди. Ты полгода отстаиваешь честь то
страхолюдины, которой неповезло родиться с полностью
мужскими чертами лица, лишенеую абсолютно
феминности и вынужденеую быть дыркой, то дырки то
еще что то
Конечно, тебе интересно слушать нормальных.
Да. Это без вариантоа. Всем таким как ты интересно. И
тебе тоже. Вы же вчерашнее быдло.
Зато я теперь понимаю почему ты молчал, когда я тебе
жаловалась, что тетя давила на меня устроить жену брата к
себе, девушка типичная дырка, мне не хотелось ей
помогать. И я советовалась с Аленой как слиться от этой
просьбы и мы вдвоем стебали тетю.
Да? Просто эпизод- слить дырку. Пусть ***допарит
дальше.
Хоть будь объективен когда оскорбляешь. В твоем
ближнем круге слишком много людей, которые в
принципе не имеют того набора фуекций, что встроены в
меня.
Я у тебя на учебу вымогаю. и ко мне еще какие то могут
быть претензии.
Мне сейчас нужна помощь.
Смотри, этот курс дешевле почти вдвое, но тоже по делу.
То что ты сволочь и свинья!
Всегда так было свинья ты хамская.
А ты должен брать.
Шарпей долбаный.
Ты ничего не испрввил.
Еще и на долги меня подписал. Мне теперь тебе 85 рублей
возвращать раз тебе по***й
Почему ты меня сейчас не останавливаешь? Я же себе
врежу.
К моему др я подлой тварью стать не могла, такой
программы в моем генетическом коде нет. А ты был у
моему др вкруг виноват.
Так же как не было причины шутить над самым святым,
над моим абсолютом- мордашкой и телом.
Верни долги.
Всю недополученную зарплату что я мз за тебя потеряла.
Возмести весь ущерб и катись.
По твоей вине я потеряла 850 рублей.
Верни мне мою зп за каждый месяц
Верни тварь все что отнял.
Это было по твоей вине.
Исправь все что сделал и ради бога, вали, ***и макак расти
вы***ядков.
Верни долг и пусть твоя дырявая готовит мне пока я здесь
не смогу себе позволить пииходящую тетю.
Я не сдвинусь с места пока все не станет по моему.
Пока все не станет как ты обещал - вся любовь мне и
дырка моя обслуга.
Верни долг и вышли мне внучку дырки для развлечкний
+7 *** (К 2) Мне нужны деньги на учебу.
1. Мне нужны деньги учиться. 2. Самое срочное- мне
нужно ***нуть под глаза гиалуронку пампульно и где то 4
проуедуры плазмы с фракселем. 3. Потом мне нужно будет
на переезд, но это через месяц. 4. И мне нужно чтобы если
надо И была для меня доступна в удобный мне день и час.
Сделаешь - свободен хоть завтра.
Смог сделать то что сделал, помоги все исправить.
Ты должен полностью за все ответить.
Ты меня разрушил ты и должен полностью все исправить
быстро.
Уреж содержание жены на два три месяца. Этого хватит .
Андрей. Я не успокоюсь пока не получу всю
недополученную зарплату. Даже если у меня все будет
хорлшо, я все равно это не оставлю.
Если не вернешь сам, и не извинишься, то я просто начну
искать другие способы компенсации. И вполне возможно
что и правда доберусь до маленькой "сонешны".
Мне не важно какой ценой получить сатисфакцию.
В покое я тебя не оставлю. Ненавижу я тебя так люто, что
ты и представить себе ее можешь. И в Екб я запросто могу
припереться.
Я вариант никак не рассматриваю.
Второй вариант сонишна и внучки.
Смысл в ней? Она уже стара и ее время фестиваля ушло.
Никакой профессиональной ниши чтобы остаток жизни
фестивалить там она не нашла. Ей уже жить не надо.
А мне нужна компенсация.
Ты должен все исправить сейчас.
Иначе уж сонишну я точно найду.
Мне надо на учебу и клинику.
Ох я и покуражусь скоро. Трогаю твоих близких? Это я не
трогала.
Для разогрева я сначала заведу профиль на сайтах
индивидуалок в Екб от имени твоей дырки и оставлю ваши
контакты. Но это еще далеко не все, мразь ты подлая.
За***етесь отмываться.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.