Метод многофакторной идентификации морфологических признаков русского слова: на материале имени существительного по корпусу текстов тема диссертации и автореферата по ВАК РФ 10.02.21, кандидат наук Гашков, Александр Владимирович

  • Гашков, Александр Владимирович
  • кандидат науккандидат наук
  • 2012, Пермь
  • Специальность ВАК РФ10.02.21
  • Количество страниц 153
Гашков, Александр Владимирович. Метод многофакторной идентификации морфологических признаков русского слова: на материале имени существительного по корпусу текстов: дис. кандидат наук: 10.02.21 - Прикладная и математическая лингвистика. Пермь. 2012. 153 с.

Оглавление диссертации кандидат наук Гашков, Александр Владимирович

Содержание

Введение

ГЛАВА 1. Проблемы автоматизации морфологического анализа существительного русского языка

1.1. Принципы системно-комплексного подхода

1.2. Принципы алгоритмизации автоматического анализа естественного языка

1.2.1. Определение алгоритма

1.2.2. Подходы к алгоритмизации при автоматическом анализе естественного языка

1.3. Нечёткие множества

1.4. Морфологические признаки существительного как нечёткие множества с позиций системно-комплексного подхода

1.4.1. Грамматические категории имени существительного в русском языке

1.4.1.1. Категория рода

1.4.1.2. Категория числа

1.4.1.3. Категория падежа

1.4.1.4. Категория одушевленности

1.4.2. Представление морфологических свойств неизвестных существительных с помощью нечётких множеств

1.5. Лингвистический автомат

1.6. Проблемы автоматизации морфологического анализа

1.6.1. Лексическая омонимия и омонимия окончаний

1.6.2. Точность определения морфологических признаков неизвестных слов

1.6.3. Проблема ресурсоёмкости алгоритмов

1.6.4. Использование словарей в автоматическом морфологическом анализе: их роль и требования к ним

Выводы

ГЛАВА 2. Методы определения морфологических признаков слов

2.1. Обзор современных методов определения морфологических признаков слов

2.2. Методы морфологического анализа неизвестных слов

2.3. Решение задачи определения свойств неизвестных слов в существующих системах автоматического морфологического анализа

2.4. Выбор метода анализа отдельных слов

2.5. Алгоритм морфологического анализа методом аналогий и теоретическая оценка его точности

Выводы

ГЛАВА 3. Многофакторный алгоритм морфологического анализа и его экспериментальная проверка

3.1. Общий ход анализа

3.2. Формирование корпусов текстов, использованных в эксперименте

3.3. Оптимизация метода аналогий

3.4. Использующиеся структуры данных

3.5. Подалгоритм определения морфологических признаков отдельного слова

3.6. Подалгоритм парадигматического анализа словоформ неизвестной лексемы

3.7. Подалгоритм синтагматического анализа

3.8. Многофакторное определение морфологических свойств существительного по корпусу текстов

Выводы по главе 3

Заключение

Список литературы

Список иллюстративного материала

Рекомендованный список диссертаций по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК

Введение диссертации (часть автореферата) на тему «Метод многофакторной идентификации морфологических признаков русского слова: на материале имени существительного по корпусу текстов»

Введение

Настоящее диссертационное исследование выполнено на стыке лингвистики, информатики и математики, в рамках прикладной и компьютерной лингвистики, посвящено проблеме идентификации морфологических признаков русского существительного при автоматическом морфологическом анализе по корпусу текстов.

Проблема использования вычислительных машин в интеллектуальной деятельности человека является одной из важнейших научных и прикладных проблем в последние десятилетия. Вычислительная мощность и количество компьютеров непрерывно увеличивается, возрастает их роль при решении практически любых задач; в том числе таких сложных, ранее относимых исключительно к сфере компетенции человека, как обработка текстов на естественном языке. Такая обработка не представляется возможной без определения морфологических характеристик входящих в текст и составляющих его слов. Морфологический анализ входит в любой алгоритм обработки текста как основной или вспомогательный метод [Марчук, 2007; Мельчук, 1964; Сокирко, 2001; Beesley, Karttunen, 2003; Brinkmann, 1999; Helwig, 2002; Koskenniemi, 1983 и др.]. Одним из требований, выдвигаемых Ю.Н. Марчуком к современному алгоритму автоматического морфологического анализа, является то, что неизвестные слова (т.е. слова, отсутствующие в словаре автоматической системы) должны обрабатываться наряду с известными, а вероятность их правильного определения должна составлять не менее 90-95% [Марчук, 2007: 67-68]. Проблема автоматического анализа известных слов может считаться практически решённой [Марчук, 2007: 62], однако до сих пор нерешённой является проблема анализа неизвестных слов, поскольку существующие анализаторы не удовлетворяют вышеназванному критерию. Поэтому актуальной является разработка алгоритма

морфологического анализа неизвестных слов. Вместе с тем существует неустранимая проблема, порожденная непрерывным изменением языка, с одной стороны, и описательным характером морфологии, с другой. Поскольку остановить появление неологизмов и окказионализмов в языке невозможно, то при автоматическом анализе текста появляется проблема вписывания новых слов в кодифицированную систему языка. Исходя из вышесказанного, актуальность настоящего исследования обусловлена, с одной стороны, непрерывным появлением новых слов в языке, которые необходимо отражать в системах автоматической обработки текстов, с другой стороны -несовершенством современных систем автоматического анализа неизвестных слов.

Объектом исследования является имя существительное русского языка, представленное в корпусе текстов в виде употреблений его словоформ, а частеречная принадлежность слова и категориальные морфологические признаки существительного являются предметом исследования.

Гипотеза исследования заключается в том, что если разработать системно-комплексный метод определения морфологических признаков слова, то можно создать многофакторный алгоритм определения частеречной принадлежности слова и категориальных морфологических признаков существительного, удовлетворяющий современным требованиям к системам автоматического анализа текста.

Основной целью исследования является разработка системно-комплексного метода определения частеречной принадлежности слова и категориальных морфологических признаков существительного, а также создание на основе метода многофакторного алгоритма определения морфологических признаков существительных.

Исходя из гипотезы и основной цели были поставлены следующие конкретные задачи.

• Рассмотреть принципы системно-комплексного подхода и разработать системно-комплексный метод определения частеречной принадлежности и категориальных морфологических признаков слова.

• Создать алгоритм многофакторного определения частеречной принадлежности слова и категориальных морфологических признаков существительного.

• Исследовать факторы определения категориальных признаков имени существительного и выделить среди них значимые.

• Изучить случаи многозначности словоформ русского существительного и определить необходимый набор средств разрешения многозначности для каждого случая.

• Установить критерии для сравнения алгоритмов и разработать метод оценки качества работы автоматического морфологического анализатора на основании бинарной классификации.

• Исследовать существующие алгоритмы морфологического анализа слов и выбрать исходный подалгоритм для анализа неизвестных слов на основе сравнения современных публично доступных морфологических анализаторов русского языка.

• Для повышения качества определения частеречной принадлежности и определения морфологических признаков имени существительного создать подалгоритмы: 1) анализа графической формы, основанный на методе аналогий, 2) парадигматического анализа, 3) синтагматического анализа.

• Разработать способ согласования результатов работы разных подалгоритмов на основе вероятностного метода и нечётких множеств.

• На основе разработанного метода оценки точности морфологического анализа определить эффективность предложенного алгоритма. Научная новизна нашего исследования заключается в том, что:

1) впервые применён системно-комплексный подход к алгоритмизации анализа морфологических признаков неизвестных существительных русского языка;

2) выделены факторы определения частеречной принадлежности слова и категориальных морфологических признаков существительного: фактор графической формы, парадигматический, синтагматический и семантический факторы;

3) разработан и теоретически обоснован новый многофакторный алгоритм, отличающийся повышенным быстродействием и вероятностью распознавания морфологических признаков русского существительного более 95%;

4) впервые в прикладной лингвистике использовано сочетание вероятностного метода и нечётких множеств для описания многозначности при определении морфологических признаков;

5) разработана и апробирована (на материале русского языка) методика определения качества анализа на основе бинарной классификации;

6) предложен универсальный способ оценки теоретической точности метода аналогий по обратному словарю словоформ, применимый для синтетических языков.

Материалом для проверки работы разрабатываемого алгоритма

_ о

послужили 5 корпусов текстов делового, научного и художественного стилеи общим объемом 4 499 269 словоупотреблений. Под корпусом текстов, вслед за H.H. Белозёровой, В.П. Захаровым, В.А. Плунгяном, Т. McEnery, W. Wilson и другими, мы понимаем собрание размеченных текстов в электронном виде, предназначенное для решения различных лингвистических задач.

Теоретическая значимость исследования обусловлена тем, что в нем получил дальнейшее развитие системно-комплексный подход; работа вносит определённый вклад, во-первых, в компьютерную лингвистику, предлагая путь

решения вопроса, связанного с актуальной проблемой идентификации категориальных морфологических признаков неизвестных слов, во-вторых, в теорию алгоритмов благодаря методике определения качества морфологического анализа и универсальному способу оценки метода аналогий; успешный опыт применения теории нечётких множеств в сочетании с вероятностным методом может способствовать дальнейшему использованию данного метода в лингвистике.

Практическая значимость работы состоит в возможности применения разработанного алгоритма в различных лингвистических исследованиях по общему языкознанию, общей морфологии, теоретической грамматике русского языка и др., а также в практических разработках, направленных на совершенствование автоматической обработки текстов: системах морфологического анализа, информационно-поисковых системах, базах данных, корпусной лингвистике, а также в морфологических анализаторах в качестве блока анализа в системах машинного перевода. Кроме того, результаты исследования могут быть использованы в университетских курсах по общему языкознанию и прикладной лингвистике.

Теоретической базой исследования послужили труды отечественных и зарубежных ученых по общему языкознанию (Ю.Д. Апресян, О.С. Ахманова, В.Г. Адмони, И.А. Бодуэн де Куртене, Ю.С. Маслов, A.A. Реформатский, Ю.С. Степанов, JI.B. Щерба и др.), морфологии русского языка (В.В. Виноградов, A.A. Зализняк, JI.B. Калинина, A.A. Камынина, И.Г. Милославский, В.М. Никитевич, В.А. Плунгян, Н.Ю. Шведова), компьютерной лингвистике (А.Н. Баранов, Г.Г. Белоногов, JI.H. Беляева, Ю.Н. Марчук, И.А. Мельчук, Р.Г. Пиотровский, К. Beesley, Н. Brinkmann, Р. Helwig, L. Karttunen, К. Koskenniemi, S. Naumann, A. Woyna), лексикографии (JI.A. Жданова, Ю.Н. Караулов, X. Касарес, В.В. Морковкин, В.Д. Табанакова), корпусной лингвистике (H.H. Белозёрова, A.C. Герд, В.П. Захаров, Т. МсЕпегу,

A. Wilson), системно-комплексному подходу (A.M. Аматов, Л.И. Антропова,

B.А. Карпов, Н.Л. Мышкина, C.B. Шустова), различным аспектам математики (С.А. Айвазян, Н.Д. Андреев, И.З. Батыршин, Н.К. Верещагин, А.И. Кибзун, А. Кофман, Д. Кук, Г.Э. Яхъяева, D. Powers, С.Т. Shannon, L.A. Zadeh и др.) и теории алгоритмов (Ф.Л. Бауэр, Г. Гооз, Д. Кнут, А.Н. Колмогоров, Т.Х. Кормен).

В зависимости от поставленных задач используются следующие методы: метод анализа и наблюдения, экспериментальный метод, метод моделирования, метод алгоритмизации, метод дистрибутивного анализа, метод интерпретации, метод бинарной классификации, методы парадигматического и синтагматического анализа. Кроме того, применяются методы представления данных в виде нечётких множеств и вероятностный подход. Положения, выносимые на защиту.

• Неоднозначность естественного языка является основным препятствием в автоматическом анализе текстов, преодолению которого способствует системно-комплексный метод определения частеречной принадлежности слова и его категориальных морфологических признаков.

• Системно-комплексный метод базируется на принципах системно-комплексного подхода: целостности, иерархии, связности и неаддитивности, что обеспечивает высокую точность определения категориальных морфологических признаков слова.

• Для оценки работы алгоритмов анализа используется совокупность трёх параметров: схожесть, точность и полнота. Схожесть учитывает соотношение количества верно определённых словоформ, ложноположительных и ложноотрицательных результатов. Точность зависит от количества верно определённых словоформ и ложноположительных результатов, а полнота - от количества верно определённых словоформ и ложноотрицательных результатов.

• Математический подход обеспечивает формализацию лингвистических знаний, позволяя дать количественную оценку различных явлений. Теория нечётких множеств в сочетании с вероятностным методом предоставляет математический аппарат для согласования информации о неизвестном слове, полученной из разных источников.

• Многофакторный алгоритм определения частеречной принадлежности слова и категориальных морфологических признаков существительного, состоящий из трёх подалгоритмов, соответствует требованиям, предъявляемым к современным системам автоматического морфологического анализа.

• Универсальный способ оценки теоретической точности метода аналогий по обратному словарю словоформ позволяет количественно определить применимость метода аналогий для любого синтетического языка.

• Применение нечётких множеств позволяет сгладить противоречие между размытой, континуальной системой языка и детерминированным автоматическим анализом.

Апробация работы. Основные положения и результаты работы обсуждались на конференциях различного уровня: Всероссийской научно-практической конференции «Региональные проблемы информатизации образования» (Пермь, 1999), научно-практической конференции «Лингвистические чтения - 2008. Цикл 4» (Пермь, 2008), международной научно-практической конференции «Синергетическая лингвистика уз. лингвистическая синергетика» (Пермь, 2010), международной научной конференции «Корпусная лингвистика-2011» (Санкт-Петербург, 2011).

Структура и объём работы. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы и списка иллюстративного материала. В список литературы включены работы, цитируемые или упоминаемые нами.

Во введении обосновывается выбор темы, её актуальность, определяются объект и предмет исследования, формулируются цель, задачи, определяется методологическая и теоретическая база, выдвигается гипотеза, раскрывается новизна работы, её теоретическая и практическая значимость, излагаются основные положения, выносимые на защиту.

В первой главе «Проблемы автоматизации морфологического анализа существительного русского языка» рассматриваются принципы системно-комплексного подхода, определяются теоретические основы системно-комплексного метода анализа русского слова, характеризуется значимость лингвистических автоматов и морфологических анализаторов в развитии компьютерной лингвистики.

Во второй главе «Современные методы идентификации морфологических признаков слов» рассматриваются существующие алгоритмы морфологического анализа, производится их анализ и сравнение между собой, предлагается оригинальный способ классификации таких алгоритмов, а также дается оценка существующих программ морфологического анализа.

В третьей главе «Описание предлагаемого алгоритма и его экспериментальная проверка» мы описываем разработанный алгоритм, оцениваем его качество для текстов разных функциональных стилей, используя определённые нами критерии оценки.

В заключении подводятся общие итоги работы, намечаются направления для дальнейших исследований, перспективы для применения и развития описанного в работе алгоритма.

ГЛАВА 1. Проблемы автоматизации морфологического анализа существительного русского языка

Традиционно в автоматической обработке текста под морфологическим анализом понимается «обработка отдельно взятых словоформ, в результате которой каждой словоформе ставится в соответствие её информация -характеристика, изображающая в явной и удобной форме те свойства словоформы, которые необходимы для последующего синтаксического анализа» [Мельчук, 1964, с. 10]. Таким образом, основной задачей автоматического морфологического анализа является определение для единиц текста информации об отношении их к морфологической системе соответствующего языка. Практически морфологический анализ присутствует во всех видах анализа текста, поскольку ни один из них не может обойтись без анализа форм слов, определения принадлежности слов к грамматическому классу [Морфологический анализ, 1989, с. 3]. Из вышесказанного вытекает необходимость изучения грамматических категорий русского существительного для построения алгоритма автоматического морфологического анализа. Следует отметить, что теоретические проблемы грамматических категорий рассматриваются в том объёме, который необходим в рамках поставленной цели. Предполагается, что применение нечётких множеств совместно с вероятностным подходом позволит получить более подробную информацию о словоформе, поскольку позволяет формализовать расплывчатость и нечёткость естественного языка.

1.1. Принципы системно-комплексного подхода

Комплексный подход подразумевает заимствование теоретических положений и методов других наук, а также положений и методов иных направлений в рамках одной науки в целях более полного и всестороннего описания объекта исследования. Следует учесть и различие в концептуально-

терминологических базах не только разных наук, но и в рамках одной науки [Антропова, 2005, с. 114-129]. Разрабатываемый нами комплексный подход заключается в рассмотрении объекта исследования с позиций лингвистики, информатики и математики, предполагает синтез системного, структурного и математического подходов.

Системный подход - направление методологии специально-научного познания и социальной практики, в основе которого лежит исследование объектов как систем [Блауберг, Юдин, 1973]. Система как множество элементов с отношениями и связями между ними, образующими определенную целостность, проявляет и формирует свои свойства во взаимодействии со средой [Философская энциклопедия, 1970, с. 19].

Учитывая синхронный характер нашего исследования, мы выделили в результате анализа работ по системному подходу и теории систем [Агошкова, Ахлибининский, 1998; Блауберг, Юдин, 1973; Карпов, 2009; Урманцев, 1988] следующие принципы, релевантные для нашей работы:

• целостность - система рассматривается одновременно как единое целое и в то же время как сумма элементов,

• иерархия - подчинение элементов низшего уровня элементам высшего уровня,

• связность - все элементы системы связаны друг с другом напрямую или опосредованно,

• неаддитивность - свойства системы не могут быть сведены к сумме свойств её элементов.

В лингвистике система рассматривается как упорядоченное множество языковых единиц, классов, категорий и группировок, которые представляют собой целостные единства, имеющие определенную структуру и соотнесенные с множеством элементов формального выражения [Бондарко, 2004; Мельников, 1972; Моисеева, 2007; Мышкина, 1991; Солнцев, 1978; Шустова, 2011 и др.].

A.M. Аматов предлагает рассматривать язык как диссипативную самоорганизующуюся систему, которая при формальном описании может быть смоделирована как динамическая. A.M. Аматов представляет язык как открытую систему, так как

1) язык непрерывно взаимодействует с обществом, человеком, отдельные языки также постоянно взаимодействуют друг с другом,

2) язык состоит из неограниченного множества элементов,

3) язык - система нелинейная,

4) в развитии языка можно проследить смену устойчивых и неустойчивых состояний [Аматов, 2010, с. 13].

Подтверждение данных положений мы находим в работах Н.Д. Андреева и присоединившегося к нему В.А. Карпова, согласно которым:

1) действительность представляет собой незамкнутую и поэтому не формализуемую до конца систему,

2) язык, являющийся средством отображения действительности в человеческом коллективе, также представляет собой незамкнутую и поэтому не формализуемую до конца систему,

3) в составе незамкнутой системы языка существует неограниченное число подсистем, каждая из которых конечна и поэтому полностью формализуема [Андреев, 1967, с. 13-14; Карпов, 2009, с. 20].

Мы присоединяемся к данным положениям с одним замечанием: хотя формально система языка и её подсистемы конечны в каждый момент времени, тем не менее, большинство подсистем языка - открыты и изменяются с течением времени. Поэтому язык формализуем лишь частично. Однако, степень формализуемости каждой из отдельных подсистем позволяет успешно построить модель для данной подсистемы и применить построенную модель для автоматический обработки текста.

Осмысление различных аспектов взаимосвязи элементов языковой

системы и функционирования этих элементов остается одной из актуальных задач современных лингвистических исследований. Несомненно, для нашего исследования важны такие вопросы, как взаимодействие лексических и грамматических единиц, инвариантность / вариативность в языковой системе [Абрамов, 1999; Адмони, 1964, 1986; Блох, 2000; Бодуэн де Куртенэ, 1963; Бондарко, 1976; Касевич, 1988; Кацнельсон, 1948; Мещанинов, 1978; Проблемы функциональной грамматики, 2000; Степанов, 2007; Типология конструкций с предикатными актантами, 1985; Уфимцева, 1962; Храковский, 1985, Шустова, 2011 и др.]. Взаимодействие лексических и грамматических единиц проявляется в функционировании словоформы, во-первых, как элемента парадигмы слова, во-вторых, как элемента словосочетания, или более крупных единиц языка. Вариативность проявляется в виде омонимии словоформ.

Современный уровень развития лингвистической теории открывает возможность исследования языка, в соответствии с общими тенденциями современной науки [И.В.Арнольд, 1991, с. 17-20], как сложной нечёткой системы [Р.Г. Пиотровский, 1999, с. 7]. Нас интересует функционирование лексемы, с одной стороны, как системы, состоящей из элементов - словоформ, а с другой - как подсистемы грамматики языка.

Структурный подход основан на выделении в языке элементов, противопоставленных друг другу. Восходя к датским учёным Л. Ельмслеву и Х.И. Ульдаллю, структурный подход занял важное место в методологии лингвистики [Адмони, 1988; Апресян, 1966; Ельмслев, 1951; Гладкий, 1973; Севбо, 1981; Ревзин, 1962, 1977 и др.]. У истоков других направлений структурализма стояли: в Швейцарии - Ф. де Соссюр, в Праге - Н.С. Трубецкой и Р. Якобсон, в США - Э. Сепир, Л. Блумфилд, а позже Ц. Харрис. Основной особенностью структурного подхода является выделение взаимоотношений элементов, в то время как сами элементы могут быть достаточно произвольными [Ельмслев, 1951]. Применение структурного подхода в нашем исследовании, в частности, анализ парадигматических и синтагматических

отношений словоформ, позволяет повысить качество анализа.

Математическое описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей [Соссюр, 2001]. Активное применение математического подхода в лингвистических исследованиях началось в конце 50-х гг. XX в. в связи с возникновением идеи машинного или автоматического перевода. В этот период в нашей стране появились работы, посвященные машинному переводу. В частности, большой научный интерес представляют работы Д.Ю. Панова и др. [Панов и др., 1956], которые впервые попытались алгоритмизировать систему языка и процесс перевода. В 60-70-е гг. идеи Д.Ю. Панова и его коллег продолжали развивать как математики, так и лингвисты [Белоногов, 1971; Вельская, 1969; Варга, 1964; Дрейзин, 1966; Жолковский, Леонтьева, Мартемьянов, 1960; Иорданская, 1967; Кулагина, 1979; Лейкина, 1976; Леонтьева, 1961; Пивоварова, Севбо, 1961; Резвин, Розенцвейг, 1961; Фитиалов, 1961 и др.]. Наиболее значимыми в данный период можно назвать работы И.А. Мельчука [Мельчук, 1961, 1964], который не только работал над алгоритмизацией процессов перевода, но и дал фундаментальное лингвистическое обоснование используемым алгоритмам. С конца 60-х гг. интерес к машинному переводу и автоматическому анализу текстов ослабевает, начали появляться признаки разочарования, усиливавшиеся по мере того, как выявлялись все новые и новые более сложные лингвистические проблемы, и все яснее осознавалось, что процесс перевода не так легко поддается автоматизации, как это казалось в начале. Однако в 80-90 гг. в связи с появлением более мощных компьютеров и вместе с тем с увеличением информационного потока интерес именно лингвистов к системам автоматической обработки текста и машинного перевода вновь возрос, что отражается в большом количестве новых работ [Апресян и др., 1981; Гельбух, 1992; Королев, 1998; Марчук, 1983, 1998; Морфологический анализ, 1989; Разработка формальной модели, 1981; Сегалович, Маслов, 1998; Шемакин, 1992

и др.]. В эти же годы автоматический анализ текста начинает рассматриваться не только как один из блоков машинного перевода, но и как самостоятельное направление исследования. В настоящее время в самостоятельное направление выделяется и автоматический морфологический анализ, интерес к которому вновь возрос как со стороны лингвистов, так и со стороны инженеров и программистов в связи с распространением сети Интернет и необходимостью совершенствования информационно-поисковых систем [Андреев и др., 2005; Баглей и др., 2007; Бадялик, 2005; Белоногов, 2004; Бочаров, Грановский, 2011; Боярский, Каневский, 2008; Зинькина и др., 2005; Проскурня, 2001-2003; Сегалович, 2003; Сокирко, 2001, 2010; Сулейманова, Константинов, 2009; Толпегин, 2006 и др.].

Многообразие систем машинного перевода, программ автоматического анализа текстов и морфологического анализа объясняется не только их математическим и программным обеспечением, но и лингвистическим обеспечением. Стандартное лингвистическое обеспечение таких систем включает в себя 1) словари, 2) грамматики, 3) формализованные промежуточные представления единиц анализа на разных этапах преобразования [Искуственный интеллект, 1990, с. 206]. Для формализации данных, структурирования словарей и формализации грамматик может использоваться различный математический аппарат.

Как в прикладной, так и теоретической лингвистике используется метод, основанный на теории множеств [Арнольд, 1991; Демьянков, 1995; Добрушин, 1961; Кулагина, 1958; Ломтев, 2004 и др.]. С представлениями о нечетких множествах, являющихся расширением классической теории множеств, хорошо коррелирует понимание полевой структуры в работах В.Г. Адмони, И.П. Ивановой и Г.Г. Почепцова [Адмони, 1973; Арнольд, 1991; Иванова, 1981; Иванова, Бурлакова, Почепцов, 1981], хотя и развивались они совершенно независимо от них. По мнению И.В. Арнольд, теорию нечетких множеств можно при этом рассматривать как математическое обоснование

лингвистического понятия поля [Арнольд, 1991, с. 28].

Активно применяются также вероятностные [Андреев, 1967; Налимов, 1979; Пиотровский, 1999; Якубайтис, Скляревич, 1980 и др.] и статистические методы [Головин, 1966, 1971; Кожина, 1975; Крылов, 2011; Мартыненко, 1988, 2011; Мурзин, Штерн, 1991; Овчинникова, 2002; Фрумкина, 1964; Чугаева, 2007; Штерн, 1992] к описанию языка. Математический подход, по мнению А.Я. Шайкевича [ЛЭС, 2000, с. 231], применим к объектам самой разной природы, поэтому в языкознании математические методы используются для анализа единиц любого уровня. Характерная черта математического подхода состоит в том, что объекты исследования подвергаются формализации до такого уровня, на котором становится возможным применять математические методы. Математический подход дает возможность численной оценки различных явлений изучаемой области.

Похожие диссертационные работы по специальности «Прикладная и математическая лингвистика», 10.02.21 шифр ВАК

Список литературы диссертационного исследования кандидат наук Гашков, Александр Владимирович, 2012 год

Список литературы

1. Абрамов Б.А. Теоретическая грамматика немецкого языка. Сопоставительная типология немецкого и русского языков. М.: Владос, 1999. 285 с.

2. Адмони В.Г. Качественный и количественный анализ грамматических явлений // Теоретические проблемы современного советского языкознания. М.: Наука, 1964. С. 56-68.

3. Адмони В.Г. Грамматический строй как система построения и общая теория грамматики [Текст] / В.Г. Адмони. JL: Наука, 1988. 239 с.

4. Адмони В.Г. Синтаксис современного немецкого языка. JL: Наука, 1973. 366 с.

5. Агошкова Е.Б., Ахлибининский Б.В. Эволюция понятия системы // Вопросы философии. 1998. N7. С. 170-179.

6. Айвазян С.А. и др. Прикладная статистика. Классификация и снижение размерности. Справ, издание / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д. Мешалкин. М.: Финансы и статистика. 1989.

7. Аматов A.M. О синергетике естественного языка: энтропия, диссипация, самоорганизация // Синергетическая лингвистика vs лингвистическая синергетика: материалы междунар. науч.-практ. конф. Пермь, 8-10 апреля 2010 г. Пермь: Изд-во Перм. гос. техн. ун-та, 2010. С. 7-15.

8. Андреев A.M. и др. Обучение морфологического анализатора на большой электронной коллекции текстовых документов / A.M. Андреев, Д.В. Березкин, К.В. Симаков // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды седьмой Всероссийской конференции. Ярославль: Ярославский государственный университет, 2005. С. 173-181.

9. Андреев Н.Д. Статистико-комбинаторные методы в теоретическом и прикладном языковедении. Л.: Наука. Ленингр. Отд-ние, 1967. 403 с.

10. Антропова Л.И. Формы существования языка: социокультурно-коммуникативный подход: дис. ... д-ра филол. наук. Челябинск, 2005. 447 с.

11. Апресян Ю.Д. Идеи и методы современной структурной лингвистики. М.: Просвещение, 1966. 305 с.

12. Апресян Ю.Д. Лексическая семантика. М.: Шк. "Языки русской культуры",

Изд. фирма "Восточная лит-ра", РАН, 1995. 2-е изд. Т.1. 472 с.

13. Апресян Ю.Д. и др. Лингвистическое обеспечение в системе автоматического перевода ЭТАП-1 / Ю.Д. Апресян, И.М. Богуславский, Л.Л. Иодмин, Л.П. Крысин, A.B. Лазурский, Н.В. Перцов, В.З. Санников // Разработка формальной модели естественного языка: Сборник научных трудов . Новосибирск: 1981. С. 3-28.

14. Арнольд И.В. Основы научных исследований в лингвистике: Учеб. пособие. М.: Высшая школа, 1991. 140 с.

15. Ахманова О.С. Словарь лингвистических терминов. 2-е изд. М.: Советская энциклопедия, 1969. 607 с.

16. Баглей С.Г. и др. Вероятностный подход к задаче разрешения омонимии слов и словарных пар / С.Г. Баглей, A.B. Антонов, B.C. Мешков, A.B. Титов // Сборник «Компьютерная лингвистика и интеллектуальные технологии»: Труды межд. конф. Диалог 2007. М.: 2007 С. 23-28.

17. БадяликП. Морфологический анализатор - основа поисковых систем // Компьютерные Вести, №15, 2004 г. [электронный ресурс] http://www.metric.ru/publications.asp?ob_no=486

18. Баранов А.Н. Введение в прикладную лингвистику: учебное пособие. М.: Эдиториал УРСС, 2001. 360 с.

19. Бараташвили Э.Э. Этноспецифика лингвосемиотики потребностей: Тюркоязычная глюттония. // Волгоградская государственная селискохозяйственная академия [электронный ресурс] http://www.ssc.smr.ru/media/journals/izvestia/2011/2011_2_127_131 .pdf

20. Батыршин И.З. Основные операции нечёткой логики и их обобщения. Казань: Отечество, 2001. 100 с.

21. Бауер Ф.Л., Гооз Г. Информатика. Вводный курс. Т.1. М.: Мир, 1990. 336 с.

22. Белозерова H.H., Чуфистова Л.Е. Шекспир и компания, или использование электронных библиотек при лингвистическом исследовании: учебное пособие. Тюмень: Издательство Тюменского государственного университета, 2007. 296 с.

23. Белоногов Г.Г. Определение грамматических признаков "новых" слов с

помощью словаря. Инженерная лингвистика, ЛПШ им. Герцена. Ученые записки, том. 458, часть И, I., 1971, С. 225-229.

24. Белоногов Г.Г. и др. Компьютерная лингвистика и перспективные информационные технологии / Белоногов Г.Г., Калинин Ю.П., Хорошилов A.A. // Научно-техническая информация. Сер. 2. Информационные процессы и системы / Всероссийский институт научной и технической информации РАН. 2004, № 8. С. 30-43.

25. Белоногов Г.Г. Компьютерная лингвистика и перспективные информационные технологии. М.: Русский мир, 2004. 248 с.

26. Вельская И.К.Язык человека и машина. М.: Изд-во МГУ, 1969. Т.1. 408 с.

27. Беляева Л.Н. Автоматический (машинный) перевод / Л.Н. Беляева, М.И. Откупщикова//Прикладное языкознание. СПб., 1996. С. 360-388.

28. Беляева Л.Н. Лингвистические автоматы в современных информационных технологиях. СПб.: Изд-во Рос. гос. пед. ун-та им. А.И. Герцена, 2001. 130 с.

29. Беляева Л.Н. и др. Автоматизация в лексикографии / Л.Н. Беляева, A.C. Герд, И.И Убин // Прикладная лингвистика. СПб, 1996. С. 318-333.

30. Беляева Л.Н. и др. Лингвистические ресурсы автоматизированного рабочего места филолога: Коллективная монография / Л.Н. Беляева, A.A. Виландеберк, Л.А. Девель, И.Н. Ларченков, C.B. Молчанова, В.Р. Нымм, Т.Н. Петрова-Маслакова. СПб.: Инфо-Да, 2004. 184 с.

31. Блауберг И.В., Юдин Э.Г. Системный подход // Большая Советская энциклопедия: в 30 т. / гл. ред. A.M. Прохоров. 3-е изд. Т. 23. М.: Большая Советская энциклопедия, 1976.

32. БлохМ.Я. Теоретическая грамматика английского языка. М.: Высшая школа, 2000. 380 с.

33. Бодуэн де Куртенэ И.А. Избранные труды по общему языкознанию: в 2-х т. / вступ. ст. действ, чл. АН СССР В.В. Виноградова и действ, чл. Польской академии Н.В. Дорошевского. М.: Изд-во Акад. наук СССР, 1963. Т. 1. 384 с.

34. Бодуэн де Куртенэ И.А. Избранные труды по общему языкознанию. М.: Изд-во Акад. наук СССР, 1963. Т. 2. 391 с.

35. Большая Советская энциклопедия: в 51 т. / гл. ред. С.И. Вавилов. 2-е изд. Т. 2. М.: Большая Советская энциклопедия, 1950.

36. Большая Советская энциклопедия: в 30 т. / гл. ред. A.M. Прохоров. 3-е изд. Т. 1. М.: Большая Советская энциклопедия, 1970.

37. Большая Советская энциклопедия: в 30 т. / гл. ред. A.M. Прохоров. 3-е изд. Т. 8. М.: Большая Советская энциклопедия, 1972.

38. Бондарко A.B. Теория морфологических категорий. Л.: Наука. Ленигр. отд-ние, 1976. 255 с.

39. Бондарко A.B. О структуре грамматических категорий (Отношения оппозиции и неоппозитивного различия) // Вопросы языкознания. М., 1981. № 6. С. 17-28.

40. Бочаров В.В., Грановский Д.В. Программное обеспечение для коллективной работы над морфологической разметкой корпуса // Труды международной конференции «Корпусная лингвистика-2011». СПб.: С.-Петербургский гос. университет, Филологический факультет. С. 104-109.

41. Боярский К.К., Каневский Е.А. Разработка инструментария для полуавтоматической морфологической разметки текста // Труды международной конференции «Корпусная лингвистика-2008». СПб.: С.-Петербургский гос. университет, Факультет филологии и исскуств, 2008. С. 83-88.

42. Вавилонская башня: проект «Эволюция языка». Русские словари и морфология [электронный ресурс] http://star 1 ing.гinet.ru/morpho.php?lan=ru

43. Варга Д. Проблемы осуществления морфологического анализа при машинном переводе. НТИ. М.: ВИНИТИ, 1964. № 4. С. 47-50.

44. Верещагин Н.К., Шень А. Начала теории множеств. М.: МЦНМО, 1999. 128 с.

45. Вертель Е.В. Проблемы машинной лексикографии: Дис. канд. филол. наук. М., 1984. 125 с.

46. Виноградов В.В. Русский язык. Грамматическое учение о слове. М.: Учпедгиз, 1947. 784 с.

47. Виноградов В.В. Русский язык. М., 1972. 604 с.

48. Ганелина Н.Д. Разработка и применение бионических моделей и методов в задачах автоматизации проектирования маршрутов обхода геометрических

объектов. Дис. канд. техн. наук. Новосибирск: 2007. 122 с.

49. Гвоздев А.Н. Очерки по стилистике русского языка / А.Н. Гвоздев. М.: Просвещение, 1965. 408 с.

50. Гвоздев А.Н. Современный русский литературный язык. Часть II. Синтаксис. М.: Просвещение, 1973. 350 с.

51. ГельбухА.Ф. Эффективно реализуемая модель морфологии флективного естественного языка. Nauchno-Tehnicheskaya Informaciya (NTI), ISSN 0548-0027, ser. 2, vol. 1, Moscow, Russia, 1992, pp. 24-31.

52. Гладкий A.B. Формальные грамматики и языки. M.: Наука, 1973. 185 с.

53. Головин Б.Н. К вопросу о сущности грамматической категории (на материале русского языка) // Вопр. языкознания. 1955. № 1. С. 117-124.

54. Головин Б.Н. Из курса лекций по лингвистической статистике. Горький, 1966. 332 с.

55. Головин Б.Н. Язык и статистика. М.: Просвещение, 1970. 190 с.

56. Грамматический словарь русского языка. Морфологический анализатор [электронный ресурс] http://www.solarix.ru/russian-grammardictionary.shtml

57. Гранат. Настольный энциклопедический словарь в 8-ми томах. 4-е переработанное издание. М.: Гранат и К. 1900.

58. Гребенкина О.С. Коммуникативно-прагматическая интерпретация многозначного высказывания с позиций контрадиктно-синергетического подхода. Дис. канд. филол. наук. Пермь: 2002. 169 с.

59. Гребенкина О.С. Полисемия как лингвистическая универсалия // Ученые записки гуманитарного факультета ПГТУ. Пермь: 2002. Выпуск 5. С. 77-81.

60. Гребеньков A.C. Интернет-ресурс www.worldform.com как инструмент морфологической разметки текста // Труды международной конференции «Корпусная лингвистика-2008». Спб.: С.-Петербургский гос. университет, Факультет филологии и искусств, 2008. С. 154-161.

61. Гумбольдт В. Избранные труды по языкознанию. М.: Прогресс, 2000. 397 с.

62. Демьянков В.З. Доминирующие лингвистические теории в конце XX века // Язык и наука конца 20 века. М.: Институт языкознания РАН, 1995.

С. 239-320.

63. ДобрушинР.Л. Математические методы в лингвистике // Математическое просвещение. Вып. 6. М.: Физматгиз, 1961. С. 37-60.

64. Дрейзин Ф.А. О выборе правильного по смыслу синтаксического анализа из нескольких формально возможных при автоматическом анализе русских текстов // Машинный перевод и прикладная лингвистика. М., 1966. Вып. 10. С. 3-20.

65. Дрейзин Ф.А. Синтаксическая омонимия в русском языке с точки зрения автоматического анализа. Дис. ... канд. филол. наук). М.: 1966. 120 с.

66. Дьяконов В.П. «Закон Мура» и компьютерная математика // Exponenta Pro. Математика в приложениях. 2003. № 1. С. 82-86.

67. Ельмслев Л. Пролегомены к теории языка / пер. с англ.; сост. В.Д. Мазо. М.: КомКнига, 2006. 248 с.

68. Жданова Л.А. Лексикология. Словари. Структура словарной статьи [электронный ресурс] http://www.portal-slovo.ru/philology/37386.php

69. Жолковский A.K. и др. О принципиальном использовании смысла при машинном переводе / А.К. Жолковский, H.H. Леонтьева, Ю.С. Мартемьянов // Машинный перевод. М., 1961. С. 17-46. (Труды института точной механики и вычислительной техники. Вып.2).

70. Задорожный М.И. О границах полисемии и омонимии. М.: Изд-во МГУ, 1971.71 с.

71. Зализняк A.A. Русское именное словоизменение. М.: «Наука», 1967. 370 с.

72. Зализняк A.A. Грамматический словарь русского языка: Словоизменение. 4-е изд. испр. и доп. М.,: 2003. 795 с.

73. Зализняк Анна А. Феномен многозначности и способы его описания // Вопросы языкознания. 2004. № 2. С. 20-45.

74. Захаров В.П. Корпусная лингвистика. Учебно-методическое пособие. Спб.: 2005. 48 с.

75. ЗинькинаЮ.В. и др. Разрешение функциональной омонимии в русском языке на основе контекстных правил / Ю.В. Зинькина, Н.В. Пяткин, O.A. Невзорова // Труды межд. конф. Диалог'2005. М.: Наука, 2005. С. 198-202.

76. Иванова И.П. О полевой структуре частей речи в английском языке // Теория языка, методы его исследования и преподавания. JL, 198 . С. 125-129.

77. Иванова И.П. и др. Теоретическая грамматика современного английского языка: Учебник / И.П.Иванова, В.В. Бурлакова, Г.Г. Почепцов. М.: Высш. школа, 1981. 285 с.

78. Иорданская JI.H. Автоматический синтаксический анализ / JI.H. Иорданская. Новосибирск: Наука Сиб. отд-ние, 1967. Т. 1. 231 с.

79. Искусственный интеллект: В 3 кн. Кн. 1. Системы общения и экспертные системы: Справочник / Под ред. Э.В. Попова. М.: Радио и связь, 1990. 464 с.

80. Исраелян А.Г. Опыт корпусного исследования морфологической вариативности: именительный падеж множественного числа существительных среднего рода // Труды международной конференции «Корпусная лингвистика-2011». СПб.: С.-Петербургский гос. университет, Филологический факультет. С. 168-174.

81. Калинина JI.В. Лексико-грамматические разряды имен существительных как пересекающиеся классы слов (когнитивно-семасиологический анализ). Автореферат диссертации доктора филол. наук. Киров: 2009. 44 с.

82. Камынина A.A. Современный русский язык. Морфология: Учебное пособие для студентов филологических факультетов государственных университетов. М.: Изд-во МГУ, 1999. 240 с.

83. Караулов Ю.Н. Общая и русская идеография / Ю.Н. Караулов. М. : Наука, 1976. 355 с.

84. Карпов В.А. Язык как система. Изд-е 3. М.: Едиториал УРСС, 2009. 304 с.

85. Касарес X. Введение в современную лексикографи. Пер. с исп. Н.Д. Арутюновой, ред., предисл. и примеч. Г.В. Степанова. М.: Изд-во иностр. лит., 1958.354 с.

86. Касевич В.Б. Семантика. Синтаксис. Морфология. М.: Наука, 1988. 311 с.

87. Кацнельсон С.Д. О грамматической категории // Вестн. ЛГУ. 1948. № 2. С. 114-134.

88. КибзунА.И. и др., Горяинова Е.Р., Наумов A.B., Сиротин А.Н. Теория вероятностей и математическая статистика. Базовый курс с примерами и

задачами: учебное пособие. Теория / А.И. Кибзун, Е.Р. Горяинова, A.B. Наумов, А.Н. Сиротин. Теория. М.: ФИЗМАТЛИТ, 2002. 224 с.

89. Кнут Д. Искусство программирования. 3-е изд. М.: Вильяме, 2006. Т. 1. Основные алгоритмы. 720 с.

90. Кожина М.Н. Предмет и методы стилостатистики // Първа национална конференция по използуване на математически модели на автоматични сметачни машини и лингвистиката. Варна, 1975. С. 20-21.

91. Кожина М.Н. Стилистический энциклопедический словарь русского языка / под редакцией М.Н. Кожиной.. М:. "Флинта", "Наука", 2003. 696 с.

92. Козьмина Е.Л. Обратные словари. Принципы их создания и использования. Кандидатская диссертация. М.: МГУ, 1988. 152 с.

93. Колесников Н.П. Порядок слов в русском предложении и синтаксическая омонимия: учеб. пособие по соврем, рус. яз. для студентов-журналистов. Ростов-на-Дону: Издательство Ростовского университета, 1981. 45 с.

94. Колмогоров А.Н. О понятии алгоритма // Успехи математических наук, 1953, т.8, вып.4 (56), С. 175-176.

95. Колшанский Г.В. Контекстная семантика. М.: Наука, 1980. 150 с.

96. Конюхова Т.В. Влияние СМИ на массовое сознание в информационном обществе. // Фундаментальные исследования, 2005, № 3. С. 71-72.

97. Кормен Т.Х. и др. Алгоритмы: построение и анализ, 2-е изд. / Т.Х. Кормен, Ч.И. Лейзерсон, Р.Л. Ривест, К. Штайн. М.: Вильяме, 2005. 1296 с.

98. Королев Э.И. Компьютерная лингвистика на пороге нового века // Вестник Московского педагогического университета. 1998. № 2 . С. 26-33.

99. Короткова М.А. Математическая теория автоматов. Учебное пособие. М.: МИФИ, 2008. 116 с.

100. Кофман А. Введение в теорию нечётких множеств. М.: Радио и связь. 1982.432 с.

101. Краткая русская грамматика / Под ред. В.Н Белоусова. М.: Институт русского языка им. В.В. Виноградова, 2002. 725 с.

102. Крылов С.А. Статистический свойства синтаксических молекул, их грамматичесикх классов и их парадигм (на материале генерального корпуса

русского языка) // Труды международной конференции «Корпусная лингвистика-2011». Спб.: С.-Петербургский гос. университет, Филологический факультет. С. 223-228.

103. Кук Д. Компьютерная математика: Пер. с англ. / Д. Кук, Г. Бейз. М.: Наука, 1990. 384 с.

104. Кулагина О.С. Аналитическая модель языка // Проблемы кибернетики. М.: 1958. Вып. 1.С. 203-214.

105. Кулагина О.С. Исследования по машинному переводу. М.: Наука, 1979. 320 с.

106. Лаптева O.A. Речевые возможности текстовой омонимии / О.А.Лаптева. М.: Едиториал УРСС, 2003. 416 с.

107. ЛейкинаБ.М. Несколько задач по решению неоднозначности и экспликации имплицитных связей // Вычислительная лингвистика. М.: Наука, 1976. С. 81-107.

108. Лекции по теории графов // Емеличев В.А., Мельников О.И., Сарванов В.И., Тышкевич Р.И. М.: Наука, 1990. 384 с.

109. Леонтьева H.H. Модель синтеза русской фразы на основе семантической записи // Доклады на конференции по обработке информации, машинному переводу и автоматическому чтению текста. М.: ВНИТИ, 1961. Вып. 9. 24 с.

110. Лингвистический энциклопедический словарь / Гл. ред. В.Н.Ярцева. М.: Большая Российская Энциклопедия, 2000. 688 с.

111. Литневская Е.И. Русский язык. [электронный ресурс] http://www.gramota.ru/book/litnevskaya.php

112. ЛомтевТ.П. Предложение и его грамматические категории. М.: Едиториал УРСС, 2004. 200 с.

113. Лопатин В.В. Морфологические категории в плане выражения // Русский язык. Функционирование грамматических категорий. Текст и контекст. М., 1984. С. 5-12.

114. Малая Советская Энциклопедия. Гл. ред. Введенский Б.А. В 10 томах Издательство: М.: БСЭ; Издание 3-е; 7000 е.; 1958, 1961. Т. 1.

115. МаловВ.И. Рост омонимичности в формах родительного падежа русских существительных как одно из проявлений языкового дрейфа / В.И. Малов. Слово, высказывание, текст в когнитивном, прагматическом и

культурологическом аспекте: Материалы второй международной конференции 5-6 декабря 2003 г. Челябинск, 2003. С. 369-371.

116. Мартыненко Г.Я. Основы стилеметрии. Д.: Изд-во ЛГУ, 1988. 173 с.

117. Мартыненко Г.Я. Длина строки в корпусе русской поэзии Серебряного века // Труды международной конференции «Корпусная лингвистика-2011». СПб.: С.-Петербургский гос. университет, Филологический факультет. С. 225-260.

118. МарчукЮ.Н. Вычислительная лексикография. М.: ВЦП, 1976. 183 с.

119. МарчукЮ.Н. Компьютерная лингвистика: учебное пособие. М.: Восток-Запад, 2007.317 с.

120. Марчук Ю.Н. Проблемы машинного перевода. М.: Наука, 1983. 232 с.

121. Марчук Ю.Н. О «двенадцати проблемах» современного машинного перевода // Вестник Московского педагогического университета. 1998. № 2 . С. 36-40

122. МасловЮ.С. Введение в языкознание / Ю.С. Маслов. М.: Высшая школа, 1975.328 с.

123. Мельников Г.П. О понятиях языковой системы и структуры языка // Общее языкознание. Внутренняя структура языка. М., 1972. С. 8-91. (совместно с Е.С. Кубряковой).

124. Мельчук H.A. Автоматический синтаксический анализ. Т. 1. Новосибирск.: Ред.-изд. отдел Сибирского отделения АН СССР, 1964. 359 с.

125. Мельчук H.A. Морфологический анализ при машинном переводе (преимущественно на материале русского языка) // Проблемы кибернетики. В. 6 М.: 1961. С. 207-276.

126. Мещанинов И.И. Члены предложений и части речи. Л.: Наука, 1978. 388 с.

127. Милославский И.Г. Морфологические категории современного русского языка. М.: «Просвещение», 1981. 256 с.

128. Моделирование языковой деятельности в интеллектуальных системах / под ред. и с предисл. А. Е. Кибрика, А. С. Нариньяни; предисл. А. П. Ершова. М.: Наука, 1987. 279 с.

129. Моисеева И.Ю. Текстообразование: системно-динамический аспект. Оренбург: Изд-во ОГПУ, 2007. 344 с.

130. Морковкин B.B. Идеографические словари и обучение языку // Вопросы учебной лексикографии. М: МГУ, 1969. С. 72-79.

131. Морковкин В.В. Об одном способе синтеза системы учебных словарей и некоторые вопросы семантизации слов в словарях // Проблемы учебной лексикографии и обучения лексике: Сб. ст. М: Русский язык, 1978. С. 34-42.

132. Морфологический анализ научного текста на ЭВМ / В.И. Перебейнос, Т.А. Грязнухина, Н.П. Дарчук и др. / Отв. ред. Т.А. Грязнухина. АН УССР. Институт языковедения им. A.A. Потебни. Киев: Наук, думка, 1989. 264 с.

133. Мурзин JI.H., Штерн A.C. Текст и его восприятие / JI.H. Мурзин, A.C. Штерн. Свердловск: Изд-во Урал, ун-та, 1991. 178 с.

134. Мухин A.M. Морфологические и синтаксические категории // Исследования по языкознанию: К 70-летию члена-корреспондента РАН A.B. Бондарко. СПб, 2001. С. 51-55.

135. МышкинаН.Л. Динамико-системное исследование смысла текста. Красноярск: Изд-во Красноярского университета, 1991. 212 с.

136. МышкинаН.Л. Принципы построения синергетической теории языка // Вопросы теории индоевропейских языков: межрегион, сб. науч. тр. Пермь: Изд-во Прикам. соц. ин-та, 2007. С. 3-6.

137. Налимов В.В. Вероятностная модель языка. О соотношении естественных и искусственных языков. М.: Наука, 1979. 304 с.

138. Настольный энциклопедический словарь. М.: Товарищество Гранат, 1900. Т. 1.662 с.

139. Национальный корпус русского языка / [электронный ресурс] http ://www.ruscorpora.ru

140. Нелюбин Л.Л. Толковый переводоведческий словарь. 3-е изд., перераб. М.: Флинта: Наука, 2003. 320 с.

141. Никитевич В.М. Грамматические категории в современном русском языке. М.: Учпедгиз, 1963. 246 с.

142. Овчинникова И.Г. Ассоциативный механизм в речемыслительной деятельности. Автореф. ... д-ра филол. наук. СПб: 2002. 30 с.

143. Панов Д.Ю. и др. Автоматизация перевода с одного языка на другой. Сессия по научным проблемам автоматизации производства / Ю.Д. Панов, A.A. Ляпунов, И.С. Мухин. М: Изд-во АН СССР, 1956.

144. Пешковский A.M. Русский синтаксис в научном освещении Изд. 7. М.: Учпедгиз, 1956. 512 с.

145. Пивоварова Е.П., Севбо И.П. Пример алгоритма анализа текста без словаря основ. М.: 1961. 12 с.

146. Пиотровский Р.Г. Лингвистический автомат (в исследовании и непрерывном обучении): учеб. пособие. СПб.: Изд-во РГПУ им. А. И. Герцена, 1999. 242 с.

147. Плунгян В.А. К семантике русского локатива («второго предложного» падежа) // Семиотика и информатика. Вып. 37. М., 2002. С. 229-254.

148. Плунгян В.А. Общая морфология: введение в проблематику: учебное пособие. М.: Эдиториал УРСС, 2000. 384 с.

149. Плунгян В.А. Зачем мы делаем национальный корпус русского языка? [электронный ресурс] http://www.strana-oz.m/?numid=23&article=l 051

150. Потапова P.K. Речь: коммуникация, информация, кибернетика / Р.К. Потапова. М.: Радио и связь, 1997. 528 с.

151. Прикладное языкознание: учебник / С.А.Аверина, И.В.Азарова, Е.Л. Алексеева, Л.Н. Беляева; ред.: A.C. Герд. СПб: С-Пб. гос. ун-т, 1996. 526 с.

152. Причард Д.Дж. Абстракция данных и решение задач на С++. Стены и зеркала, 3-е издание. СПб.: Вильяме. 2003. 848 с.

153. Проблемы функциональной грамматики. Категории морфологии и синтаксиса в высказывании. СПб.: Наука, 2000. 346 с.

154. Проскурня М.О. Модуль морфологии русского языка: спецификация. Москва: Кафедра «АЯ» ВМиК МГУ им М.В.Ломоносова, 2001-2003. 51 с. [электронный ресурс] http://axofiber.no-ip.org/projects/rm/rmu.htm

155. Разработка формальной модели естественного языка: Сборник научных трудов. Новосибирск: 1981. 134 с.

156. Ревзин И.И. Модели языка. М.: Изд-во Акад. наук СССР, 1962. 191 с.

157. Ревзин И.И. Трансформационное исследование конструкций с субъектным

и объектным приименным дополнением (Genitivus subjectivus и Genitivus objectivus) // Проблемы грамматического моделирования. М.: 1973. С. 88-96.

158. Ревзин И.И. Современная структурная лингвистика: проблемы и методы. М.: Наука, 1977. 263 с.

159. Ревзин И.И., Розенцвейг В.Ю. Основы общего и машинного перевода. М.: Высшая школа, 1964. 243 с.

160. Реформатский A.A. Введение в языковедение / Под ред. В.А. Виноградова. М.: Аспект Пресс, 1966. 536 с.

161. Реформатский A.A. Число и грамматика // Лингвистика и поэтика. М., 1987. С. 76-87.

162. Розенталь Д.Э., Теленкова М.А. Словарь справочник лингвистических терминов. Пособие для учителей, изд. 2-е, испр. и доп. М., Просвещение, 1976. 543 с.

163. Русская грамматика: в 2 т. / Ред. Н.Ю. Шведова. М.: Наука, 1980. 783 с. Т. 1.

164. Русский язык. Энциклопедия / Гл. ред. Ю.Н. Караулов 2-е изд., перераб. и доп. М.: Болыи. Рос. Энциклопедия; Дрофа, 1998. 703 с.

165. Савчук С.О. Корпус современной русской прессы: из опыта создания и использования // Труды международной конференции «Корпусная лингвистика-2011». СПб.: С.-Пб. гос. университет, Филологический факультет. С. 309-315.

166. Севбо И.П. Графическое представление синтаксических структур и стилистическая диагностика. Киев: Наукова думка, 1981. 192 с.

167. Сегалович И. Ilya Segalovich A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine. 2003 [электронный ресурс] http://download.yandex.ru/company/iseg-lasvegas.pdf

168. Сегалович И, МасловМ, Русский морфологический анализ и синтез с генерацией моделей словоизменения для не описанных в словаре слов. 1998. [электронный ресурс] http://download.yandex.ru/company/DLG98-MM2.pdf

169. Селегей В. Электронные словари и компьютерная лексикография: заметки о переводе [Электронный ресурс] http://lingvoda.ru

170. Словарь русского языка: В 4-х т. / АН СССР, Ин-т рус. яз.; Под ред. А.П. Евгеньевой. 2-е изд., испр. и доп. М.: Русский язык, 1981-1984.

171. Слокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние, перспективы развития // Новое в зарубежной лингвистике. 1989. № 24. С. 375-407.

172. Соболев А.Н. Славянские pluralium tantum. Проблемы дефектной парадигмы. 2005 [электронный ресурс]

http://www.doiserbia.nb.rs/img/doi/0350-185X/2005/0350-185X0561095S.pdf

173. Соболева П.А. Словообразовательная полисемия и омонимия. М.: Наука, 1980. 294 с.

174. Сокирко A.B. и др. Автоматическая обработка текста [электронный ресурс] http ://www.aot.ru

175. Сокирко A.B. Быстрословарь: предсказание морфологии русских слов с использованием больших лингвистических ресурсов // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 26-30 мая 2010 г.). Вып. 9 (16). М.: Изд-во РГГУ, 2010. С. 450-456.

176. Сокирко A.B. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ). Дисс. канд. техн. наук. М.: 2001. 120 с.

177. Солнцев В.М. Язык как системно-структурное образование / В.М. Солнцев. М.: Наука, 1987. 344 с.

178. Соссюр Ф де. Курс общей лингвистики. М.: УРСС Эдиториал, 2001. 257 с.

179. Степанов Ю.С. Основы общего языкознания. М.: Просвещение, 1975. 271 с.

180. Степанов Ю.С. Имена. Предикаты. Предложения: Семиологическая грамматика / под ред. Ю.Н. Караулова. М.: Изд-во ЛКИ, 2007. 360 с.

181. Сулейманова Е.А., Константинов К.А. Морфологический анализ незнакомых фамилий в русскоязычном тексте // Международный журнал Программные продукты и системы. № 2, 2009 г. [электронный ресурс] http ://www. swsys.ru/index.php?page=:article&id=2250

182. ТабанаковаВ.Д. Идеографическое описание научной терминологии в специальных словарях. Диссертация на соискание ученой степени доктора филологических наук. Тюмень. 2001. 284 с.

183. Типология конструкций с предикатными актантами / отв. ред. B.C. Храковский. Л.: Наука. Ленингр. отд-ние 1985. 232 с.

184. Тихонов А.Н. Словообразовательный словарь русского языка: В 2 т. / А.Н. Тихонов. М.: Рус. яз., 1990. 856 с. Т. 1.

185. Толковый словарь русского языка. В 4 т. / Под ред. Д.Н. Ушакова. Т. 1. М., М.: Гос. ин-т "Сов. энцикл."; ОГИЗ; Гос. изд-во иностр. и нац. Слов., 1935-1940.

186. Толпегин П.В. Информационные технологии анализа русских естественноязыковых текстов // Информационные технологии. 2006. N 29. С. 2-7 [электронный ресурс] www.rffi.tolpegin.ru/it8.pdf

187. Урысон E.B. Несостоявшаяся полисемия и некоторые ее типы // Семиотика и информатика. Вып. 36. М.: 1998. С. 226-261.

188. Успенский В.А. Определение падежа по Колмогорову // Бюллетень Объединения по проблемам машинного перевода, № 5. M.: IМГПИЯ, 1957. С. 11-18.

189. Уфимцева А. А. Опыт изучения лексики как системы (на материале английского языка). М.: Изд-во АН СССР. 1962. 287 с.

190. Филлмор Ч. Дело о падеже // Зарубежная лингвистика. III. M.: Прогресс, 1999. С. 127-259.

191. Философская энциклопедия / Гл. ред. Ф.В. Константинов. М.: Советская энциклопедия, 1967. Т. 4. С. 552.

192. Фитиалов С.Н. О построении формальной морфологии в связи с машинным переводом. Тезисы конф. по обработке информации, машинному переводу и автоматическому чтению текста. ВИНИТИ АН СССР. М., 1961. 21 с.

193. Фрумкина P.M. Статистические методы изучения лексики. М.: Наука, 1964. 115 с.

194. Храковский B.C. Типы грамматических описаний и некоторые особенности функциональной грамматики // Проблемы функциональной грамматики. М.: Наука, 1985. С. 65-77.

195. Цейтлин Р. М. Краткий очерк истории русской лексикографии: (словари рус. яз.). М.: Учпедгиз, 1958. 136 с.

196. Череньков Д.М. Об одном статистическом методе пополнения морфологического словаря // Компьютерная лингвистика и интеллектуальные

технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 26-30 мая 2010 г.). Вып. 9 (16). М.: Изд-во РГГУ, 2010. С. 559-565.

197. Чугаева Т.Н. Перцептивный аспект звукового строя английского языка. Екатеринбург-Пермь: УрО РАН, 2007. 246 с.

198. Шайкевич А.Я. Введение в лингвистику. Учебное пособие. М.: «Academia», 2005. 394 с.

199. Шахматов A.A. Из трудов А.А.Шахматова по современному русскому языку. М.: Государственное учебно-педагогическое издание министерства просвящения РСФСР, 1952. 271 с.

200. ШемакинЮ.И. Начала компьютерной лингвистики: учебное пособие. М.: Изд-во МГОУ, 1992. 114 с.

201. ШендельсЕ.И. Многозначность и синонимия в грамматике (на материале глагольных форм современного немецкого языка). М.: Высшая школа, 1970. 207 с.

202. Штерн A.C. Перцептивный аспект речевой деятельности: Экспериментальное исследование. СПб: Издательство С.-Петербургского университета, 1992. 236 с.

203. ШтиндловаЙ. Обратные словари // Автоматизация в лингвистике. Л.: Наука, 1966. С. 84-91.

204. Щерба Л.В. Современный русский литературный язык. Избранные работы по русскому языку. М., 1957. С. 110-129.

205. Щерба Л.В. Языковая система и речевая деятельность. Л.: Наука, 1974.

206. Языкознание: Энциклопедический словарь. М.: «Большая Российская энциклопедия», 2000. 685 с.

207. Якубайтис Т.А., Скляревич А.Н. Корреляционные характеристики частей речи в связных текстах. Рига: Зинатне, 1980. 135 с.

208. Якубайтис Т.А., Скляревич А.Н. Вероятностная атрибуция типа текста по нескольким морфологическим признакам. Рига: ИЭВТ, 1982. 53 с.

209. ЯхъяеваГ.Э. Нечёткие множества и нейронные сети. Учебное пособие. М.: Бином, 2006. 316 с.

210. AndronD. Analyse morphologique du substantiv russe. Technical report, Centre

d'Etudes pur la Traduction Automatique, Universe de Grenoble, 1962.

211. Bernard-Georges A., Laurent G., Levenbach D., Analuse marphologique du verbe allemande. Tech. rep. Centre d'Etudes pur la Traduction Automatique, Universe de Grenoble, 1962.

212. Beesley K., Karttunen L. Finite State Morphology. CSLI Publications. 2003.

213. Boussard A., BerthaudM. Presentation de la synthese morphologique du françias. Tech. rep. Centre d'Etudes pur la Traduction Automatique, Universe de Grenoble, 1965.

214. Brinkmann H. u.a. TRANCE* - Ein System fur maschinelle Satzanalyse: Syntax // GLDV '99 Multilinguale Corpora: Codierung, Strukturierung, Analyse 11. Jahrestagung der Gesellschaft für Linguistische Datenverarbeitung 8.-10.7.1999, Frankfurt a/M. S. 198-209.

215. Carlson. Algorithms involving arithmetic and geometric means. 1971. Amer. Math. Monthly 78: 496-505.

216. GazdarG., KlinE., Pullum G. Generalized Phrase Structure Grammar. Oxford: Blackwells, 1985.

217. Helwig P. Natural language parsers:A "Course in Cooking". Heidelberg, 2002. 88 S.

218. Klement E.P., Mesiar R., Pap E. Triangular norms. Springer, 2000. 385 p.

219. Koskenniemi K. Two-level morphology: A general computation model for wordform recognition and production, University of Helsinki, 1983.

220. McEnery T., Wilson A. Corpus Linguistics. Edinburgh: Edinburgh University Press, 1996. 209 p.

221. Naumann S., Langer H. Parsing. Eine Einfuhrung in die maschinelle Analyse natürlicher Sprache. Teubner, Stuttgart, 1994. 298 S.

222. Powers D., Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness & Correlation [электронный ресурс] / Technical Report SIE-07-001.2007.

http://www.infoeng.flinders.edu.au/research/techreps/SIE07001.pdf

223. Shannon C.T. A Mathematical Theory of Communication. The Bell System Technical Journal, Vol. 27, pp. 379-423, 623-656, July, October, 1948.

224. Webster's new twentieth century dictionary of the English language World Pub. Co., 1957.

225.WoynaA. Morphological analysis of Polish verbs in terms of machine translation. Tech. rep., Machine Translation Research Project, Georgetown University, 1962.

226. Zadeh L.A. Fuzzy sets. Information and Control, 1965, vol.8, N 3, pp. 338-353.

Список иллюстративного материала

1. Золя Э. Дамское счастье. Пер. с фр. / Эмиль Золя. Собрание сочинений в 26 т. / М.: Гослитиздат, 1963. Т. 9 887 с.

2. Золя Э. Добыча. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 1. М.: "Правда", 1957.

3. Золя Э. Доктор Паскаль. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 16. М.: "Правда", 1957.

4. Золя Э. Его превосходительство Эжен Ругон. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 5. М.: "Правда", 1957.

5. Золя Э. Жерминаль. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 10. М.: "Правда", 1957.

6. Золя Э. Жертва рекламы. / Эмиль Золя. Избранные произведения. / М.: Гослитиздат. 1953.

7. ЗоляЭ. Завоевание. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 3. М.: "Правда", 1957.

8. Золя Э. Западня. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 6. М.: "Правда", 1957.

9. ЗоляЭ. Земля. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 12. М.: "Правда", 1957.

10. Золя Э. Карьера Ругонов. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 1 М.: "Правда", 1957.

11. ЗоляЭ. Лурд. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 17. М.: "Правда", 1957.

12. Золя Э. Мечта. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 13. М.: "Правда", 1957.

13. Золя Э. Наводнение. / Эмиль Золя. Собрание сочинений в 20 т. / Т. 1. Тверь: "Альба", М.: "Художественная литература". 1995.

14. Золя Э. Накипь. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 8. М.: "Правда", 1957.

15. Золя Э. Нана. / Эмиль Золя. Собрание сочинений в 26 т. / М.: Гослитиздат,

1963. Т. 7.

16. Золя Э. Радость жизни. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 9. М.: "Правда", 1957.

17. Золя Э. Разгром. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 15. М.: "Правда", 1957.

18. Золя Э. Родословное дерево Ругон-Маккаров. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 16. М.: "Правда", 1957.

19. Золя Э. Страница любви. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 7. М.: "Правда", 1957.

20. ЗоляЭ. Творчество. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 11. М.: "Правда", 1957.

21. ЗоляЭ. Труд. / Эмиль Золя. Собрание сочинений в 18 т. / Т. 18. М.: "Правда", 1957.

22. Золя Э. Человек-зверь. / Эмиль Золя. Собрание сочинений в 18 томах. / Т. 13. М.: "Правда", 1957.

23. Стругацкие А., Б. Возвращение (Полдень. XXII век). Екатеринбург: МП "Конвер", 1992. 400 с.

24. Стругацкие А., Б. Путь на Амальтею. / Путь на Амальтею: науч.-фантаст. повесть и рассказы. М.: Мол. гвардия, 1960. 144 с. / С. 3-83.

25. Стругацкие А., Б. Стажеры. М.: Мол. гвардия, 1962. 256 с.

26. Стругацкие А., Б. Страна багровых туч. М.: Детгиз, 1959. 296 с.

27. Стругацкие А., Б. Трудно быть богом. / Далёкая радуга. М.: Мол. гвардия,

1964./С. 137-327.

28. Стругацкие А., Б. Улитка на склоне. / Волны гасят ветер: фантаст, повести. Л.: Сов. писатель, 1989. 656 с. / С. 5-192.

29. Стругацкие А., Б. Хищные вещи века. / Хищные вещи века: фантаст, повести. М.: Мол. гвардия, 1965. 320 с. / С. 128-318.

30. Толстой Л.Н. Анна Каренина. М.: «Правда», 1956. 888 с.

31. Толстой Л.Н. Война и мир. Том 1. М.: Госполитиздат. 1955.

32. Толстой Л.Н. Война и мир. Том 2. М.: Госполитиздат. 1955.

33. Толстой Л.Н. Война и мир. Том 3. М.: Госполитиздат. 1955.

34. Толстой Л.Н. Война и мир. Том 4. М.: Госполитиздат. 1955.

35. Акционерное Общество: методические материалы, положения и инструкции. Выпуски 1-3,5,6,9. М. 1996.

36. Гражданский кодекс Российской Федерации. Часть первая. [Электронный ресурс] www.consultant.ru/popular/gkrfl/

37. Гражданский кодекс Российской Федерации. Часть вторая. [Электронный ресурс] www.consultant.ru/popular/gkrf2/

38. В.Г. Тимофеев. Уголовно-исполнительная система России: цифры, факты и события. Учебное пособие. Чебоксары: 1999. 206 с.

39. Уголовно-процессуальный кодекс Российской Федерации. [Электронный ресурс] www.consultant.ru/popular/upkrf/

40. Уголовный Кодекс Российской федерации. [Электронный ресурс] www.consultant.ru/popular/ukrf/

41. Аматов A.M. О синергетике естественного языка: энтропия, диссипация, самоорганизация. / Материалы конференции «Синергетическая лингвистика vs лингвистическая синергетика» / Пермь: 2010.

42. Богданова И.А. Функционирование архитипического концепта «вода» в текстах народного и индивидуального творчества. Диссертация на соискание ученой степени кандидата филологических наук. Пермь: 2006.

43. ЕльцоваМ.Н. Категории напряжения и напряженности простого повествовательного предложения. Диссертация на соискание ученой степени кандидата филологических наук. Пермь: 2006.

44. Кушнина JI.B. Взаимодействие языков и культур в переводческом пространстве: гештальт-синергетический подход. Диссертация на соискание ученой степени доктора филологических наук. Пермь: 2004.

45. Моисеева И.Ю. Эволюция структуры русского и французского текстовых инвариантов: сопоставительный аспект / Материалы конференции «Синергетическая лингвистика vs лингвистическая синергетика» / Пермь: 2010.

46. Москальчук Г.Г. Изоморфизм структуры текста и его аттрактора. / Материалы конференции «Синергетическая лингвистика vs лингвистическая синергетика» / Пермь: 2010.

47. Мышкина Н.Л. Лингводинамика текста: контрадиктно-синергетический подход. Диссертация на соискание ученой степени доктора филологических наук. Пермь: 1999.

48. Словикова Е.Л. Динамика рекламного дискурса. Энергия образа, слова и смысла. Монография. Пермь 2008.

49. Шустова C.B. Потенциал каузативных глаголов в динамико-функциональном аспекте. Диссертация на соискание ученой степенидоктора филологических наук. Пермь: 2011.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.