Семантический анализатор русскоязычного текста для вопросно-ответной системы тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат наук Мочалова Анастасия Викторовна

  • Мочалова Анастасия Викторовна
  • кандидат науккандидат наук
  • 2017, ФГБОУ ВО «Петрозаводский государственный университет»
  • Специальность ВАК РФ05.13.18
  • Количество страниц 128
Мочалова Анастасия Викторовна. Семантический анализатор русскоязычного текста для вопросно-ответной системы: дис. кандидат наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. ФГБОУ ВО «Петрозаводский государственный университет». 2017. 128 с.

Оглавление диссертации кандидат наук Мочалова Анастасия Викторовна

Введение

Глава 1. Вопросно-ответные системы: принципы построения, проблемы реализации

1.1. Обзор существующих разработок вопросно-ответных систем

1.2. Семантический анализ текста

1.3. Выводы

Глава 2. Математическая модель семантического анализатора русскоязычного текста, основанная на онтосемантических правилах

2.1. Семантическое отношение

2.2. Семантический граф

2.3. Математическая модель семантического анализатора

2.4. Алгоритм работы семантического анализатора

2.5. Выводы

Глава 3. Разработка алгоритмов работы вопросно-ответных систем, основанных на использовании семантического анализатора

3.1. Классификация вопросительных предложений

3.2. Сравнение семантических структур текстов

3.3. Вопросно-ответная система, основанная на прямом сравнении семантических графов

3.4. Вопросно-ответная система, основанная на нечетком сравнении онтосемантических графов

3.5. Выводы

Глава 4. Программная реализация семантического анализатора и ее применение в вопросно-ответных системах

4.1. Программная реализация семантического анализатора

4.2. Применение программной реализации семантического анализатора в вопросно-ответных системах

4.3. Выводы

Заключение

Литература

Приложение А. Свидетельство о гоеударственной регистрации программы для ЭВМ №2015613430

Приложение Б. Свидетельство о гоеударственной регистрации программы для ЭВМ №2016612038

Приложение В. Диплом за лучший доклад на секции

Приложение Г. Certificate of outstanding paper award

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Семантический анализатор русскоязычного текста для вопросно-ответной системы»

Введение

Актуальность темы. В наши дни люди все больше времени тратят на анализ текстов, предположительно содержащих интересующие их факты. С целью сократить это время, разрабатываются различные программные системы, призванные упростить задачу нахождения нужной информации в большом объеме текста. Наиболее предпочтительным для многих пользователей видом извлечения требуемой информации из большого объема текстов является диалог конечного пользователя с вопросно-ответной системой, которой можно задать вопрос на естественном языке без каких-либо специальных ограничений, и получить ответ в такой же естественно-языковой форме.

Создание качественной вопросно-ответной системы и обеспечение свободного доступа к ней позволит значительно сократить время, затрачиваемое на поиск нужной информации в больших объемах текста.

Большинство существующих в настоящее время реализаций вопросно-ответных систем ориентировано на один из самых распространенных языков мира — английский. Самые известные среди англоязычных вопросно-ответных систем — это система Dr. Watson, Lasso, QA-Lasie, TEQUESTA. В настоящее время с этими системами не может конкурировать ни одна русскоязычная вопросно-ответная система. В первую очередь это связано с сильным отставанием российских разработок в области автоматической обработки русскоязычных текстов, по сравнению с их аналогами, ориентированными на английский язык, а также с отставанием в развитие больших открытых русскоязычных онтологий, сравнимых по полноте с лексической базой данных WordNet [106].

В основе любой вопросно-ответной системы лежит машинный анализ текстов. При этом задача разработки семантического анализатора (одна из основополагающих задач автоматической обработки текста), решаемая для русского языка, является как наиболее сложной, так и наименее проработанной задачей из данной области.

Цель диссертационной работы заключается в разработке и программной реализации семантического анализатора русскоязычного текста для вопросно-ответной системы.

Достижение поставленной цели требует решения следующих задач:

1. Разработка математической модели и алгоритма работы семантического анализатора русскоязычного текста;

2. Разработка алгоритмов работы вопросно-ответной системы, использующей результаты работы семантического анализатора;

3. Программная реализация алгоритмов семантического анализатора текста и вопросно-ответной системы, использующей данные такого анализатора.

Методы исследования. В диссертационной работе используются методы математического моделирования, математической логики и искусственного интеллекта. В программной реализации разработанных алгоритмов применяются численные методы и методы прикладного программирования.

Научная новизна. Разработана новая математическая модель семантического анализатора естественно-языкового текста, позволяющая находить семантические отношения в анализируемом тексте с помощью использования онтосемантических правил.

Особенность предлагаемой модели семантического анализа заключается в том, что анализируемый текст, поступающий на вход семантическому анализатору, постепенно сокращается: некоторые части текста в соответствии с онтосе-мантическими правилами, добавляются в очередь с приоритетом на удаление; последовательно из анализируемого текста удаляются части текста, соответствующие элементу очереди с наивысшим приоритетом, этот же элемент удаляется и из очереди. В процессе работы анализатора после изменений текста срабатывают новые правила, которые приводят к обновлению очереди с приоритетом.

Разработанная математическая модель семантического анализатора позволяет в качестве основы своей реализации использовать основанные на правилах экспертные системы, осуществляющие выполнение онтосемантических правил. Так, например, использование экспертной системы Drools 6.5 позволило использовать широкие возможности языка описания правил экспертной системы, а также использовать алгоритм быстрого сопоставления с шаблонами PHREAK и блок логического вывода экспертной системы, что обеспечило повышение функциональных возможностей семантического анализатора и увеличило скорость его работы.

Разработан алгоритм работы вопросно-ответной системы, основанный на результатах работы семантического анализатора, математическая модель которого предлагается в работе. Работа такой системы базируется на нечетком сравнении онтосемантических графов. Результат сравнения онтосемантических графов предлагается представлять в виде величины, называемой коэффициентом схожести этих графов. Алгоритм вычисления этого коэффициента предлагается в диссертационной работе. Предложенный алгоритм работы вопросно-ответной системы позволяет находить ответы в предложениях анализируемого текста, имеющих с вопросительным предложением разную семантическую структуру. При поиске ответа на вопрос учитывается информация из онтологии, что позволяет улучшить качество работы системы.

Теоретическая и практическая значимость. Предложенная в работе модель семантического анализатора русскоязычного текста может использоваться в системах автоматической обработки текстов. Программная реализация вопросно-ответной системы может использоваться как в качестве самостоятельного программного продукта, позволяющего облегчить поиск нужной информации в больших объемах текстовых данных, так и в качестве основы для разработки узкоспециализированной вопросно-ответной системы.

Поддержка научными фондами. Часть результатов диссертационной работы была получена в рамках выполнения исследований при финансовой

поддержке РГНФ (проект №15-04-12029 «Программная разработка электронного ресурса с онлайн-версией русскоязычной вопросно-ответной системы»). Основные положения, выносимые на защиту:

1. Разработана новая математическая модель семантического анализатора, основанная на онтосемантических правилах.

2. Создана база онтосемантических правил, применяемая в работе семантического анализатора, основанного на разработанной модели.

3. Разработан новый алгоритм работы вопросно-ответной системы, основанный на нечетком сравнении онтосемантических графов.

4. Разработаны и реализованы программные комплексы, обеспечивающие работу семантического анализатора и вопросно-ответной системы, использующей результаты работы данного анализатора.

Апробация работы. Основные результаты работы были представлены и обсуждены на следующих научных мероприятиях:

1. Международный конгрессе по интеллектуальным системам и информационным технологиям «AIS-IT». Дивноморское, 2012-2013 гг.

2. Всероссийский конгресс молодых ученых. Санкт-Петербург, ИТМО, 2014-2015 гг.

3. Международная Поспеловская летняя школа-семинар для студентов, магистрантов и аспирантов «Методы и технологии гибридного и синергети-ческого искусственного интеллекта». Светлогорск, 2014 г.

4. VI Международная конференция «Системный анализ и информационные технологии». Светлогорск, 2015 г.

5. International Conference on Knowledge Engineering and Semantic Web (KESW), Москва, 2015 г.

6. V Всероссийский симпозиум «Инфраструктура научных информационных ресурсов и систем». Санкт-Петербург, 2015 г.

7. Artificial Intelligence and Natural Language & Information Extraction, Social Media and Web Search Finnish-Russian University Cooperation in Telecommunications Conference (AINL-ISMW FRUCT), Санкт-Петербург, 2015 г.

8. 18th International Conference on Advanced Communication Technology (ICACT). Republic of Korea, Phoenix Park, 2016 г.

9. Межрегиональная конференция «Теория и практика современных гуманитарных и естественных наук». Петропавловск-Камчатский, 2016 г.

10. 15-th Mexican International Conference on Artificial Intelligence (MICAI), Mexico, Cancun, 2016 г.

11. VIII Международная научная конференция «Прикладная лингвистика в науке и образовании. ALPAC REPORT — полвека после разгрома», Санкт-Петербург, 2016 г.

12. VI Всероссийская конференция «ЗНАНИЯ — ОНТОЛОГИИ — ТЕОРИИ», Новосибирск, 2017 г.

13. Вторая Российско-Тихоокеанская Конференция по Компьютерным Технологиям и Приложениям, Владивосток, 2017 г.

Публикации. Материалы диссертационной работы опубликованы в 21 печатной работе, из них 3 статьи в рецензируемых журналах, рекомендованных ВАК [44,47,54], 4 статьи в изданиях, индексируемом в библиографической базе Scopus [102,105,108,134], три статьи в изданиях, индексируемых в базе Web of Science [105,108,134], 9 статей проиндексировано в РИНЦ [42,44,47,49,54,57,

102,105,134], 3 тезиса конференций [45,51,55], 2 брошюры [19,53]. Получено 2 свидетельства о государственной регистрации программы для ЭВМ [52,56].

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, библиографического списка использованной литературы (134 наименования) и приложений. Имеет общий объем 128 страниц, содержит 22 рисунка и 7 таблиц.

Во введении обосновывается актуальность исследований, проводимых в рамках диссертационной работы, формулируется цель работы, выделяются задачи, которые необходимо решить для достижения поставленной цели, показывается научная новизна и практическая значимость представляемой работы, формулируются положения, выносимые на защиту.

Первая глава имеет обзорный характер. В ней приводится описание общих принципов работы вопросно-ответных систем, делается обзор некоторых наиболее известные англоязычных и русскоязычных вопросно-ответных систем.

Делается вывод, что в настоящее время ни одна из известных русскоязычных вопросно-ответных систем не может конкурировать со своими англоязычными аналогами, что обусловлено сильным отставанием российских разработок в области автоматической обработки русскоязычных текстов, по сравнению с их аналогами, ориентированными на английский язык, а также с отставанием в развитии больших открытых русскоязычных онтологий, сравнимых по полноте с лексической базой данных [106]. Из этого делается вывод, что исследования в области разработки русскоязычной вопросно-ответной системы весьма актуальны на сегодняшний день.

Показывается, что от результатов автоматической обработки текста напрямую зависит качество работы вопросно-ответной системы. А так как семантический анализ является как наиболее сложной, так и наименее проработанной задачей машинного анализа текста, то правомерно утверждать, что разработка семантического анализатора для вопросно-ответной системы является актуальной задачей.

Описываются наиболее известные модели семантического анализа, обосновывается решение о разработке для вопросно-ответной системы математической модели семантического анализатора, относящегося к классу реляционно-ситуационных моделей.

Во второй главе предлагается математическая модель семантического анализатора текста и описывается алгоритм работы анализатора, составленный в соответствии с этой моделью. Особенность предлагаемой модели семантического анализа заключается в том, что анализируемый текст, поступающий на вход семантическому анализатору, постепенно сокращается: некоторые части текста в соответствии с онтосемантическими правилами, добавляются в очередь с приоритетом на удаление; последовательно из анализируемого текста удаляются части текста, соответствующие элементу очереди с наивысшим приоритетом, этот же элемент удаляется и из очереди. В процессе работы анализатора после изменений текста срабатывают новые правила, которые приводят к обновлению очереди с приоритетом.

В третьей главе предлагаются два алгоритма работы вопросно-ответных систем, основанных на результатах работы семантического анализатора, математическая модель которого описана во второй главе, описываются условия, которым должны удовлетворять вопросительные предложения, подаваемые на вход вопросно-ответной системе.

Первый из предлагаемых в этой главе алгоритмов работы вопросно-ответной системы базируется на использовании одного из простых способов сравнения семантических структур текстов: предлагается для каждого предложения анализируемого текста вычислять некую величину, значение которой равно количеству таких семантических отношений, найденных в вопросительном предложении, которые совпадают с семантическими отношениями рассматриваемого предложения анализируемого текста. При этом совпадающими семантическими отношениями считаются отношения с одинаковым именем, аргументы которых либо совпадают, либо являются синонимами. Кроме того, вопросительное предложение

признается достаточно схожим с определенным предложением анализируемого текста (что означает, то, что данное предложение может быть представлено пользователю в качестве ответа) лишь в том случае, если семантическая зависимость «Действие», найденная в вопросительном предложении, совпадает с одноименной семантической зависимостью из анализируемого предложения и (в случае, если вопрос содержит вопросительное слово или словосочетание) если совпадают их семантические зависимости, определяемые вопросительными словами из предложения-вопроса.

Второй из предлагаемых в этой главе алгоритмов работы вопросно-ответной системы базируется на результатах работы разработанного в рамках диссертационной работы алгоритма, осуществляющего нечеткое сравнение семантических структур вопросительного предложения и анализируемого текста. Отличительная особенность предлагаемого алгоритма сравнения семантических структур текстов заключается в том, что сравниваются не просто семантические графы двух текстов, а соответствующие им онтосемантические графы. Под онтосеман-тическим графом в диссертационной работе подразумевается ориентированный граф, вершинами которого являются синтаксемы, выделенные в анализируемом тексте, в совокупности с соответствующей им информацией из онтологии, а именованные дуги определяют название семантических зависимостей, связывающих эти синтаксемы. Направление дуг онтосемантического графа определяет последовательность аргументов таких зависимостей.

В четвертой главе приводятся некоторые детали программной реализации семантического анализатора, математическая модель и алгоритм работы которого описываются во второй главе диссертации. На вход программе поступает естественно-языковой текст, а на выходе программа предоставляет набор семантических отношений, найденных в этом тексте. Описываются детали применения экспертной системы Drools 6.5 [93], используемой для быстрого поиска базовых онтосемантических шаблонов в анализируемом тексте. Приведен развернутый пример пошаговой работы семантического анализатора. Приведенный

пример демонстрирует, как поэтапно сокращается анализируемый текст, как изменяется очередь с приоритетом и какие семантические отношения на каком этапе алгоритма были найдены. Описываются внешние источники данных (словари, онтологии), используемые в программной реализации семантического анализатора и вопросно-ответной системы.

В заключении приводятся основные результаты и выводы диссертационной работы.

13

Глава 1

Вопросно-ответные системы: принципы построения, проблемы реализации

1.1. Обзор существующих разработок вопросно-ответных систем

Большинство существующих в настоящее время реализаций вопросно-ответных систем ориентировано на один из самых распространенных языков мира — английский.

На сегодняшний день одной из самых развитых и известных вопросно-ответных систем является вопросно-ответная система, созданная группой разработчиков фирмы IBM (руководитель группы — David Ferrucci) на суперкомпьютере IBM Watson [95]. В 2011 году Watson принял участие в телепередаче «Jeopardy!» (аналог российской телепередачи «Своя игра»), обыграв двух лучших игроков «Jeopardy!». Выигрыш компьютера составил 1 млн. долларов, в то время, как его соперники-люди получили по 200 и 300 тысяч долларов соответственно. Во время игры система имела доступ к информации (в том числе к полному тексту Википедии) объемом в 4 терабайта.

На первом этапе работы Watson происходит анализ вопросительного предложения: выделяется фокус вопроса, вопрос классифицируется в соответствии с внутренней классификацией Watson. После этого происходит декомпозиция вопроса: при необходимости вопрос разбивается на несколько более простых. Затем системой генерируются гипотезы — фразы из корпуса текстов, которые с некоторой вероятностью могут содержать ответ на заданный пользователем вопрос. Этот корпус состоит из множества всевозможных структурированных и неструктурированных знаний, таких как: учебники, новости, научные статьи и, в том числе, текст Википедии, DBpedia и др. После того, как Watson сгенериро-

вал множество гипотез, часть их отсеивается с помощью «мягкого фильтра», который оставляет только 100 гипотез, наиболее релевантных вопросу. На следующем этапе происходит оценка каждой оставшейся гипотезы на релевантность вопросу. Для этого в системе используются так называемые «доказательства»: в базах знаний ищутся предложения, которые подтвердят гипотезу. Гипотеза встраивается в структуру вопроса и получившееся предложение ищется в базах. Каждая гипотеза получает набор оценок, показывающих насколько конкретная гипотеза соответствует тому или иному доказательству. Каждой такой оценке с помощью статистической модели ставится в соответствие некий коэффициент, показывающий насколько важно для ответа на вопрос данное доказательство (впоследствии этот коэффициент будет использоваться для подсчета уверенности системы в финальном ответе). На следующем этапе с помощью машинного обучения (машинное обучение организовано на корпусе вопросов с известными ответами) происходит выбор единственного ответа, который предоставляется пользователю с величиной, обозначающей степень уверенности машины в правильности ответа. Схематично работа системы Watson представлена на рисунке 1.1 [95].

Рис. 1.1. Схема работы системы Watson [95]. Широкую известность также получила вопросно-ответная система Lasso

[109], которая была разработана в лаборатории компьютерной лингвистики Южного Методического университета, штат Даллас, США. Архитектура системы LASSO состоит из трех основных модулей:

1. модуль обработки вопроса

2. модуль индексации абзацев

3. модуль обработки ответа

Модуль обработки вопроса определяет:

1. тип задаваемого вопроса («what-who», «what-when», «how-long», «how-rich» и т. п.)

2. тип ожидаемого ответа («DATE», «LOCATION», «PERSON» и т. п.)

3. фокус вопроса (фокус вопроса определяется как основная информация, запрашиваемая вопросительным предложением)

Модуль обработки вопроса также определяет ключевые слова запроса, которые должны быть переданы модулю индексации данных (см. Рис. 1.2.)

Для индексации документов в Lasso используется поисковая система Zprise IR System. Также модуль индексации абзацев производит оценку качества найденных абзацев. В случае признания качества удовлетворительным, производится их упорядочивание в соответствии со степенью правдоподобия содержания ответа, в противном случае происходит добавление или удаление некоторых ключевых слов поиска, после чего поиск по обновленному списку ключевых слов возобновляется и система повторно оценивает качество найденных абзацев. Модуль проверки качества абзацев позволяет разумно уменьшить количество текста, передаваемого модулю ответа на вопрос.

С помощью «лексико-семантического анализатора», использующего при анализе словари Gazetteer и WordNet, в системе происходит определение типов

Рис. 1.2. Архитектура вопросно-ответной системы LASSO [109].

сущностей слов анализируемого текста. Ранжирование найденных ответов по релевантности происходит с помощью оценочной функции, которая учитывает такие параметры, как пунктуационные особенности, количество найденных слов и др.

Не менее известна система Шо1&атА1рЬа [131], созданная английским математиком Стивеном Вольфрамом — вопросно-ответная англоязычная система, основная отличительная особенность которой заключается в том, что ответы она не ищет, а вычисляет. Ответы на вопросы пользователей в этой системе формируются посредством обработки уникальной базы данных. Система имеет две версии — бесплатную и платную, которая позволяет конкретизировать ответы.

Также среди современных вопросно-ответных систем стоит отметить систему Qa-Lasie [122], которая была разработана в Шеффилдском университете для участия в конференции ТИ,ЕС QA Тгаск9. Характерной особенностью этой системы является то, что результатом ответа на вопрос, заданный системе на естественном языке, является не набор документов или абзацев, а точный ответ на вопрос, хотя в системе и присутствует возможность просмотреть документ

или набор документов, на базе анализа которых был сформирован точный ответ. Работа QA-LaSIE происходит в следующем порядке (см. рис. 1.3): вопросительное предложение, поступившее на вход программе, направляется поисковой системе OKAPI, которая среди имеющейся у нее проиндексированной коллекций документов выбирает 20 наиболее релевантных запросу.

Вопрос

Рис. 1.3. Архитектура вопросно-ответной системы QA-LaSIE.

Эти документы проходят обработку текстовым фильтром, работа которого нацелена на удаление форматирования текстов передаваемых ему документов таким образом, чтобы устранить возможные проблемы с его пониманием на последующих уровнях обработки документов. Обработанный таким образом набор из 20 документов передается для анализа самой системе QA-LaSIE, в работе которой можно выделить следующие основные этапы:

1. Токенизация — определяет границы различных разделов текста (заголовки, тело текста, разделы, которые не будут учитываться при анализе и т. п.);

2. Определение понятий, состоящих из нескольких слов (на базе словаря Gazetteer): географические названия, названия организаций, имена людей и т. п.;

3. Выделение границ предложений;

4. Определение частей речи (на базе Penn Tree Bank);

5. Морфологический анализ (определяет начальную форму и флексив-ный суффикс для существительных и глаголов);

6. Синтаксический анализатор;

7. Построение единой семантической сети по текстам документов, поданных на вход системе. Единая семантическая сеть призвана дать возможность системе анализировать на релевантность запросу не отдельные предложения текстовых документов, а цельные сущности такой сети.

Проанализировав все сущности каждого предложения из текстов входных документов, система вычисляет степень соответствия запросу для каждой такой сущности. При вычислении степени соответствия сущности запросу, учитывается такие параметры, как удаленность запрашиваемой сущности от предполагаемого ответа в семантической сети, наличие одинаковых сущностей в вопросе и ответе, также учитывается соответствие семантических единиц, связанных в сети с запрашиваемой сущностью и с ответом.

Пять наилучших сущностей, выбранных таким образом, также выводятся при ответе системы на поставленный вопрос.

Еще одна вопросно-ответная система, принявшая участие в TREC QA Track 10 — система TEQUESTA, архитектура которой представлена на рисунке 1.4 [111].

Как и большинство других вопросно-ответных систем, эта система создана на базе поисковой системы (в данном случае использовалась поисковая система FlexIR), но в отличие от QA-LaSIE, система TEQUESTA получает для после-дующиего анализа не 20 документов, наиболее релевантных запросу, а 100. Далее система производит частичный синтаксический анализ текстов найденных документов, в результате чего выделяются группы существительных, прилагательных и глаголов, а для каждой группы выделяется главное слово. Найденные

Рис. 1.4. Архитектура вопросно-ответной системы TEQUESTA [111].

группы формируют основные синтаксические зависимости.

Затем система выделяет в анализируемых текстах именованные сущности, для каждой из которых определяется ее семантический тип (список семантических типов для системы TEQUESTA приведен в Таблице 1.1).

Таблица 1.1. Типы именованных сущностей [111].

Тип Подтип Описание

COMP companies and organizations

NUMERIC MONEY monetary expressions

NUM-RATIO percentages

DATE explicit date

TIME time periods

LOC COUNTRY countries

STATES U.S. states

PROVINCE provinces

CITY cities

PORT harbors

ISLAND islands

PERS male persons

female persons

SMTH other NPs

Некоторые семантические типы (такие как PERS и ЬСО) имеют свои

подтипы. Распознавание типа сущности осуществляется посредством поиска по образцу, также производится поиск в географическом справочнике.

Аналогичным образом в системе анализируется и вопросительное предложение и определяется фокус вопроса. После этого происходит классификация вопроса. Ниже представлен список некоторых классов вопросов, используемых в системе:

1. name — имя лица или объекта в целом (Как звали последнего Русского царя?)

2. pers-def — функция или роль лица (был Джек Лондон?)

3. thing-def — объяснение или определение некоторых объектов ( Что такое осциллограф?)

4. pers-ident — лицо, соответствующее некоторому описанию, выражено в вопросе (Кто открыл Америку?)

5. thing-ident — вещь, соответствующая некоторому описанию, выражена в вопросе (Какая гора является самой высокой в мире?)

6. number — некоторое числовое выражение (Сколько лет длилась первая мировая война?)

7. expand-abbr — полное значение сокращения ( Что такое НКВД?)

8. find-abbr — сокращение для некоторого имени (Какая аббревиатура у Санкт-Петербургского государственного университета аэрокосмического приборостроения?)

9. agent — название или описание живого объекта (Кто нарисовал картиру «Черный квадрат»?)

10. object — объект действия описанного в вопросе (Что открыл Колумб?)

11. known-for — отличительный признак некоторого объекта ( Чем знаменит остров Кижи?)

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Список литературы диссертационного исследования кандидат наук Мочалова Анастасия Викторовна, 2017 год

Литература

1. Автоматическая обработка текста [Электронный ресурс] // Режим доступа: http://www.aot.ru.

2. Александрова, З.Е. Словарь синонимов русского языка: Практ. справочник: ок. 11 000 синоним. рядов. / З.Е. Александрова. 11-е изд., перераб. и доп. -М.: Рус. яз., 2001. - 568 с.

3. Баранов, О.С. Идеографический словарь русского языка / О.С. Баранов. -М., 2002. - 1200 с.

4. Белоногов, Г.Г. Алгоритм морфологического анализа русских слов / Г.Г. Белоногов, Ю.Г. Зеленков // Вопросы информационной теории и практики.

- 1985. - N0 53. - С. 62-93.

5. Белоногов, Г.Г. Об использовании принципа аналогии при автоматической обработке текстовой информации / Г.Г. Белоногов // Проблемы кибернетики. - 1974. - № 28.

6. Богуславский, И.М. Семантический анализ и ответы на вопросы: система в стадии разработки / И.М. Богуславский, В.Г. Диконов, Л.Л. Иомдин, А.В. Лазурский и др. // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Москва, 27-30 мая 2015 г.). Вып. 14 (21): В 2 т. - М.: Изд-во РГГУ, 2015. -Т. 1. - С. 62 - 79.

7. Большаков, И.А. Какие словосочетания следует хранить в словарях? / И.А. Большаков // Труды международного семинара Диалог'2002 по компьютерной лингвистике и ее приложениям. - Протвино: 2002. - Т.2. - С. 61-69.

8. Большой словарь иностранных слов. - Издательство «ИДДК», 2007.

9. Большой толковый словарь русских глаголов: Идеографическое описание. Синонимы. Антонимы. Английские эквиваленты / Под ред. Л. Г. Бабенко.

- М: АСТ-ПРЕСС КНИГА, 2007. - 576 с.

10. Большой толковый словарь русских существительных: Идеографическое описание. Синонимы. Антонимы / Под ред. проф. Л. Г. Бабенко. - М.: АСТ-ПРЕСС КНИГА, 2005. - 864 с.

11. Боярский, К.К. Семантико-синтаксический парсер 8еш8т / К.К. Боярский, Е.А. Каневский // Научно-технический вестник информационных технологий, механики и оптики. - 2015. - Т. 15. - № 5. - С. 869-876.

12. Бурцева, В.В. Словарь наречий и служебных слов русского языка / В.В. Бурцева. - М.: Русский язык - Медиа, 2005. - 760 с.

13. Гельбух, А.Ф. Эффективно реализуемая на ЭВМ модель морфологии флективного естественного языка : автореф. дис. ... канд. техн. наук : 05.13.17 / Гельбух Александр Феликсович. - Москва, 1994. - 24 с.

14. Герд А.С. Предмет и основные направления прикладной лингвистики / Герд А.С. // Прикладное языкознание. - СПб., 1996. - С. 5-14.

15. Добровольский, Д. О. Ассоциативный фразеологический словарь русского языка / Д. О. Добровольский, Ю. Н. Караулов ; Рос. акад. наук, Ин-т рус. яз. - Москва: Помовский и партнеры, 1994 . - 116 с.

16. Ефремова, Т.Ф. Толковый словарь служебных частей речи русского языка

: 15 000 слов. ст. : 22 000 семант. ст. / Т.Ф. Ефремова. - М.: Рус. яз., 2001. -862 с.

17. Загорулько, Ю.А. Система извлечения предметной терминологии из текста на основе лексико-синтаксических шаблонов / Ю.А. Загорулько, Е.А. Сидорова // Труды XIII Международной конференции «Проблемы управления и моделирования в сложных системах». - Самара: Самарский научный центр РАН, 2011. - С. 506-511.

18. Зализняк, А.А. Грамматический словарь русского языка. Словоизменение / А.А. Зализняк. - М.: Русский язык, 1977. - 880 с.

19. Захаров, В.П. Вопросно-ответные системы. Некоторые проблемы автоматической обработки текста / В.П. Захаров, А.В. Мочалова, В.А. Мочалов. -Петрозаводск: ПИН, 2015. - 40 с.

20. Зеленков, Ю.Г. Вероятностная модель снятия морфологической омонимии на основе нормализующих подстановок и позиций соседних слов / Ю.Г. Зеленков, И.В. Сегалович, В.А. Титов // Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара Диалог'2005. - М., 2005. - С. 188-197.

21. Золотова, Г. А. Коммуникативная грамматика русского языка / Г. А. Зо-лотова, Н. К. Онипенко, М. Ю. Сидорова. - М.: Институт русского языка РАН им. В. В. Виноградова, 2004. - 544 с.

22. Золотова, Г.А. Синтаксический словарь: Репертуар элементарных единиц русского синтаксиса / Г. А. Золотова - М.: Наука, 1988. - 439 с.

23. Касевич, В.Б. Структура предложения / В.Б. Касевич // Элементы общей лингвистики. - М.: Наука, 1977. - С. 90-102.

24. Кашкин, Е. В. Семантические роли и сеть конструкций в системе БгашеБапк / Е. В. Кашкин, О. Н. Ляшевская // Труды международной конференции «Диалог 2013». - 2013. - С. 325-343.

25. Корхов, А.В. Метод построения вопросно-ответной системы с использованием математической формализации русского языка / А.В. Корхов // Труды XXXII научной конференции факультета ПМ-ПУ СПбГУ. - СПб., 2001.

26. Корхов, А.В. Построение вопросно-отвветной системы с использованием метода математической формализации естественных языков: дисс. ... канд. физ.-мат. наук: 01.01.09 / Корхов Александр Вадимович. - Спб., 2001. - 133 с.

27. Кретов, А.А. Анализ семантических помет в НКРЯ / А.А. Кретов // Национальный корпус русского языка: 2006 -2008. Новые результаты и перспективы. - СПб.: Нестор-История, 2009. - С. 240-257.

28. Кузнецов, В.А. Распределенная программная реализация упрощенного онтологически-семантического анализатора / В.А. Кузнецов, В.А. Мочалов, А.В. Мочалова // Сборник избранных научных статей. Труды Пятого Всероссийского симпозиума «Инфраструктура научных информационных

ресурсов и систем» (С.-Петербург, 6-8 октября 2015 г.). В 2-х тт. - М.: ВЦ РАН. - 2015. - Т. 1. - С. 97-106.

29. Кулешов, С.В. Вариант архитектуры субпоисковой системы для реализации функции аналитического мониторинга / С.В. Кулешов, С.Н. Михайлов // Труды СПИИРАН. - 2013. - № 8(31). - С. 247-254.

30. Лайонз, Дж. Введение в теоретическую лингвистику, гл.10 / Дж. Лайонз. -М.: Прогресс, 1978. - 544 с.

31. Лапшин, В.А. Вопросно-ответные системы: развитие и перспективы / В.А. Лапшин // Научно-техническая информация. Сер. 2, Информационные процессы и системы. - 2012. - N0 6. - С. 1-9.

32. Лебедев, И.С. Вычисление семантической составляющей текстовой информации в экономических информационных системах / И.С. Лебедев // Прикладная информатика. - 2008. - № 5(17). - С. 81-91.

33. Лебедев, И.С. Построение семантически связанных информационных объектов текста / И.С. Лебедев // Прикладная информатика. - 2007. - С. 54-61.

34. Леонтьева, Н.Н. Категоризация единиц в русском общесемантическом словаре (РОСС) / Н.Н. Леонтьева // Труды Международного семинара Диа-лог'98 по компьютерной лингвистике и ее приложениям. - 1998. - Т.2. - С. 519-532.

35. Лингвистическая онтология «Тезаурус РуТез» [Электронный ресурс] // Режим доступа: http://www.labinform.ru/pub/ruthes/index.htm.

36. Лингвистический энциклопедический словарь / Под ред. В. Н. Ярцевой; Ин-т языкознания АН СССР. - М.: Сов. энцикл., 1990. - 682 с.

37. Лукашевич, Н.В. Тезаурусы в задачах информационного поиска / Н.В.Лукашевич. - М.: Изд-во Московского университета, 2011. - 512 с.

38. Ляшевская, О. Н. Автоматизация построения словаря на материале массива несловарных словоформ / О. Н. Ляшевская, Д. В. Сичинава, Б. П .Кобрицов // Интернет-математика: сб. работ участников конкурса науч. проектов по

информ. поиску, (отв. ред. Браславский П. И.). - Екатеринбург: Изд-во Урал. ун-та. - 2007. - С. 118-125.

39. Мельчук, И.А. Опыт теории лингвистических моделей «Смысл-Текст» / И.А. Мельчук. - М.: Языки русской культуры, 1999. - 346 с.

40. Мельчук, И.А. Толково-комбинаторный словарь современного русского языка. Опыты семантико-синтаксического описания русской лексики / И.А. Мельчук, А.К. Жолковский. - Вена, 1984. - 992 с.

41. Мозговой, М.В. Простая вопросно-ответная система на основе семантического анализатора русского языка / М.В. Мозговой // Вестник СПб университета. - 2005. - сер. 10. - вып. 1. - С. 116-122.

42. Мочалов, В.А. Некоторые вопросы применения открытых систем распределенных вычислений и обработки больших данных. / В.А. Мочалов, А.В. Мочалова, Н.Н. Никитина, А.А. Шутов, А.А. Маряхина // Сборник избранных научных статей. Труды Пятого Всероссийского симпозиума «Инфраструктура научных информационных ресурсов и систем» (С.-Петербург, 6-8 октября 2015 г.). В 2-х тт. - М.: ВЦ РАН, 2015. - Т.1. - С. 61-72.

43. Мочалова, А.В. Автоматизация создания базы фактов с помощью семантического анализатора / А.В. Мочалова // Труды международного конгресса по интеллектуальным системам и информационным технологиям «АК-1Т'13».- Научное изд. в 4-х тт. - М.:Изд-во Физматлит, 2013. - С. 352-359.

44. Мочалова, А.В. Алгоритм семантического анализа текста, основанный на базовых семантических шаблонах с удалением / А.В. Мочалова // Научно-технический вестник информационных технологий, механики и оптики. - 2014.- № 5. - С. 126 -132.

45. Мочалова, А.В. Архитектура и программная реализация вопросно-ответной системы, использующей данные из онтологии [Электронный ресурс] / А.В. Мочалова // Сборник тезисов докладов конгресса молодых ученых. - СПб: Университет ИТМО, 2015. - Режим доступа: http://kmu.ifmo.ru/collections_article/896/arhitektura-

_i_programmnaya_realizaciya_voprosno-otvetnoy_sistemy,-_ispolzuyuschey_dannye_iz_ontologii.htm.

46. Мочалова, А.В. Вопросно-ответная система, основанная на сравнении семантических графов / А.В. Мочалова // Сборник избранных научных статей. Труды Пятого Всероссийского симпозиума (С.-Петербург, 6-8 октября 2015 г.). В 2-х тт. - М.: ВЦ РАН. - 2015. - Т.1. - С. 126-137.

47. Мочалова, А.В. Интеллектуальная вопросно-ответная система / А.В. Мочалова, В.А. Мочалов // Информационные технологии. - 2011.- № 5. - С. 6-12.

48. Мочалова, А.В. Лингвистические переменные в вопросно-ответных системах / А.В. Мочалова // Труды 1-ой Международной Поспеловской летней школы-семинара для студентов, магистрантов и аспирантов «Методы и технологии гибридного и синергетического искусственного интеллекта». Светлогорск. - 2014. - С. 190-197.

49. Мочалова, А.В. Модификация онтологии с помощью базовых онто-семанти-ческих правил, содержащих глаголы / А.В. Мочалова // Теория и практика современных гуманитарных и естественных наук. Выпуск 6. Часть II: сборник научных статей ежегодной межрегиональной научно-практической конференции, Петропавловск-Камчатский, 08-12 февраля 2016 г. - Петропавловск-Камчатский: КамГУ им. Витуса Беринга, 2016. - С. 192-197.

50. Мочалова, А.В. Некоторые вопросы работы русскоязычной вопросно-ответной системы, использующей данные из онтологии / А.В. Мочалова // Труды Шестой международной конференции «Системный анализ и информационные технологии»: САИТ 2015 (15-20 июня 2015, г. Светлогорск, Россия). - Изд. Балтийского федерального университета им. И. Канта, 2015. - Т. 1.- С. 190-197.

51. Мочалова, А.В. Проблемы создания интеллектуальных русскоязычных вопросно-ответных систем и их интеграция с онтологиями / А.В. Мочалова // Сборник тезисов докладов конгресса молодых ученых, Выпуск 3. - СПб:

Университет ИТМО, 2014. - С. 19-20.

52. Мочалова, А.В. Программа семантического анализа текста, основанная на базовых семантических шаблонах с удалением / А.В. Мочалова // Свидетельство о государственной регистрации программы для ЭВМ № 2015613430 от 28.01.2015.

53. Мочалова, А.В. Семантический анализ. Некоторые проблемы автоматической обработки текста / А.В. Мочалова, В.П. Захаров, В.А. Кузнецов, В.А. Мочалов. - Петрозаводск: ПИН, 2016. - 60 с.

54. Мочалова, А.В. Создание и пополнение терминологических систем с помощью семантического анализатора / А.В. Мочалова // Ученые записки ПетрГУ. Серия: Естественные и технические науки. - 2015. - № 4 (149). -C. 122-129.

55. Мочалова, А.В. Функции для работы с онтологией, интегрированной с вопросно-ответной системой [Электронный ресурс] / А.В. Мочалова // Сборник тезисов докладов конгресса молодых ученых. СПб: Университет ИТМО. - 2015. - Режим доступа: http://kmu.ifmo.ru/collections_article/1744/funkcii_dlya_raboty_s_ontologi ey,_integrirovannoy_s_voprosno-otvetnoy_sistemoy.htm.

56. Мочалова, А.В. Экспертная система для поиска семантических отношений в русскоязычном тексте с помощью базовых семантических правил с удалением / А.В. Мочалова // Свидетельство о государственной регистрации программы для ЭВМ № 2016612038 от 17.02.2016.

57. Мочалова, А.В. Язык описания онтологически-семантических правил для вопросно-ответной системы / А.В.Мочалова, В.А.Мочалов // Труды VIII Международной научной конференции «Прикладная лингвистика в науке и образовании. ALPAC REPORT - полвека после разгрома». 24-26 ноября 2016. г., Санкт-Петербург. - Санкт-Петербург: РГПУ им. А.И. Герцена, 2016. - С. 73 - 79.

58. Ожегов, С.И. Толковый словарь русского языка [Текст]: ок. 100 000 слов,

терминов и фразеологических выражений / С.И. Ожегов; ред. Л. И. Скворцов. 27-е изд., испр. - М.: Астрель, 2012.

59. Ожегов, С.И. Толковый словарь русского языка. 4-е изд., доп. / С.И. Ожегов, Н.Ю. Шведова. - М.: Азбуковник, 1997. - 944 с.

60. Осипов, Г.С. Ехас^ — система интеллектуального метапоиска в сети Интернет / Г.С. Осипов, И.А. Тихомиров, И.В. Смирнов // Труды десятой национальной конференции по искусственному интеллекту с международным участием КИИ - 2006. - М: Физматлит, 2006. - Т. 3. - С. 859 - 866.

61. Осипов, Г.С. Реляционно-ситуационный метод поиска и анализа текстов и его приложения / Г.С. Осипов, И.В. Смирнов, И.А. Тихомиров // Искусственный интеллект и принятие решений. - 2008. - № 2. - С. 3-10.

62. Парти, Б. Формальная семантика как порождение лингвистики и философии. Лекция. 2012. [Электронный ресурс] / Б. Парти // Режим доступа: http://polit.ru/article/2012/05/18/Partee/.

63. Поисковая система Exactus [Электронный ресурс] // Режим доступа: http://exactus.ru/.

64. Поспелов, Д.А. Десять горячих точек в исследованиях по искусственному интеллекту / Д.А. Поспелов // Интеллектуальные системы (МГУ). - 1996. - Т. 1. - № 1-4. - С. 47-56.

65. Рабчевский, Е.А. Автоматическое построение онтологий на основе лексико-синтаксических шаблонов для информационного поиска / Е.А. Рабчевский // Труды 11-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» -КОБЬ 2009. - Петрозаводск, 2009. - С. 69-77.

66. Рубашкин, В.Ш. Онтологическая семантика: Знания. Онтологии. Онтологически ориентированные методы информационного анализа текстов / В.Ш. Рубашкин. - М.: ФИЗМАТЛИТ, 2012. - 346 с.

67. Сайт лаборатории Компьютерной лингвистики ИППИ РАН [Электронный ресурс] // режим доступа: http://iitp.ru/ru/researchlabs/245.htm.

68. Святогор, Л. Семантический анализ текстов естественного языка: цели и средства [Электронный ресурс] / Л. Святогор, В. Гладун // Режим доступа: http://www.foibg.com/ibs_isc/ibs-09/ibs-09-p06.pdf.

69. Семенова, С.Ю. Семантические поля словаря РОСС: опыт заполнения, анализ дескриптивных возможностей. (Материалы к унификации словарных описаний) / С.Ю. Семенова // Труды Международного семинара Диалог'2000 по компьютерной лингвистике и ее приложениям. - Протвино, 2000. - Т.2. - С.308-316.

70. Смысловой анализатор TextAnalyst [Электронный ресурс] // Режим доступа: http://www.analyst.ru.

71. Сокирко, А. В. Быстрословарь: предсказание морфологии русских слов с использованием больших лингвистических ресурсов / А. В. Сокирко // Труды международной конференции «Диалог-2010. Компьютерная лингвистика и интеллектуальные технологии». Вып. 9 (16). - М.: Изд-во РГГУ, 2010. - С. 450-456.

72. Сокирко, А.В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ): дис. ... канд. техн. наук: 05.13.17 / Сокирко Алексей Викторович. - М., 2001. - 120 а

73. Соловьев, А.А. Кто виноват и где собака зарыта? Метод валидации ответов на основе неточного сравнения семантических графов в вопросно-ответной системе / А.А. Соловьев // Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП 2010. - Казань, 2010. - С. 125 -141.

74. Тестелец, Я.Г. Введение в общий синтаксис / Я.Г. Тестелец. - М.: Издательство РГГУ, 2001. - 798 с.

75. Тихомиров, И.А. Особенности поискового алгоритма и архитектуры Exactus / И.А. Тихомиров // Труды российского семинара по оценке методов информационного поиска РОМИП'2007. - Санкт-Петербург: НУ ЦСИ, 2007. - С. 193-198.

76. Тихомиров, И.А. Вопросно-ответный поиск в интеллектуальной поисковой системе Exactus / И.А. Тихомиров // Труды четвертого российского семинара по оценке методов информационного поиска РОМИП'2006. -Санкт-Петербург: НУ ЦСИ, 2006. - С. 80-85.

77. Тихомиров, И.А. Интеграция лингвистических и статистических методов поиска в поисковой машине Exactus / И.А. Тихомиров, И.В. Смирнов // Труды международной конференции Диалог'2008. - 2008. - С. 485 - 491.

78. Тузов, В.А. Компьютерная семантика русского языка / В.А. Тузов. - СПб.: Изд-во С.-Петерб. ун-та, 2004. - 400 с.

79. Тузов, В.А. Математическая модель языка / В.А. Тузов. - Л.: Изд-во Ленингр. ун-та, 1984. - 176 с.

80. Урюпина, О. Автоматическое разбиение текста на предложения для русского языка / О. Урюпина // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 4-8 июня 2008 г.). - М.: РГГУ, 2008. - Вып. 7 (14). - О. 539-544.

81. Филлмор, Ч. Дело о падеже / Ч. Филлмор // Новое в зарубежной лингвистике. - М.: Прогресс, 1981. - Вып. X. - С. 369-495.

82. Филлмор, Ч. Дело о падеже открывается вновь / Ч. Филлмор // Новое в зарубежной лингвистике. - М.: Прогресс, 1981. - Вып. X. - С. 496 -530.

83. Чапайкина, Н.Е. Семантический анализ текстов. Основные положения / Н.Е. Чапайкина // Молодой ученый. - 2012. - №5. - С. 112-115.

84. Чубинидзе, К.А. Метод синтаксико-семантических шаблонов и его применение в информационной технологии интерпретации текстов: дис. ... канд. техн. наук: 05.25.05 / Чубинидзе Константин Александрович. - М., 2006. -156 ^

85. Шелманов, А.О. Исследование методов автоматического анализа текстов и разработка интегрированной системы семантико-синтаксического анализа: дис. ... канд. техн. наук: 05.13.17 / Шелманов Артем Олегович. - М., 2015.

- 210 с.

86. Яблонский, С.В. Введение в дискретную математику / С.В. Яблонский. -М.: Высш. шк., 2003. - 384 с.

87. Apache Jena [Электронный ресурс] // Режим доступа: https://jena.apache.org/.

88. Cai, L. Large-scale question classification in cQA by leveaaging wikipedia semantic knowledge / L. Cai, G. Zhou, K. Liu et al. // In: Proceedings of ACM CIKM. - ACM, New York, 2011. - P. 1321-1330.

89. Choi, J. D. Transition-based semantic role labeling using predicate argument clustering / J. D. Choi, M. Palmer // Proceedings of the ACL 2011 Workshop on Relational Models of Semantics. - Association for Computational Linguistics, 2011. - P. 37-45.

90. Chomsky, N. Syntactic structures / N. Chomsky. - Mouton, The Hague, 1957. -117 p.

91. Dali, L. Question answering based on semantic graphs / L. Dali, D. Rusu, B. Fortuna, D. Mladenic, M. Grobelnik // Proceedings of the workshop on semantic search (sem-search 2009). - 2009.

92. Downey A.B. Think Python: How to think like computer scientist / A.B. Downey. - O'Reilly Media, 2012. - 300 p.

93. Drools [Электронный ресурс] // Режим доступа: http://www.drools.org/.

94. Fayyad, U. From Data Mining to knowledge discovery: An overview / U. Fayyad, G. Piatetsky-Shapiro, P. Smyth // Advances in Knowledge Discovery and Data Mining, AAAI. - MIT Press, Cambridge, MA, 1996. - P. 1-34.

95. Ferrucci, D.A. Building Watson: An overview of the DeepQA project / D.A. Ferrucci, E.W. Brown, J. Chu-Carroll et al. // AI Magazine. - 2010. - Vol 31. -No 3. - P. 59-79.

96. Gildea, D. Automatic labeling of semantic roles / D. Gildea, D. Jurafsky // Computational Linguistics. - 2002. - Vol. 28. - no. 3. - P. 245-288.

97. Graesser, A. Question asking during tutoring / A. Graesser, N.K. Person //

American Educational Research Journal. - 1994. - No 31. - P. 104-137.

98. Han, D. QA system metis based on web searching and semantic graph matching / D. Han, Y. Kato, K. Takehara et al. // IFIP International Federation for Information Processing, Volume 228, Intelligent Information Processing III, eds. Z. Shi, Shimohara K., Feng D. - Boston: Springer, 2006. - P. 123-133.

99. Hearst, M.A. Automatic acquisition of hyponyms from large text corpora / M.A. Hearst // In In Proceedings of the 14th International Conference on Computational Linguistics(COLING 1992). - 1992. - P. 539-545.

100. Huang, Z. Question Classification using Head Words and Their Hyperonims / Z. Huang, M. Thint, Z. Qin // In: EMNLP. - 2008. - P. 927-936

101. Joon-Ho, L. Semantic role labeling using maximum entropy model / Joon-Ho Lim, Young-Sook Hwang, So-Young Park, Hae-Chang Rim // Proceedings of CoNLL. - 2004. - P. 122-125.

102. Kuznetsov, V.A. Ontological-semantic text analysis and the question answering system using data from ontology / V.A. Kuznetsov, V.A. Mochalov, A.V. Mochalova // ICACT Transactions on Advanced Communications Technology (TACT). - 2015. - Vol. 4, Issue 4. - P. 651-658.

103. Laokulrat, N. A survey on question classification techniques for question answering / N. Laokulrat // KMITL Inf. Technol. J. - 2013. - Vol. 2. - № 1.

104. Lehnert, W. The Process of Question Answering : PhD Dissertation / W. Lehnert. guc. - Research report. No. 88. — Yale University, 1977.

105. Mikhailova, V. Uncovering semantic relations conveyed by Russian prepositions. / V. Mikhailova, A. Mochalova, V. Mochalov, V. Zakharov // Proceedings, The IEEE 18th International Conference on Advanced Communication Technology, ICACT 2016, Phoenix Park, Korea. - 2016. - P. 459-465.

106. Miller, G.A. WordNet: A lexical database for English / G.A. Miller // Communications of the ACM. - 1995. - Vol. 38. - № 1. - P. 39-41.

107. Mochalova, A. Search for answers in ontological-semantic graph / A. Mochalova // Proceedings of the AINL-ISMW FRUCT, Saint-Petersburg, Russia, 9-14

November 2015, ITMO University. - 2015. - P. 174-180.

108. Mochalova, A.V. Mathematical model of an ontological-semantic analyzer using basic ontological-semantic patterns / A.V.Mochalova, V.A.Mochalov // Lecture Notes in Artificial Intelligence, Proceedings of 15th Mexican International Conference on Artificial Intelligence. - 2016. - P. 53-66.

109. Moldovan, D. Lasso: A Tool for Surng the Answer Net / D. Moldovan et al. // TREC-8. - 1999. - P. 175-183.

110. Montague, R. The proper treatment of quantification in ordinary English / R. Montague // Approaches to Natural Language - Ed. by K. J. J. Hintikka, J. Moravcsic, P. Suppes. - Springer, 1973. - P. 221-242.

111. Monz, Cr. Tequesta: The University of Amsterdam's Textual Question-Answering System / C. Monz, M. de Rijke // TREC. - NIST Special Publication SP, 2001.

112. MyStem — Программа морфологического анализа текста на русском языке [Электронный ресурс] // Режим доступа: http://api.yandex.ru/mystem.

113. Nadeau, D. A survey of named entity recognition and classification / D. Nadeau, S .Sekine // Lingvisticae Investigationes. - 2077. - Vol. 30. - № 1. - P. 3-26.

114. Narayanan, S. Question answering based on semantic structures / S. Narayanan, S. Harabagiu //In Proceedings of the International Conference on Computational Linguistics (COLING). - 2004. - P. 693-701.

115. Osipov, G.S. Linguistic Knowledge for Search Relevance Improvement / G.S. Osipov, I.V. Smirnov, I.A. Tikhomirov et al. // Papers of Joint conference on knowledge-based software engineering JCKBSE'06. - IOS Press, 2006. - P. 294 - 302.

116. Palitrumlab [Электронный ресурс] // Режим доступа: http://palitrumlab.ru/?page_id=18.

117. Panyakanok, V. Natural language interface via dependency tree mapping: An application to question answering / V. Panyakanok, D. Roth, W. Yih //AI and Math. - 2004. - January. - P. 22-34.

118. Reynar, J.C. A Maximum Entropy Approach to Identifying Sentence Boundaries / J.C. Reynar, A. Ratnaparkhi // Proceedings of ANLP. - 1997. - P. 16-19.

119. Roberts, K. Annotating question types for consumer health questions / K. Roberts, K. Masterton, M. Fiszman et al. // In: LREC Workshop on Building and Evaluating Resources for Health and Biomedical Text Processing. - 2014.

120. Sanders, A. Grammar, Theories / A. Sanders // Encyclopaedia of Linguistics. -New York, Oxon: Fitzroy Dearborn, 2005. - С. 397-401.

121. Schlaefer, N. A Semantic Approach to Question Answering / N. Schlaefer . -Paperback, 2007. - 96 p.

122. Scott, S. QA-LaSIE: A Natural Language Question Answering System / S. Scott, R. Gaizauskas // Proceedings of the 14th Biennial Conference of the Canadian Society on Computational Studies of Intelligence. - 2001. - P. 172-182.

123. SPARQL Query Language for RDF [Электронный ресурс] // Режим доступа: https://www.w3.org/TR/rdf-sparql-query/.

124. Shallow semantic parsing using support vector machines / Sameer S Pradhan, Wayne H Ward, Kadri Hacioglu et al. // HLT-NAACL 2004: Main Proceedings.

- Association for Computational Linguistics, 2004. - P. 233-240.

125. Shelmanov, A. O. Methods for semantic role labeling of Russian texts / A. O. Shelmanov, I. V. Smirnov // Computational Linguistics and Intellectual Technologies. Papers from the Annual International Conference «Dialogue» (2014). - 2014. - № 13. - P. 607-620.

126. Shen, D. Using Semantic Roles to Improve Question Answering / D. Shen, M. Lapata // Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, Prague, June 2007. - 2007. - P. 12-21.

127. Stevenson, M. Experiments on Sentence Boundary Detection / M. Stevenson, R. Gaizauskas // Proceedings of ANLP-NAACL, Stroudsburg, PA, USA - 2000.

- P. 84-89.

128. Sundblad, H. Question classification in question answering systems : Ph. D.

thesis / Sundblad, H. дис. - Linkopings universitet, Department of Computer and Information Science. - 2007.

129. Tesniere, L. Elements de syntaxe structurale / L. Tesniere. - Editions Klincksieck, 1959. - 670 p.

130. Wang, R. Using Recognizing Textual Entailment as a Core Engine for Answer Validation / R. Wang, G. Neumann // Working Notes for the CLEF 2008 Workshop, 2008. - Springer, Heidelberg, 2008. - Vol. 5152. - P. 387-390.

131. WolframAlpha [Электронный ресурс] // Режим доступа:

http://www.wolframalpha.com/.

132. Xue, N. Calibrating features for semantic role labeling / N. Xue, M. Palmer // Proceedings of EMNLP 2004. - Association for Computational Linguistics, 2004. - P. 88-94.

133. Yahya, M. Natural language questions for the web of data / M. Yahya, K. Berberich, S. Elbassuoni et al. // EMNLP-CoNLL '12 Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. - 2012. - P. 379-390.

134. Zakharov, V.P. Ontology Modification Using Ontological-Semantic Rules / V.P.Zakharov, A.V.Mochalova, V.A.Mochalov// ICACT Transactions on Advanced Communications Technology (TACT). - 2016. - Vol. 5, Issue 5. - P. 902-906.

125

Приложение А

Свидетельство о гоеударственной регистрации программы для ЭВМ №2015613430

Приложение Б

Свидетельство о гоеударственной регистрации программы для ЭВМ №2016612038

127

Приложение В

Диплом за лучший доклад на секции

Диплом за лучший доклад на секции «Интеллектуальные системы в гуманитарной сфере» III Всероссийского конгресса молодых ученых (Санкт-Петербург, ИТМО, 2014 г.;

128

Приложение Г Certificate of outstanding paper award

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.