Исследование и разработка информационно-аналитической системы получения релевантных данных и знаний в сети интернет тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Толкачев, Демид Максимович

  • Толкачев, Демид Максимович
  • кандидат науккандидат наук
  • 2015, Краснодар
  • Специальность ВАК РФ05.13.01
  • Количество страниц 149
Толкачев, Демид Максимович. Исследование и разработка информационно-аналитической системы получения релевантных данных и знаний в сети интернет: дис. кандидат наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Краснодар. 2015. 149 с.

Оглавление диссертации кандидат наук Толкачев, Демид Максимович

СОДЕРЖАНИЕ

Список сокращений

Введение

ГЛАВА 1 АНАЛИТИЧЕСКИЙ ОБЗОР ПОДХОДОВ К ПОИСКУ РЕЛЕВАНТНОЙ ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

1.1 Современное состояние вопросов информационного поиска

1.2 Автоматический анализ неструктурированной информации

1.3 Web Content Mining как метод получения данных и знаний

1.4 Проблемы автоматического получения ответов на вопрос

1.5 Выводы

ГЛАВА 2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ПОЛУЧЕНИЯ ДАННЫХ И ЗНАНИЙ ИЗ ТЕКСТА

2.1 Методика проблемно-ориентированного автореферирования

2.2 Поиск семантических связей между предложениями

2.3 Методические положения по агрегации информации из различных источников и определению смыслового подобия

2.4 Поиск ответов на вопросы

2.5 Выводы

ГЛАВА 3 АЛГОРИТМЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ТЕКСТА

3.1 Проблемно-ориентированное автореферирование

3.2 Обеспечение семантической связности текста

3.3 Автоматическая оценка смыслового подобия текстов

3.4 Алгоритмы поиска ответов на вопросы

3.5 Выводы

ГЛАВА 4 ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ И ОЦЕНКА ЕЁ ЭФФЕКТИВНОСТИ

4.1 Реализация информационно-аналитической системы в виде программного комплекса

4.2 Оценка эффективности информационно-аналитической системы

4.3 Использование разработанных теоретических и практических аспектов в

системах поддержки принятия решений

4.4 Выводы

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЕ А

ПРИЛОЖЕНИЕ Б

СПИСОК СОКРАЩЕНИЙ

ПОА - проблемно-ориентированное автореферирование

СППР - система поддержки принятия решений

ИАС - информационно-аналитическая система

НКА - недетерминированный конечный автомат

ЛПР - лицо, принимающее решения

ИА - интегрированный автореферат

ПВ - пользовательский вопрос

УСД - универсальный словарь действий

СПВ - синонимы слов из пользовательского вопроса

ТС - тематический словарь

ИИСИ - извлечение информации из слабоструктурированных источников

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Исследование и разработка информационно-аналитической системы получения релевантных данных и знаний в сети интернет»

ВВЕДЕНИЕ

Актуальность работы.

Для эффективного принятия любых управленческих решений необходимо наличие достаточного объёма данных и знаний, касающихся решаемой проблемы. Лицо, принимающее решения (ЛПР), может не обладать всеми необходимыми сведениями, поэтому в качестве одного из источников актуальной информации часто используют сеть Интернет, чья роль в современном обществе неуклонно возрастает.

Успехи в теории веб-поиска привели к появлению и стремительному развитию ряда поисковых систем. Современные поисковые системы способны находить миллионы документов по запросу пользователя и ранжировать их в соответствии с их релевантностью по отношению к запросу.

Однако зачастую пользователю необходимо получить не документы или сайты, а конкретный ответ на вопрос. Несмотря на имеющиеся успехи, существующие поисковые и специализированные вопросно-ответные системы ещё не могут вести полноценный диалог с пользователем и не всегда находят именно те сведения, которые ему необходимы. И если классический веб-поиск, предполагающий выдачу ссылок на источники с информацией, развит очень глубоко, то в области интеллектуального веб-поиска, осуществляющего анализ информации и выдающего ту её часть, которая наиболее полно соответствует ожиданиям пользователя, остался ряд нерешённых проблем.

Таким образом, получение прямых и точных ответов на вопросы с использованием сети Интернет является актуальным направлением развития информационных технологий.

Целью исследования является разработка методов и алгоритмов извлечения релевантных данных и знаний для практической реализации вопросно-ответной системы в сети Интернет.

Объектом исследования является информационно-аналитическая система получения релевантных данных и знаний в сети Интернет.

Предметом исследования выступают методические положения и алгоритмы получения релевантных данных и знаний в сети Интернет.

Методы исследования.

В качестве методов исследования использовались системный анализ, теория информации, теория алгоритмов, алгебра логики, теория множеств, сравнительный анализ, методы интеллектуального анализа данных и методы разработки программного обеспечения и баз данных.

Научная новизна работы. В результате проведенного в работе системного исследования достигнуты следующие новые научные результаты:

1. Разработаны методические положения и алгоритм проблемно-ориентированного автореферирования веб-страниц с использованием интеллектуального анализа данных для усовершенствования выделения основных сведений по вопросу.

2. Созданы методика и алгоритм поиска семантических связей между предложениями при автореферировании на основе шаблонов в виде регулярных выражений с целью обеспечения увеличения смысловой связности генерируемых авторефератов.

3. Разработана методика автоматической оценки смыслового подобия текстов на основе критериев семантической близости с целью увеличения точности выявления дублирующих друг друга по смыслу положений в тексте.

4. Разработано алгоритмическое обеспечение методов составления интегрированных авторефератов из нескольких источников с помощью методики оценки смыслового подобия.

5. Разработан с использованием механизма тернарных выражений и адаптирован для русского языка алгоритм поиска ответов на вопрос в сети Интернет, повышающий точность и полноту автоматического получения ответов.

Основные положения, выносимые на защиту:

1. Методика и алгоритм проблемно-ориентированного автореферирования.

2. Методика построения правил для выявления местоименных анафор, организации логических связей и вводных слов.

3. Алгоритм составления интегрированных авторефератов из нескольких источников.

4. Методика автоматической оценки смыслового подобия текстов.

5. Алгоритм поиска ответов на вопрос в сети Интернет.

Практическая значимость

Практическая ценность работы заключается в разработке новой технологии автоматического поиска ответов на вопрос и её реализации в виде программного комплекса. Его использование позволит упростить и ускорить процесс поиска правильных ответов на вопросы в сети Интернет по сравнению с применением традиционных поисковых систем. Также создаваемый в рамках работы программный комплекс может быть использован в системах поддержки принятия решений, в том числе в составе ситуационных центров различного уровня.

Реализация и внедрение работы.

Результаты работы используются в функционировании Центра коллективного пользования Кубанского государственного технологического университета (КубГТУ) «Исследовательский центр компьютерных технологий, систем управления и комплексной безопасности» и внедрены в учебный процесс кафедры компьютерных технологий и информационной безопасности КубГТУ, о чём свидетельствуют два акта о внедрении.

Апробация работы.

Основные положения диссертации докладывались и обсуждались на конференциях:

1. XIV Международная научно-практическая конференция «Наука вчера, сегодня, завтра», г. Новосибирск.

2. XXVII Международная заочная научно-практическая конференция «Научная дискуссия: инновации в современном мире», г. Москва.

3. XXXVII Международная научно-практическая конференция «Технические науки - от теории к практике», г. Новосибирск.

4. XXXVI Международная научно-практическая конференция «Инновации в науке», г. Новосибирск.

Публикации. По теме диссертации опубликовано 9 печатных работ, в том числе 3 в изданиях, рекомендованных ВАК РФ для публикации основных результатов диссертационных исследований. Получены свидетельства о государственной регистрации 5 программ для ЭВМ.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырёх глав, выводов по каждой главе, основных результатов, списка используемой литературы и приложений. Общий объём работы составляет 149 страниц машинописного текста. Основная часть диссертации изложена на 132 листах, содержит 28 рисунков. Список используемой литературы содержит 126 наименований.

ГЛАВА 1 АНАЛИТИЧЕСКИЙ ОБЗОР ПОДХОДОВ К ПОИСКУ РЕЛЕВАНТНОЙ ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

1.1 Современное состояние вопросов информационного поиска

Поиск информации - это процесс извлечения хранимой информации, удовлетворяющей информационные потребности, то есть являющейся релевантной [1], [2].

Релевантная информация - та информация, которая необходима для решения некоторой конкретной задачи (например, задачи управления) [3].

Существуют различные методы поиска информации. На основе источников [1] и [2] можно составить следующую их классификацию (рисунок 1.1).

Рисунок 1.1- Методы поиска информации

Сеть Интернет отличается значительным масштабом, слабой координацией при её создании, а также большим числом работающих с ней лиц. В настоящее объём информации в Интернете продолжает быстро расти [4], [5].

Информация в сети Интернет хранится в виде И1:т1-документов, текстовых и мультимедийных файлов, записях в базах данных, фото-, аудио- и видеоматериалов. Пользователи сети могут получать доступ к этой информации посредством просмотра веб-страниц, на которых происходит агрегация определённого объёма хранимой информации.

В сети Интернет также существуют различные методы поиска информации. На основе источников [1], [6], [7] и [8] можно составить следующую их классификацию (рисунок 1.2).

Рисунок 1.2 - Методы поиска информации в сети Интернет

В связи с объёмом сети Интернет ручной поиск в ней используется лишь тогда, когда пользователь точно знает, где находится интересующая его информация. В зависимости от задач и квалификации пользователя обычно применяются те или иные автоматизированные методы.

Поисковые системы представляют собой основу для автоматизированного поиска информации в сети Интернет. Другие методы автоматизированного поиска в определённой степени основаны на использовании поисковых систем. Те же, в свою очередь, для поиска информации применяют методы машинного

обучения, анализа мультимедийной информации, компьютерную лингвистику, геоинформационные сервисы, исследуют психологию пользователей и их социальные связи, удобство интерфейсов и т.д. [1].

Автоматизированный поиск информации в сети Интернет с помощью поисковых систем называют также веб-поиском. Особенностями веб-поиска выступают необходимость сбора документов для индексации, способность создавать системы, эффективно работающие с большими массивами информации, а также учёт нюансов веба, таких как использование гипертекста [1].

Представим схему поисковой системы, осуществляющей веб-поиск (рисунок 1.3).

Рисунок 1.3 - Общая схема поисковой системы в сети Интернет

Веб-поиск осуществляется на основе индексации. Основой её механизма является создание так называемого инвертированного индекса [1]. При осуществлении поиска по запросу пользователя непосредственно операции сравнения производятся в рамках индекса, обращение же к самим документам, размещённым в сети, происходит при «обходе веба» - сборе страниц в сети Интернет для их дальнейшего индексирования и поддержки функционирования поисковой системы. Обход веба осуществляют поисковые роботы - специальные про-

граммы, извлекающие текст из веб-страниц и способные переходить по гиперссылкам [9].

На протяжении последних лет технологии индексирования и функционирования поисковых роботов существенно усовершенствовались, в данной области было опубликовано большое число работ, например, [10] и [11]. Более того, определённые успехи есть и в нетрадиционных сферах веб-поиска поиска, таких как поиск по изображениям [12].

Успехи в теории веб-поиска привели к появлению и стремительному развитию ряда поисковых систем. Рассмотрим наиболее актуальные из них.

Поисковая система Google [13] - лидер среди поисковых систем в мире и вторая по популярности поисковая система в России. Так, на май 2014 года по данным исследовательской компании NetMarketShare Google обрабатывал ежемесячно 68,69% всех поисковых запросов, в России в это же время его доля поданным Liveinternet составила 35,1% [14].

Лидирование Google объясняется её динамичным развитием, поддержкой большого числа языков и минимумом рекламы [15]. Google оценивает популярность веб-сайта по количеству ссылок, ведущих к нему с других страниц [16]. В связи с этим и многочисленными усовершенствованиями поисковых алгоритмов результаты поисковой выдачи Google обладают высокой точностью.

Яндекс [17] - наиболее популярная поисковая система в России [14]. По возможностям она не уступает лучшим зарубежным системам, но индексирует в основном русскоязычные ресурсы [16], чем объясняется её малая распространённость в других странах. В то же время Яндекс лучше других поисковых систем учитывает особенности морфологии русского языка, поэтому использование этой системы для поиска по русскоязычным запросам целесообразно.

В поисковой системе Яндекс реализовано множество технологий обработки введённого пользователем запроса. Так, происходит автоматическое определение языка запроса, проводится морфологический анализ введённых слов, реализуется функция снятия омонимии, выполняется расширение запроса синонимами и полными наименованиями или аббревиатурами, осуществляется

выделение объектов - географических названий, имён людей, названий организаций и т.д., ведётся работа над ошибками в запросе [18]. В результате этого Яндекс показывает достаточно точные и полные результаты поиска.

Поисковая система Yahoo! [19] - одна из старейших в мире [16]. Имеет структурированный каталог категорий и поисковую машину, осуществляющую поиск в этих категориях и архиве Yahoo!. Для поиска на не расположенных в каталоге сайтах использует функции Google, поэтому её нельзя назвать полноценной поисковой системой в сети Интернет. Yahoo! не поддерживает русский язык, и, как следствие, в нашей стране её использование незначительно.

Поисковая система Рамблер [20] некогда была известнейшей и наиболее популярной поисковой системой в России, но сейчас её доля на рынке российских поисковых услуг на май 2014 года по данным Liveinternet составляет всего 0,9% [14]. У Рамблера была собственная поисковая машина с базой данных проиндексированных сайтов, теперь для поиска используются технологии Яндекса, поэтому Рамблер потерял свою актуальность как поисковая система.

Поисковая система noHCK@Mail.Ru [21], напротив, долгое время использовала сторонние поисковые алгоритмы, но в настоящее время применяет собственные. Её доля на рынке российских поисковых услуг на май 2014 года по данным Liveinternet составляет 8,3% [14], что говорит о составлении конкуренции Яндексу. На мировой рынок данная поисковая система пока не вышла.

Поисковая система Bing [22] - разработка корпорации Microsoft, в которой было реализовано множество инновационных решений. Bing вплотную приблизилась по популярности Yahoo в мире [14]. В России данная поисковая система также используется, но не значительно.

Поисковая система Baidu - лидер среди китайских поисковых систем. По количеству обрабатываемых запросов поисковый сайт Baidu стоит на втором месте в мире [14], однако она не используется практически нигде, кроме, преимущественно, Китая и, в некоторой степени, Японии.

Зарубежные поисковые системы Lycos [23], AOL [24], а также Excite и ASK имеют незначительную долю на рынке [14].

Сравнение поисковых систем производится по различным критериям. Чаще всего их сравнивают по числу обрабатываемых запросов пользователей, поскольку оно является наиболее объективным критерием из всех возможных. Данные сравнительного анализа на май 2014 года приведены на рисунках 1.4 и 1.5 [14].

Рисунок 1.4 - Сравнение поисковых систем по проценту обрабатываемых

запросов пользователей в мире

35,10%

8,30%

0,90%

0,60% 1,20%

53,90%

■ Яндекс

■ Google

□ Mail

□ Rambler

■ Bing

□ Другие

Рисунок 1.5 - Сравнение поисковых систем по проценту обрабатываемых запросов пользователей в России

В рамках диссертационного исследования наибольший интерес представляет возможность поисковых систем давать конкретные ответы на вопросы. Эта возможность реализуется, главным образом, при помощи сниппетов - фрагмен-

тов текста из источника, содержащих некоторые из ключевых слов. Приведём сравнительную характеристику содержания ответов в сниппетах за 2013 год, основанную на данных, полученных при помощи семейства анализаторов проекта AnalyzeThis [25] (рисунок 1.6).

% Январь Февраль Март Апрель Май Ионь Июль Август Сентябрь Октябрь Ноябрь Денабрь

80 __ _

— —^ГТ-—- —

■ Bing ■ Google Mail ■ Yahoo ■ Yandex

Рисунок 1.6 - Процент содержания кратких ответов на вопросы в сниппетах

Для работы анализатора AnalyzeThis [26] (рисунок 1.6) были подобраны запросы, подразумевающие явный и краткий ответ сразу на странице результатов поиска. В качестве запросов использовались как явные вопросы, так и подразумеваемые (имеющие вид утверждения со значением вопроса). При этом для вопроса могут считаться правильными несколько вариантов ответа. Оценивались ответы на 100 вопросов.

По результатам видно, что в этом аспекте поиска есть возможности для улучшения: качество показа ответов на вопросы можно оценить не больше, чем на 80%. К тому же, поисковые системы в настоящий момент не могут давать развёрнутых ответов непосредственно на странице поиска, поскольку размер сниппетов для этого слишком мал. В то же время в самих результатах поиска (при переходе по выдаваемым ссылкам) у наиболее эффективно находящих ответы поисковых систем - Google и Яндекс - ответ содержится примерно на 95% вопросов [25].

Кроме собственно поисковых систем существуют также «метапоискови-ки» - системы, преобразующие запрос пользователя в несколько запросов к разным поисковым системам и агрегирующие полученные результаты [16]. В данной области также существует ряд работ, в частности, исследования Осипо-ва Г.С. [27], [28]. Метапоисковики могут производить обработку результатов, например, кластеризацию по различным критериям.

Также в последние годы получили развитие системы, способные сформировать конкретные сведения по интересующей пользователя теме или дать прямой ответ на вопрос. Если в традиционных поисковых системах ответ на вопрос может частично или полностью содержаться в одном из сниппетов, то в таких системах, называемых вопросно-ответными, ответ будет выделен явно, в отдельном, специально для этого предназначенном месте интерфейса. Одной из наиболее развитых таких систем является START [29]. Есть и российские аналоги, такие как AskNet [30].

Необходимо заметить, что динамично развивающиеся поисковые системы, в первую очередь, Google, стали внедрять функционал, соответствующий вопросно-ответным системам. Google уверенно может давать определения многим терминам, показывать сведения по известным людям, выполнять математические действия, записанные на естественном языке.

Также существуют специализированные методы поиска и извлечения информации и реализующие их программы, относящиеся к классу Web Mining. Подробней это направление будет рассмотрено в параграфе 1.3.

Несмотря на имеющиеся успехи, существующие поисковые и специализированные вопросно-ответные системы ещё не могут вести полноценный диалог с пользователем и не всегда находят именно те сведения, которые ему необходимы. И если классический веб-поиск, предполагающий выдачу ссылок на источники с информацией, развит очень глубоко, то в области интеллектуального веб-поиска, выдающего саму информацию, остался ряд нерешённых проблем. Эти проблемы относятся к автоматическому анализу неструктурированной информации. Таким образом, необходимо развивать автоматический ана-

лиз текстов на естественном языке в направлении выявления наиболее важных сведений по вопросу, агрегации релевантной информации из различных источников и получения кратких ответов на вопрос.

1.2 Автоматический анализ неструктурированной информации

Для поиска конкретных сведений по вопросам необходимо проведение автоматического анализа текстов. При этом информация в них обычно является неструктурированной или полуструктурированной — явно выделяются только заголовки и абзацы. В связи с этим возникают многочисленные трудности.

Приведём сравнительную характеристику неструктурированной и структурированной текстовой информации [31] (таблица 1.1).

Таблица 1.1. Характеристика неструктурированной и структурированной тек-

стовой информации

Отличительные признаки Текстовая информация

неструктурированная структурированная

Форма текста Нестандартизированный и неформализованный текст, состоящий из предложений на естественном языке. Стандартизованный или формализованный список из символов, слов или словосочетаний.

Содержание текста Полнотекстовое изложение идей, смыслов и сюжетов (свободный текст). Только краткие обозначения и название тематик, смыслов и сюжетов (строго лимитированный текст).

Образ предметной области (сферы реальности) Описания реальности не разделяется явно и обязательно на части, которые напрямую сводятся к триаде «сущность-признак-связь». Описания реальности явно и обязательно разделяется на части, которые напрямую сводятся к триаде «сущность-признак-связь».

Виды практических реализаций текстов Разножанровые авторские тексты не имеющие статус документов или тексты документов (отчёты, стенограммы, проекты, характеристики, заявления). Таблицы и списки со значениями текстологических признаков.

Уровень единообразия Единообразие содержания в разных текстах из одного массива сводится к минимуму. Единообразие содержания таблиц и списков сведено к максимуму.

При анализе текста его перевод из неструктурированного в структурированный не является самоцелью. Однако без получения структурированных данных о содержащейся в тексте информации извлечь из него сведения по какой-либо проблеме не представляется возможным.

Обычно выделяют четыре вида автоматического анализа текста [32]: графематический, морфологический, синтаксический и семантический.

Графематический анализ служит для выделения из текста отдельных словоформ и косвенных элементов (номера телефонов, Ф.И.О., даты и т.д.).

Морфологический анализ используется для определения всех вариантов грамматических характеристик (род, число, падеж, часть речи) к каждой словоформе входного текста. С его помощью также выделяют основы слов.

Синтаксический анализ определяет наличие и характер синтаксических связей между словоформами, создает синтаксическую структуру текста.

Семантический анализ создает смысловую структуру входного текста.

Графематический и морфологический анализы в настоящее время разработаны достаточно хорошо. Синтаксический же и, особенно, семантический анализы по-прежнему находятся в стадии развития [32].

Существует множество подходов к синтаксическому и семантическому анализам. Рассмотрим некоторые из них.

Существуют статистические (вероятностные) алгоритмы синтаксического анализа. Главная особенность подобных методов - использование большого набора примеров-предложений, разобранных человеком вручную (или полуавтоматически, с контролем человека-оператора). Этот набор примеров используется для «обучения» статистического распознавателя, опирающегося на метод дерева принятия решений [32]. Проблема заключается в количестве примеров — их может потребоваться много тысяч для достижения приемлемой точности.

Другой разновидностью статистических систем синтаксического анализа выступают анализаторы, использующие описание языка в виде моделей управления. Они настроены на работу в требуемой предметной области и полученные в результате предварительного анализа корпуса текстов этой области. Каж-

дой модели управления приписывается частотность, характеризующая вероятность использования этой модели для новых текстов данной области [33].

В [32] предлагается алгоритм синтаксического анализатора текстов на русском языке, основанный на лингвистической методологии проведения глубокого синтаксического анализа И.А. Мельчука. Данный алгоритм является внутрисегментным и занимается определением синтаксических связей между словами одного простого предложения (сегмента, фрагмента).

В [34] для синтаксического анализа предлагается использовать грамматику, позволяющую перед синтаксической интерпретацией минимальных компонент моделирования смысла текста разделить предложение на зоны, в которых эти компоненты локализуются. На всех этапах анализа предлагается использовать рекурсивные процедуры, позволяющие упростить грамматику каждого из этапов и одновременно анализировать неограниченное число допустимых языком комбинаторных вариантов. Это, однако, приведёт к снижению быстродействия по сравнению с использованием нерекурсивных алгоритмов.

В [35] же делается вывод, что в настоящее время практическая разработка синтаксического анализатора, разбирающего русскоязычный текст любой сложности, невозможна. Предлагается работать с «фразовыми категориями» -группами, в которых есть одна вершина, а также может быть несколько зависимых от этой вершины. Алгоритм синтаксического анализа сводится к вычленению фразовых категорий в составе предложения и поиску связей между ними.

У каждого метода синтаксического анализа есть свои достоинства и недостатки [36]. При введении всё новых процедур анализа, усложнении применяемых моделей прибавка к качеству синтаксического анализа постепенно уменьшается. Следует также заметить, что повышение сложности практической реализации обычно несёт и увеличение вычислительной сложности алгоритма анализа, что напрямую влияет на быстродействие. Поэтому в используемых на практике системах, где применяются те или иные процедуры синтаксического анализа, добиваются баланса простоты и качества.

Семантический анализ ещё менее развит, чем синтаксический [37]. Тем не менее, в данной области достигнуты определённые успехи.

На основании описания алгоритма семантического анализа [38] построим схему его работы (рисунок 1.7).

Рисунок 1.7 - Схема алгоритма семантического анализа

В [38] предлагается строить семантическую структуру отдельных предложений, состоящую из семантических узлов и семантических отношений.

В [37] делается вывод о том, что в настоящее время развитие семантического анализа движется в сторону формальных грамматик И. Мельчука, Н. Хо-мского и др., но пока значительных прорывов в данной области нет.

Следует заметить, что при решении многих задач в области обработки текстов на естественном языке в глубоком семантическом анализе нет необходимости [39].

Некоторые исследователи в области автоматического анализа неструктурированной информации не производят явного выделения графематического, морфологического, синтаксического и семантического анализов. Так, в [40] предлагается использовать формализованную модель лингвистико-онтологического ресурса и алгоритмы для автоматического построения тематического представления содержания текста как иерархической структуры, моделирующей структуру связного текста.

Существует множество других работ в области автоматического анализа неструктурированной и полуструктурированной информации, таких как [41], [42], [43], [44], [45], [46], [47] и т.д.

Автоматический анализ текстов на естественном языке используют во многих областях, таких как классификация, кластеризация, построение семантических сетей, извлечение фактов, понятий, автореферирование, ответы на запросы, тематическое индексирование и поиск по ключевым словам, а также для поддержки и создания таксономий и тезаурусов [48].

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Список литературы диссертационного исследования кандидат наук Толкачев, Демид Максимович, 2015 год

СПИСОК ЛИТЕРАТУРЫ

1. Маннинг К. Введение в информационный поиск / К. Маннинг, П. Раг-хаван, X. Шютце. -М.: Вильяме, 2011. - 520 с.

2. Макарова Н.В. Информатика: Учебник для вузов / Н.В. Макарова, В.Б. Волков. - СПб.: Питер, 2011. - 576 с.

3. Лопатников Л.И. Экономико-математический словарь: Словарь современной экономической науки. - 5-е изд., перераб. и доп. / Л.И. Лопатников. -М.: Дело, 2003.-520 с.

4. Хорошевский В.Ф. Пространства знаний в сети Интернет и Semantic Web (Часть 1) / В.Ф. Хорошевский // Искусственный интеллект и принятие решений 1/2008. - с. 80-97.

5. Хорошевский В.Ф. Пространства знаний в сети Интернет и Semantic Web (Часть 2) / В.Ф. Хорошевский // Искусственный интеллект и принятие решений 4/2009. - с. 15-36.

6. Abdelhakim Herrouz, Chabane Khentout, Mahieddine Djoudi. Overview of Web Content Mining Tools // The International Journal of Engineering And Science (IJES), Volume 2, Issue 6, 2013.

7. И.В. Успенский. Интернет - маркетинг. Методы поиска информации [Электронный ресурс]. Режим доступа: http://polbu.ru/uspenskv inetmarketing/ch45 i.html (03.06.2015).

8. Поиск информации в Интернете [Электронный ресурс]. Режим доступа: http://help.rgsu.net/uchebnik/searchinfo/ (03.06.2015).

9. Поисковые роботы [Электронный ресурс]. Режим доступа: http://promo.ingate.ru/seo-wikipedia/poiskovye-robotv/ (03.06.2015).

10. Зябрев И.Н. Использование спектральных характеристик лексем для улучшения поисковых алгоритмов / И.Н. Зябрев, О.В. Пожарков, И.Н. Пожар-кова // Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП 2010. Казань, 2010. - с. 40-48.

11. Завьялова О.С. Система интеллектуального поиска и анализа информации «Exactus» на РОМИП-2010 / О.С. Завьялова, A.A. Киселёв, Г.С. Осипов, И.В. Смирнов, И.А. Тихомиров // Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП 2010. Казань, 2010. - с. 49-68.

12. Пименов В.Ю. Простые методы поиска изображений по содержанию / В.Ю. Пименов // Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП 2010. Казань, 2010. - с. 69-79.

13. Google Россия [Электронный ресурс]. Режим доступа: https://www.google.ru/ (03.06.2015).

14. Рейтинг лучших поисковых систем [Электронный ресурс]. Режим доступа: http://www.bestseoblog.ru/reiting-poiskovyx-sistern/ (03.06.2015).

15. Как работает поиск. Алгоритмы [Электронный ресурс]. Режим доступа: https://www.google.com/intl/ru/insidesearch/howsearchworks/algorithms.html (03.06.2015).

16. Аналитический отчет "Поисковые системы". Часть 1 [Электронный ресурс]. Режим доступа: http://www.baltslon.ru/rus/products/product54/ (03.06.2015).

17. Яндекс [Электронный ресурс]. Режим доступа: http://www.vandex.ru/ (03.06.2015).

18. Обработка запроса [Электронный ресурс]. Режим доступа: http://company.yandex.ru/technologies/query/index.xml (03.06.2015).

19. Yahoo! [Электронный ресурс]. Режим доступа: https://www.yahoo.com/ (03.06.2015).

20. Рамблер [Электронный ресурс]. Режим доступа: http://www.rambler.ru/ (03.06.2015).

21. noHCK@Mail.Ru [Электронный ресурс]. Режим доступа: http://go.mail.ru/ (03.06.2015).

22. Bing [Электронный ресурс]. Режим доступа: http://www.bing.com/ (03.06.2015).

23. Lycos [Электронный ресурс]. Режим доступа: http://www.lycos.com/ (03.06.2015).

24. Aol Search [Электронный ресурс]. Режим доступа: http://search.aol.com/aol/webhome (03.06.2015).

25. Рощупкин К. Качество поиска и поисковые системы в Рунете. Аналитический обзор, 2013 год. / К. Рощупкин, JI. Кудрявцева, С. Вальковский. - М.: «Ашманов и партнеры», 2014. - 74 с.

26. Анализаторы поисковых машин - ANALYZETHIS.RU [Электронный ресурс]. Режим доступа: http://www.analyzethis.ru/ (03.06.2015).

27. Осипов Г.С. Интеллектуальный поиск в глобальных и локальный вычислительных сетях и базах данных / Г.С. Осипов, И.А. Тихомиров, И.В. Смирнов // Труды международной конференции "Программные системы: теория и приложения". - ИПС РАН, Переславль-Залесский, 2004. - с. 21-34.

28. Осипов Г.С. Интеллектуальная поисковая система «Exactus»: Опыт участия в семинаре Ромип. / Г.С. Осипов, О.С. Завьялова, И.В. Смирнов, И.А. Тихомиров. - М.: Институт системного анализа РАН, 2005. - 10 с.

29. START, Natural Language Question Answering System [Электронный ресурс]. Режим доступа: http://start.csail.mit.edu/index.php (03.06.2015).

30. Семантическая поисковая система AskNet [Электронный ресурс]. Режим доступа: http://www.asknet.ru/ (03.06.2015).

31. Бочаров A.B. Автоматизация обработки неструктурированной текстовой информации и перспективы гуманитарных наук в XXI веке / A.B. Бочаров // Человек-текст-эпоха. Томск: Изд-во ТГУ, 2011. Вып. 4. С. 15-37.

32. Ким К.Х. Синтаксический анализатор для вопросно-ответной системы / К.Х. Ким, А.П. Савинов // Известия Томского политехнического университета, Т. 315. №5, 2009.-с. 133-138.

33. Волкова И.А. Адаптивный Синтаксический анализатор / И.А. Волкова, М.Г. Мальковский, Н.В. Одинцев // Диалог 2003: Труды Междунар. семинара. -М., 2003. -Т. 1.-С. 401-406.

34. Кобзарева Т.Ю. Язык синтаксических структур и структурирование текста / Т.Ю. Кобзарева // Социологические методы в современной исследовательской практике. Высшая школа экономики, Москва, 2011. - с. 320-327.

35. Леонтьева А. Автоматический синтаксический анализ русских текстов / А. Леонтьева, И. Кагиров // Труды 10-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL'2008, Дубна, Россия, 2008. - с. 397-400.

36. Дроздов В.В. Метод автоматизированной генерации правил синтаксического анализа проектной документации: автореф. дис. ... канд. техн. наук / В.В. Дроздов. -М., 2010.-26 с.

37. Чапайкина Н.Е. Семантический анализ текстов. Основные положения / Н.Е. Чапайкина // Молодой ученый. - 2012. - №5. - С. 112-115.

38. Автоматическая Обработка Текста. Первичный семантический анализ [Электронный ресурс]. Режим доступа: http://www.aot.ru/docs/seman.html#l (03.06.2015).

39. Ландэ Д.В. Поиск знаний в Internet. Профессиональная работа.: Пер. с англ. / Д.В. Ландэ. - М.: Издательский дом «Вильяме», 2005. - 272 с.

40. Лукашевич Н.В. Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа: автореф. дис. ... д-ра техн. наук / Н.В.Лукашевич. - М., 2014. - 32 с.

41. Котельников Е.В. Автоматический анализ тональности текстов на основе методов машинного обучения / Е.В. Котельников, М.В. Клековкина // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 30 мая — 3 июня 2012 г.). Вып. 11 (18): В 2 т. Т. 2: Доклады специальных секций - М.: Изд-во РГГУ, 2012.-е. 27-36.

42. Большаков И.А. Автоматический морфоклассификатор русских именных групп / И.А. Большаков, Е.И. Большакова // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной

конференции «Диалог» (Бекасово, 30 мая - 3 июня 2012 г.). Вып. 11 (18): В 2 т. Т. 1: Основная программа конференции. -М.: Изд-во РГГУ, 2012. - с. 81-92.

43. Антонова А.Ю. Использование метода условных случайных полей для обработки текстов на русском языке / А.Ю. Антонова, А.Н. Соловьев // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). Вып. 12 (19): В 2 т. Т. 1: Основная программа конференции. - М.: Изд-во РГГУ, 2013.-с. 27-43.

44. Marchuk A.A. Extracting product features from reviews with the use of Internet statistics / A.A. Marchuk, A.V. Ulanov, I.V. Makeev, A.A. Chugreev // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). Вып. 12 (19): В 2 т. Т. 2: Доклады специальных секций - М.: Изд-во РГГУ, 2013.-с. 81-90.

45. Bogdanov A.V. Anaphora Analysis based on ABBYY Compreno Linguistic Technologies / A.V. Bogdanov, S.S. Dzhumaev, D.A. Skorinkin, A.S. Starostin // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 4-8 июня 2014 г.). Вып. 13 (20). -М.: Изд-во РГГУ, 2014. - с. 89-101.

46. Соловьев А. Кто виноват и где собака зарыта? Метод валидации ответов на основе неточного сравнения семантических графов в вопросно-ответной системе / А. Соловьев // Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП 2010. Казань, 2010. - с. 125-141.

47. Салтыков А. Алгоритм контекстно-зависимого аннотирования / А. Салтыков, С. Куротченко, Р. Дорохин // Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП 2010. Казань, 2010. - с. 109-116.

48. Ландэ Д.В. Теория информационного поиска / Д.В. Ландэ. - Киев: Международный соломонов университет, 2006. - 42 с.

49. Graham P. A Plan for SPAM [Электронный ресурс]. Режим доступа: http://paulgraham.com/spam.html (03.06.2015).

50. Харламов A.A. Когнитивный подход к анализу текстов в технологии автоматического смыслового анализа текстов TextAnalyst [Электронный ресурс]. Режим доступа: http://spkurdyumov.ru/networks/kognitivnyi-podxod-k-analizu-tekstov-v-texnologii-avtomaticheskogo-smyslovogo-analiza-tekstov-textanalvst/ (03.06.2015).

51. Харламов A.A. Нейросетевая технология представления и обработки информации (естественное представление знаний) / A.A. Харламов. - М.: «Радиотехника», 2006. - 89 с.

52. Харламов A.A. Перестройка модели мира, формируемой на материале анализа текстовой информации с использованием искусственных нейронных сетей, в условиях динамики внешней среды / A.A. Харламов, В.В. Раевский // Речевые технологии, N 3, 2008. - С. 27-35.

53. TextAnalyst 2.0. Персональная система автоматического анализа текста [Электронный ресурс]. Режим доступа: http://www.analyst.ru/index.php?lang=eng&dir=content/products/&id=ta&left=conte nt/products/menu.txt (03.06.2015V

54. Абрамов В.Е. Статистический анализ связности текстов по общественно-политической тематике / В.Е. Абрамов, H.H. Абрамова, Е.В. Некрасова, Г.Н. Росс // Труды 13й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» -RCDL'2011, Воронеж, Россия, 2011. - с. 127-133.

55. Основные средства связи между предложениями в тексте [Электронный ресурс]. Режим доступа: http://novargym.smartlearn.ru/mod/page/view.php?id=537 (03.06.2015).

56. Способы связи предложений в тексте [Электронный ресурс]. Режим доступа: http://mplmurmansk.ru/node/4315 (03.06.2015).

57. Мельчук И.А. Опыт теории лингвистических моделей «смысл <-»■ текст»: семантика, синтаксис / И.А. Мельчук. - М.: Наука, 1974. - 314 с.

58. Тузов В.А. Математическая модель языка / В.А. Тузов. - JL: Изд-во Ленингр. университета, 1984. - 176 с.

59. Хомский Н. Аспекты теории синтаксиса / Н. Хомский. - М.: Изд-во БГК им. И.А. Бодуэна Де Куртенэ, 1999. - 235 с.

60. Мозговой М.В. Машинный семантический анализ русского языка и его применения: дис. ... канд. ф.-м. наук / М.В. Мозговой. - СПб., 2006. - 116 с.

61. Толпегин П.В. Новые методы и алгоритмы автоматического разрешения референции местоимений третьего лица русскоязычных текстов / П.В. Толпегин. - М.: Комкнига, 2006. - 88 с.

62. Зеленков Ю.Г. Сравнительный анализ методов определения нечетких дубликатов для Web-документов / Ю.Г. Зеленков, И.В. Сегалович // Труды 9°" Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». - RCDL'2007, Пере-славль, Россия, 2007. - Том 1, С. 166-174.

63. Захаров В.Н. Автоматическая оценка подобия тематического содержания текстов на основе сравнения их формализованных смысловых описаний / В.Н. Захаров, A.A. Хорошилов // Труды XIV-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». - RCDL'2012, Переславль-Залесский, Россия, 15-18 октября 2012 г.

64. Технологии автоматического семантического анализа текстов [Электронный ресурс]. Режим доступа: http://uisrussia.msu.ru/linguist/ В1 2 avto semant analiz.isp (03.06.2015).

65. Симанков B.C. Анализ методов извлечения данных и знаний из Интернета для целей поддержки принятия решений / B.C. Симанков, Д.М. Толкачев // Наука Кубани, № 1. Краснодар: Изд. ООО «Просвещение-Юг», 2014. - с. 68-72.

66. Березкин Д.В. Метод автоматизированного извлечения знаний из слабоструктурированных источников и его применение для создания корпоративных информационных систем / Д.В. Березкин // V Международная научно-практическая конференция «Интегрированные модели и мягкие вычисления в искусственном интеллекте», Коломна, 28-30 мая 2009 г.

67. M. Giri, Akash Kumar. An Efficient Web Content Mining using Divide and Conquer Approach // International Journal of Computational Intelligence Research. Volume 8, Number 2, 2012. - pp. 95-105.

68. Web Scraping, Web Extraction, WebSundew [Электронный ресурс]. Режим доступа: http://www.websundew.com/ (03.06.2015).

69. Sindice — The semantic web index [Электронный ресурс]. Режим доступа: http://sindice.com/ (03.06.2015).

70. Sig.ma ЕЕ - Semantic Information Mashup Enterprise Edition [Электронный ресурс]. Режим доступа: http://sig.ma/ (03.06.2015).

71. Четвёркин И.И. Автоматизированное формирование базы знаний для задачи анализа мнений: автореф. дис. ... канд. ф.-м. наук / И.И. Четвёркин. -М, 2013.-20 с.

72. Нечипоренко А. Система автоматизированного извлечения знаний из текстов на естественном языке [Электронный ресурс]. Режим доступа: http.7/www.noolab.ru/index.php?id=stat&show=T8 (03.06.2015).

73. Правила создания поисковых запросов [Электронный ресурс]. Режим доступа: http.7/procopywrite.ru/novosti-seo/pravila-sozdaniya-poiskovich-zaprosov.html (03.06.2015).

74. 5 правил получения точных и быстрых ответов при составлении поисковых запросов [Электронный ресурс]. Режим доступа: http://skvcan.ru/index.php/ru/stati (03.06.2015).

75. Burger J., Cardie С., Chaudhri V. [и др.]. Issues, Tasks and Program Structures to Roadmap Research in Question Answering (QA) [Электронный ресурс]. Режим доступа: http://www-nlpir.nist.gov/projects/duc/papers/qa.Roadmap-paper v2.doc (03.06.2015).

76. Соловьёв А.А. Построение вопросно-ответной системы для русского языка: модуль анализа вопросов / А.А. Соловьёв, О.В. Пескова // Новые информационные технологии в автоматизированных системах: материалы 13 научно-практического семинара. - Моск. гос. ин-т электроники и математики, 2010. - с. 41-49.

77. The Ephyra Question Answering System [Электронный ресурс]. Режим доступа: http://www.ephyra.info/ (03.06.2015).

78. Abraham Ittycheriah. A Statistical Approach For Open Domain Question Answering // Advances in Open Domain Question Answering. Text, Speech and Language Technology Volume 32, 2006, pp 35-69.

79. Автоматическая Обработка Текста [Электронный ресурс]. Режим доступа: http://aot.ru/ (03.06.2015).

80. phpMorphy [Электронный ресурс]. Режим доступа: http://phpmorphy.sourceforge.net/dokuwiki/ (03.06.2015).

81. Турдаков Д.Ю. Вопросно-ответные системы и автоматическое реферирование / Д.Ю. Турдаков. - ВМК МГУ, 2013. - 33 с.

82. Boris Katz and Jimmy Lin. REXTOR: A System for Generating Relations from Natural Language // In Proceedings of the ACL 2000 Workshop on Natural Language Processing and Information Retrieval, October 2000, Hong Kong, China. -lip.

83. Никонов B.O. Диалоговая интеллектуальная система с естественноязыковым интерфейсом: дис. ... канд. техн. наук / В.О. Никонов. - Краснодар, 2007.- 138 с.

84. Наносемантика. Инф-консультант [Электронный ресурс]. Режим доступа: http://www.nanosemantics.ru/products/inf-consultant/ (03.06.2015).

85. Susan Dumais. Search and context // CLEF 2014 Conference and Labs of the Evaluation Forum. Information Access Evaluation meets Multilinguality, Multi-modality, and Interaction. Sheffield - UK, 15-18 September 2014. - 26 p.

86. Как работают поисковые системы - сниппет, алгоритм обратного поиска, индексация страниц и особенности работы Яндекса [Электронный ресурс]. Режим доступа: http://ktonanovenkogo.ru/seo/search/kak-rabotayut-poiskovye-sistemv-snippet-index.html (03.06.2015).

87. Демидов В. Ассоциативный поиск VisualWorld [Электронный ресурс]. Режим доступа: http://www.kv.by/index2007270603.htm (03.06.2015).

88. Симанков B.C. Проблемно-ориентированное автореферирование как инструмент поиска данных и знаний / B.C. Симанков, Д.М. Толкачев // Наука вчера, сегодня, завтра / Сб. ст. по материалам XIV междунар. науч.-практ. конф. № 7 (14). Новосибирск: Изд. «СибАК», 2014. - с. 31-35.

89. Дыбина А. Разработка текстовой базы на основе анализа структуры научного текста / А. Дыбина // International Journal "Information Technologies & Knowledge" Vol.6, Number 1, 2012. - pp. 93-99.

90. Porter M.F. An algorithm for suffix stripping / M.F. Porter // \Program\, \14\ no. 3, July 1980. - pp. 130-137

91. Russian stemming algorithm [Электронный ресурс]. Режим доступа: http://snowball.tartarus.org/algorithms/russian/stemmer.html (03.06.2015).

92. Ефимова Т.В. Анализ художественного текста с применением семантической сети / Т.В. Ефимова // Воронежская государственная медицинская академия, 2003. - 12 с.

93. Симанков B.C. Выявление семантических связей между предложениями при автореферировании / B.C. Симанков, Д.М. Толкачев // Наука и бизнес: пути развития, №7 (37), М., 2014. - с. 54-60.

94. Симанков B.C. Обеспечение смысловой связности текста автореферата / B.C. Симанков, Д.М. Толкачев // Научная дискуссия: инновации в современном мире. № 7 (27): сборник статей по материалам XXVII международной заочной научно-практической конференции. - М., Изд. «Международный центр науки и образования», 2014. - с. 12-16.

95. Perl regular expressions [Электронный ресурс]. Режим доступа: http://perldoc.perl.org/perlre.html (03.06.2015).

96. Фридл Дж. Регулярные выражения, 3-е издание. - Пер. с англ. / Дж. Фридл. - СПб.: Символ-Плюс, 2008. - 608 с.

97. Oliver Miiller. Pattern Matching with Regular Expressions in С++ [Электронный ресурс]. Режим доступа: http://www.tldp.org/LDP/LGNET/issue27/mueller.html (03.06.2015).

98. Новичихина М.Е. О некоторых трудных случаях лингвистической экспертизы товарных знаков [Электронный ресурс]. Режим доступа: http://siberia-expert.com/publ/4-1 -0-303 (03.06.2015).

99. Симанков B.C. Автоматическая оценка смыслового подобия текстов / B.C. Симанков, Д.М. Толкачев // Технические науки - от теории к практике / Сб. ст. по материалам XXXVII междунар. науч.-практ. конф. № 8 (33). Новосибирск: Изд. «СибАК», 2014. - с. 26-33.

100. Симанков B.C. Методические положения автоматического поиска ответов на вопросы / B.C. Симанков, Д.М. Толкачев // Перспективы науки, №9 (60), Тамбов, 2014. - с. 80-85.

101. Boris Katz. Annotating the World Wide Web using Natural Language // In Proceedings of the 5th RIAO Conference on Computer Assisted Information Searching on the Internet (RIAO '97), 1997. - 7 p.

102. Симанков B.C. Поиск ответов на вопросы в сети Интернет / B.C. Симанков, Д.М. Толкачев // Инновации в науке / Сб. ст. по материалам XXXVI межднар. науч.-практ. конф. № 8 (33). Новосибирск: Изд. «СибАК», 2014. - с. 28-35.

103. Симанков B.C. Методологические аспекты работы со знаниями в системах поддержки принятия решений / B.C. Симанков, Д.М. Толкачев // Глобальный научный потенциал, №7 (40), Санкт-Петербург, 2014. - с. 42-47.

104. Интеллектуально-аналитическая система получения релевантных данных и знаний в сети Интернет / B.C. Симанков, Д.М. Толкачев; - № 2015610359; заявка № 2014661181 от 05.11.2014; зарегистрировано в реестре программ для ЭВМ 12.01.2015.

105. Интеллектуально-аналитическая система получения релевантных данных и знаний в сети Интернет. Модуль «Генерация проблемно-ориентированных авторефератов» / B.C. Симанков, Д.М. Толкачев; - № 2015610030; заявка № 2014661102 от 05.11.2014; зарегистрировано в реестре программ для ЭВМ 12.01.2015.

106. Интеллектуально-аналитическая система получения релевантных данных и знаний в сети Интернет. Модуль «Выявление семантических связей между предложениями» / B.C. Симанков, Д.М. Толкачев; - № 2015610023; заявка № 2014661104 от 05.11.2014; зарегистрировано в реестре программ для ЭВМ 12.01.2015.

107. Интеллектуально-аналитическая система получения релевантных данных и знаний в сети Интернет. Модуль «Синтез интегрированного автореферата на основе анализа частных проблемно-ориентированных авторефератов» / B.C. Симанков, Д.М. Толкачев; - № 2015610022; заявка № 2014661103 от 05.11.2014; зарегистрировано в реестре программ для ЭВМ 12.01.2015.

108. Интеллектуально-аналитическая система получения релевантных данных и знаний в сети Интернет. Модуль «Выявление ответов на вопрос» / B.C. Симанков, Д.М. Толкачев; - № 2015610361; заявка № 2014661180 от 05.11.2014; зарегистрировано в реестре программ для ЭВМ 12.01.2015.

109. Симанков B.C. Разработка информационно-аналитической системы получения релевантных данных и знаний в сети Интернет / B.C. Симанков, Д.М. Толкачев // Программные системы и вычислительные методы. - 2014. - № 3. - С. 298 - 311. DOI: 10.7256/2305-6061.2014.3.13396.

110. Возможности PHP [Электронный ресурс]. Режим доступа: http://www.php.su/php/7can (03.06.2015).

111. Chen S.C. PHP Simple HTML DOM Parser [Электронный ресурс]. Режим доступа: http://simplehtmldom.sourceforge.net/ (03.06.2015).

112. What is jQuery? [Электронный ресурс]. Режим доступа: https://iquerv.com/ (03.06.2015).

113. Трахтенгерц Э.А. Компьютерные системы поддержки принятия управленческих решений / Э.А. Трахтенгерц // Проблемы управления №1, 2003. -с. 13-28.

114. Перегудов Ф.И. Основы системного анализа. Учеб. 2-е изд., доп. / Ф.И. Перегудов, Ф.П. Тарасенко. - Томск: Изд-во HTJI, 1997. - 396 с.

115. Цветков В.Я. Методы и системы поддержки принятия решений в управлении / В.Я. Цветков. - М.: 2001. - 70 с.

116. Симанков B.C. Методологические аспекты построения систем поддержки принятия решений / B.C. Симанков, С.Н. Владимиров, А.О. Денисенко, А.Н. Черкасов // Вестник ДГТУ, Том 8, №3(38), 2008. - с. 258-267.

117. Симанков B.C. Подходы к автоматизации процедур получения и обработки экспертных знаний на основе моделей интеллектуального анализа данных / B.C. Симанков, Е.С. Тарасов // Научный журнал КубГАУ, №84(10), 2012. -12 с.

118. Симанков B.C. Системный анализ в адаптивном управлении: Монография [под ред. B.C. Симанкова] / B.C. Симанков, Е.В. Луценко, В.Н. Лаптев. - Краснодар: Ин-т совр. технол. и экон., 2001. - 258 с.

119. Выброс хлора: симптомы отравления и первая помощь [Электронный ресурс]. Режим доступа: http://www.aif.ru/health/life/41077 (03.06.2015).

120. Хлор. Аварийно химически опасные вещества [Электронный ресурс]. Режим доступа: http://umc.kirov.ru/materials/ahov/hlor.htm (03.06.2015).

121. Безопасность [Электронный ресурс]. Режим доступа: http://healf.ucoz.ru/news/bezopasnost/2013-06-16-5 (03.06.2015).

122. Характеристика аварийно химически опасных веществ [Электронный ресурс]. Режим доступа: http://www.rhbz.info/rhbz3.1.5.4.html (03.06.2015).

123. Опасность хлора для окружающей среды и человека [Электронный ресурс]. Режим доступа: http://ekobalans.ru/investigations/xlor (03.06.2015).

124. Обеззараживание воды хлорированием [Электронный ресурс]. Режим доступа: http://www.home-dok.ru/chlorirov (03.06.2015).

125. «Накопительный» конец света. Опасный хлор [Электронный ресурс]. Режим доступа: http://konetssveta.ru/7p-2846 (03.06.2015).

126. Водопроводная вода - всегда ли она полезна и безопасна [Электронный ресурс]. Режим доступа: http://oooavangard.ru/vodoprovodnaya-voda-vsegda-¡ьща (03.06.2015).

133

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.