Методы и алгоритмы повышения эффективности функционирования информационно-справочной подсистемы АСУП тема диссертации и автореферата по ВАК РФ 05.13.06, кандидат технических наук Калиниченко, Алла Викторовна
- Специальность ВАК РФ05.13.06
- Количество страниц 110
Оглавление диссертации кандидат технических наук Калиниченко, Алла Викторовна
ВВЕДЕНИЕ.
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ И ПОСТАНОВКА
ЗАДАЧ ИССЛЕДОВАНИЯ.
1.1. Основные направления развития автоматизации управления.
1.2. Проблемы поиска корпоративной информации.
1.2.1. Проблемы анализа текстовых документов на естественном языке.
1.2.2. Подходы к обработке текстовых документов на естественном языке
1.2.3. Анализ методов поиска семантически похожих документов.
1.3. Постановка задач исследования.
1.4. Выводы.
2. СТРУКТУРА ИНФОРМАЦИОННО-СПРАВОЧНОЙ ПОДСИСТЕМЫ АСУП И МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ.
2.1. Математическое описание представления информации.
2.1.1. Представление поисковых образов документов и запросов.
2.2.2. Критерии вычисления релевантности.
2.2. Структура информационно-справочной подсистемы АСУП.
2.3. Выводы.
ГЛАВА 3. РАЗРАБОТКА МЕТОДОВ И АЛГОРИТМОВ
ПОИСКА В ИНФОРМАЦИОННО-СПРАВОЧНОЙ
ПОДСИСТЕМЕ АСУП.
3.1. Методы уточнения запроса.
3.2. Метод и алгоритм формирования кластеров ассоциативно связанных значимых поисковых терминов документа.
3.3. Диалоговый метод поиска семантически похожих документов.
3.4. Алгоритм построения поискового образа документа.
3.5. Выводы.
ГЛАВА 4. РАЗРАБОТКА ИНФОРМАЦИОННО
СПРАВОЧНОЙ ПОДСИСТЕМЫ АСУП И ОЦЕНКА ЕЕ ЭФФЕКТИВНОСТИ.
4.1. Структура программного комплекса.
4.2. Оценка эффективности предлагаемых методов.
4.3. Дальнейшее развитие предложенных методов, повышающих качество поиска.
4.4. Выводы.
Рекомендованный список диссертаций по специальности «Автоматизация и управление технологическими процессами и производствами (по отраслям)», 05.13.06 шифр ВАК
Разработка моделей и алгоритмов автоматизации полнотекстового поиска документированной информации повышенной релевантности в распределенных производственных структурах2007 год, кандидат технических наук Слюсарь, Валентин Викторович
Математическое моделирование и программная реализация семантического преобразования поисковых запросов2012 год, кандидат технических наук Кириллов, Антон Владимирович
Математические модели и алгоритмы эффективного поиска текстовой информации на основе кластеризации по нечетким коллокациям2013 год, кандидат технических наук Поляков, Дмитрий Вадимович
Исследование и разработка методов и моделей поиска адекватной информации в полнотекстовых базах данных2004 год, кандидат технических наук Андриенко, Евгений Владимирович
Метод и алгоритмы интеллектуальной обработки информации в корпоративных хранилищах2012 год, кандидат технических наук Летовальцев, Виктор Иванович
Введение диссертации (часть автореферата) на тему «Методы и алгоритмы повышения эффективности функционирования информационно-справочной подсистемы АСУП»
В условиях наблюдающейся тенденции укрупнения промышленного производства, образования холдингов, финансово-промышленных групп, ключевое значение имеет решение вопросов эффективного использования информационных ресурсов, отражающих и обеспечивающих их деятельность. Становление информационного общества, глобализация, изменение экономических условий, развитие современных компьютерных технологий -факторы, которые привели к изменению условий управления предприятиями И предъявили новые требования к автоматизированным информационным системам и технологиям обработки информационных ресурсов.
В современных автоматизированных системах управления предприятием (АСУП) циркулирует большой объем разнородной информации. В последние годы наблюдается тенденция к сокращению темпов роста объема структурированных данных и увеличению темпов роста объема частично структурированных и неструктурированных данных. Исследования показывают, что на поиск нужной информации сотрудники предприятий тратят до 20% рабочего времени. В связи с этим возрастающее значение имеет организация эффективных механизмов поиска в информационном фонде АСУП. Наличие в рамках АСУП информационно-справочной подсистемы дает возможность получать оперативный доступ к достоверной информации, необходимой для принятия решений, позволяет повысить эффективность управления и ускорить процесс обработки данных.
Исследованиям в области информационно-поисковых систем и обработки информации на естественном языке посвящены научные труды Белоногова Г. Г., Когаловского М. Р., Добрынина В. Ю., Некрестьянова И. С., Гасанова Э. Э, Губина М.В., Ландэ Д. В., Saltón G., Baeza-Yates R., Landauer Т. К., Dominich S.
Управленческому звену предприятий приходится принимать решения в условиях высокой динамичности изменения экономической ситуации, учитывать множество факторов и ограничений, анализировать большой объем внутренней документации. Соизмеримость ценности информации с основными ресурсами производства, рост ее объема и повышение влияния на эффективность производства обуславливает актуальность исследований, направленных на разработку методов, обеспечивающих повышение пертинентности и релевантности поиска неструктурированной информации и эффективную организацию информационно-справочной подсистемы в составе АСУП.
Целью диссертационной работы является разработка методов и алгоритмов, позволяющих повысить эффективность функционирования информационно-справочной подсистемы АСУП путем повышения пертинентности и релевантности поиска неструктурированной информации.
Поставленная цель потребовала решения следующих задач:
1. провести анализ требований к современным автоматизированным системам управления предприятием;
2. разработать математическое описание представления информации в информационно-справочной подсистеме, учитывающее контекст поисковых терминов;
3. разработать алгоритм построения поискового образа документа на основе предлагаемого математического описания;
4. разработать метод и алгоритм поиска семантически похожих документов;
5. разработать метод и алгоритм построения кластеров ассоциативно связанных значимых поисковых терминов документа;
6. оценить эффективность функционирования предложенных методов и алгоритмов в информационно-справочной подсистеме АСУП.
Объект исследования - информационно-справочные подсистемы АСУП.
Предмет исследования - методы и алгоритмы, обеспечивающие повышение пертинентности и релевантности поиска неструктурированной информации в информационно-справочной подсистеме АСУП.
Методы исследования. Для решения поставленных задач применялись методы кластерного анализа, теории нечетких множеств, статистические методы обработки данных, методы поиска и управления информацией, теории алгоритмов, теории графов.
Научная новизна диссертационной работы состоит в следующем:
1. Предложено математическое описание представления информации в информационно-справочной подсистеме, позволяющее организовать эффективное ведение информационного обеспечения АСУП, повысить пертинентность и релевантность поиска неструктурированной информации. Разработан алгоритм построения поискового образа документа, основанный на предложенном математическом описании.
2. Предложена структура информационно-справочной подсистемы АСУП, включающая в себя диалоговую подсистему уточнения запроса.
3. Разработаны метод и алгоритм поиска семантически похожих документов, позволившие повысить пертинентность поиска, особенностью которых является предоставление возможности пользователю уточнять информационную потребность.
4. Разработаны метод и алгоритм автоматического построения кластеров ассоциативно связанных ключевых терминов документа, особенностью которых является визуальное представление основного содержания документа в виде графа, что позволяет уточнить запрос лишь теми терминами, которые отражают информационную потребность пользователя.
Практическая значимость. Разработанные методы и алгоритмы позволяют повысить пертинентность и релевантность поиска в информационно-справочной подсистеме АСУП. Предложенный подход к поиску семантически похожих документов позволяет решить проблему корректного отражения информационной потребности пользователя.
Достоверность и обоснованность полученных результатов обеспечиваются показателями, оценивающими эффективность информационного поиска, такими как: точность, полнота, точность на уровне п-документов. Значения показателей были получены в ходе экспериментов на тестовой коллекции.
Апробация работы. Основные положения и результаты работы докладывались и обсуждались на научно-технических конференциях СКГМИ (ГТУ) 2009-2011г.; а также на следующих международных научно-практических конференциях: X Международная научно-практическая конференция «ИТ-технологии: Развитие и приложения», г. Владикавказ, 2009г.; V Международная научно-практическая конференция «Современное состояние естественных и технических наук», г. Москва, 2011г.
Публикации. Основные результаты диссертационной работы опубликованы в 7 печатных работах, в т.ч. 2 работы в ведущих рецензируемых научных журналах и изданиях, определенных ВАК РФ для опубликования основных научных результатов.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы, включающего 96 наименований, и содержит 112 страниц машинописного текста, 27 рисунков, 7 таблиц и 1 приложение.
Похожие диссертационные работы по специальности «Автоматизация и управление технологическими процессами и производствами (по отраслям)», 05.13.06 шифр ВАК
Математическое и программное обеспечение построения списков семантически близких слов на основе рейтинга вики-текстов2008 год, кандидат технических наук Крижановский, Андрей Анатольевич
Контекстно-ассоциативный метод уточнения поисковых запросов с обратной связью по релевантности2006 год, кандидат физико-математических наук Беляев, Дмитрий Владимирович
Исследование и разработка методов обеспечения информационной совместимости различных уровней интегрированной АСУ1983 год, кандидат экономических наук Кабачек, Виктор Иванович
Разработка методов и инструментальных средств повышения пертинентности поиска в современных информационных средах2010 год, кандидат технических наук Терехов, Алексей Андреевич
Разработка и программная реализация метода семантически-ориентированного поиска информации в электронных документах2007 год, кандидат технических наук Люстиг, Инга Владимировна
Заключение диссертации по теме «Автоматизация и управление технологическими процессами и производствами (по отраслям)», Калиниченко, Алла Викторовна
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. В результате выполненного анализа поисковых возможностей информационно-справочных систем была предложена структура информационно-справочной подсистемы АСУП новизна которой состоит в принципах функционирования подсистем, ориентированных на повышение пертинентности и релевантности поиска неструктурированной информации, а именно: подсистемы диалогового режима взаимодействия с пользователем, подсистемы поиска семантически похожих документов и подсистемы формирования кластеров ассоциативно связанных значимых терминов документа.
2. Предложено математическое описание представления информации в информационно-справочной подсистеме АСУП на базе математического аппарата нечетких множеств, позволяющее учесть контекст поисковых терминов в поисковых образах документов.
3. Разработан и реализован алгоритм построения поискового образа документа на основе предложенного математического описания.
4. Предложен метод и реализован алгоритм поиска семантически похожих документов, который позволяет уточнить информационную потребность пользователя и построить более точный запрос путем введения диалога; учесть сходство контекста поисковых терминов документов информационного массива и контекста терминов документа-образца.
5. Предложены метод и алгоритм формирования кластеров ассоциативно связанных поисковых терминов документа, позволившие сформировать визуальное представление основного содержания документа в виде графа.
6. Проведена оценка эффективности функционирования предложенных методов и алгоритмов в информационно-справочной подсистеме АСУП.
7. Разработанные методы и алгоритмы внедрены для практического применения в ОАО «Кавдоломит» (г. Владикавказ) в виде информационно-справочной подсистемы предприятия.
Таким образом, предложенные и реализованные в диссертационной работе методы и алгоритмы позволяют расширить возможности и повысить эффективность функционирования информационно-справочной подсистемы АСУП.
Список литературы диссертационного исследования кандидат технических наук Калиниченко, Алла Викторовна, 2012 год
1. Автоматизация управления предприятием / Баронов В.В. и др. М.: Инфра-М, 2000. 239 с.
2. Агеев М.С., Кураленок И.Е., Некрестьянов И.С. Официальные метрики РОМИП' 2009 // Российский семинар по Оценке Методов Информационного Поиска. Труды РОМИП 2009. 2009. С. 175-185.
3. Аликов А.Ю., Калиниченко A.B. Математическая модель подсистемы информационного поиска в составе АСУП // Устойчивое развитие горных территорий. 2011. №4 (10). С. 32-34.
4. Аликов А.Ю., Калиниченко A.B. Применение нечеткой кластеризации для автоматизации поиска похожих документов // Материалы Международной заочной научно-практической конференции «Вопросы науки и техники». Часть I. (16 января 2012г.). 2012. С. 80-84.
5. Беляев Д.В. Контекстно-ассоциативный метод уточнения поисковых запросов и аннотирования текстовых документов // Труды четвертого российского семинара РОМИП' 2006 (Суздаль, 19 октября 2006г). 2006. С.113-125.
6. Беляев Д.В. Оценка эффективности применения контекстно-ассоциативных моделей текстов в задаче поиска по образцу на
7. РОМИП'2005. // Труды третьего российского семинара РОМИГГ 2005 (Ярославль, 6 октября 2005 г.). 2005. С. 89-105.
8. Браславский П.И., Соколов Е.А. Сравнение четырех методов автоматического извлечения двухсловных терминов из текста // Труды межд. конф. "Компьютерная лингвистика и интеллектуальные технологии" (Диалог-2006). 2006. С. 88-94.
9. Гагарина Л.Г., Киселев Д.В., Федотова Е.Л. Разработка и эксплуатация автоматизированных информационных систем: учеб. пособие. М.: ИД «Форум»: Инфа-М, 2007. 384 с.
10. Гайдамакин H.A. Автоматизированные информационные системы, базы и банки данных. Москва «Гелиос АРВ», 2002. 368 с.
11. Гасанов Э.Э., Кудрявцев В.Б. Теория хранения и поиска информации. М.: Физматлит, 2002. 288 с.
12. ГОСТ 7-73-96. Поиск и распространение информации. Термины и определения.
13. ГОСТ 7-74-96. Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения.
14. Громов A.B., Чубинидзе К.А. Динамическая классификация для аналитиков // Открытые системы. 2005. №11. С. 42—46.
15. Губин М.В. Исследование качества информационного поиска с использованием пар слов // Научно-техническая информация. Сер.2. 2005. №2. С. 13-16.
16. Губин М.В. Модели и методы представления текстового документа в системах информационного поиска: дис. . канд. ф.-м. наук. Санкт-Петербург, 2005. 89 с.
17. Губин М.В., Морозов А.Б. Влияние морфологического анализа на качество информационного поиска // Электронные библиотеки: перспективные методы и технологии, электронные коллекции : труды 8-й Всерос. науч. конф. Труды RCDL-2006. 2006. С. 224-228.
18. Добрынин В.Ю., Клюев В.В., Некрестьянов И.С. Оценка тематического подобия текстовых документов // Электронные библиотеки: перспективные методы и технологии: Вторая всероссийская научная конференция. 2000. С. 54-62.
19. Дубинский А.Г. Некоторые вопросы применения векторной модели представления документов в информационном поиске //Управляющие системы и машины. 2000. №4. С. 81-84.
20. Дэниел О' Лири. ERP системы. Современное планирование и управление ресурсами предприятия. Выбор, внедрение, эксплуатация, пер с англ. Ю.И. Водяновой. М.: ООО «Вершина», 2004. 272 с.
21. Евстигнеев В.А. Применение теории графов в программировании. М.: Наука, 1985. 352 с.
22. Ермаков А.Е. Неполный синтаксический анализ текста в информационно-поисковых системах // Труды I Международного семинара Диалог'2002. 2002. Т. 2. С. 179-187.
23. Захаров В.П. Информационные системы (документальный поиск). СПб, 2002.- 188 с.
24. Захаров В.П., Хохлова М.В. Анализ эффективности статистических методов выявления коллокаций в текстах на русском языке // Труды международной конференции «Диалог-2006». 2006. С. 137-143.
25. Ивлев В.А., Попова Т.В. Реорганизация и автоматизация систем управления предприятием// Экономика и пр-во. 1998. №11. С.4-9.
26. Информационные технологии и управление предприятием / Баронов В.В., Калянов Т.Н., Попов Ю.Н., Титовский И.Н. М.: Компания АйТи, 2009. 328 с.
27. Информационные технологии управления: Учебное пособие / Под ред. Ю.М. Черкасова. М.: ИНФРА-М, 2001. - 216 с.
28. Калиниченко A.B. Диалоговый метод автоматизации поиска семантически похожих документов // Системы управления и информационные технологии. 2011, №4.1 (46). С. 191- 193.
29. Калиниченко A.B. О методах поиска по документу-образцу в коллекции электронных документов // Материалы X Международной научно-практической конференции «ИТ-технологии: Развитие и приложения» (8-9 декабря 2009 г.). 2009. С.50-59.
30. Калиниченко A.B. Сущность проблемы анализа текста в полнотекстовых поисковых системах. Подходы и пути решения // Журнал научных публикаций аспирантов и докторантов. 2010, №5 (47). С. 112-114.
31. Калиниченко А. В. Автоматизированная система поиска слабоструктурированной информации в составе интегрированной АСУП // V Международная научно-практическая конференция «Современное состояние естественных и технических наук». 2011. С. 103-106.
32. Калиниченко A.B. Оценка эффективности полнотекстового поиска в информационного фонде АСУП // XII международной конференции «Информатика: проблемы, методология, технологии». 2012. С. 166-168.
33. Кириченко К.М, Герасимов М.Б. Обзор методов кластеризации текстовых документов // Материалы международной конференции Диалог-2001. 2001. URL: http://www.dialog-21 .ru/Archive/200 l/volume2/226.htm (дата обращения: 10.02.2010).
34. Клышинский Э.С. Перспективные методы обработки проектной документации//Труды 12й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». 2010. С. 129-134.
35. Когаловский М.Р. Перспективные технологии информационного поиска. М.: ДМК-Пресс, 2003. 288 с.
36. Колесов А. Как организовать поиск в корпоративных системах // PC Week/RE. 2011. №2 (752). URL: http://www.pcweek.ru/idea/article/ detail.php?ID= 127692 (дата обращения: 10.02.2010).
37. Кофман А. Введение в теорию нечетких множеств / Пер. с франц. М.: Радио и связь, 1982. 432 с.
38. Кристофидес Н. Теория графов. Алгоритмический подход. М.: Мир, 1978. 432 с.
39. Кураленок И.Е. Метод предварительной оценки эффективности семантических методов обработки текстовой информации. URL: http://www.rcdl2001 .krc.karelia.ru/papers/papers/ kuralenok/kuralenokpaper.rtf (дата обращения: 10.02.2009).
40. Ландэ Д.В. Основы интеграции информационных потоков. К.: Инжиниринг, 2006. 240 с.
41. Ландэ Д.В. Поиск знаний в Internet. Профессиональная работа. М.: Издательский дом «Вильяме», 2005. 272 с.
42. Ландэ Д.В. Поисковые системы: поле боя семантика // "Телеком". 2004. №4. 44-50 с.
43. Максимович Г.Ю., Романенко А. Г., Самойлюк О.Ф. Информационные системы: Учеб. пособие: 2 изд., испр. и доп. М.: Российск. гос. гуманит. ун-т, 2007. 289 с.
44. Манд ель И. Д. Кластерный анализ. М.: Финансы и статистика, 1988. 176 с.
45. Маннинг К.Д., Рагхаван П., Шютце X. Введение в информационный поиск. / Пер. с англ. М.: ООО «И.Д. Вильяме», 2011. 528 с.
46. Меньков A.B. Острейковский В.А. Теоретические основы автоматизированного управления. М.: Издательство Оникс, 2005. 640 с.
47. Мищеряков В.В. Совершенствование управления промышленным холдингом посредством развития информационного фактора // Современные наукоемкие технологии. 2008. №1. С. 29-33.
48. Некрестьянов И.С. Тематико-ориентированные методы информационного поиска, дис. канд. техн. наук. СПб., 2000. 88 с.
49. Нечеткие множества в моделях управления и искусственного интеллекта / Аверкин А.Н. Батыршин И.З. , Блишун А.Ф., Силов В.Б., Тарасов В.Б., М.: Наука, 1986.312 с.
50. Питеркин C.B., Оладов H.A., Исаев Д.В. Точно вовремя для России. Практика применения ERP-систем. М.: Альпина Бизнес Букс, 2005. 368 с.
51. Погонин В.А., Схиртладзе А.Г. Интегрированные системы проектирования и управления. Корпоративные информационные системы: учеб. пособие. Тамбов: Изд-во Тамб. гос. техн. ун-та, 2006. 144 с.
52. Прикладная статистика. Справочное издание. Классификация и снижение размерности. Том 3. / Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. М.: Финансы и статистика, 1989. 608 с.
53. Роднянский В.Л. О роли ключевых слов в понимании текста // Психолингвистические проблемы семантики и понимания текста. 1986. С. 106-113.
54. Романенко В.Н., Никитина Г.В. Сетевой информационный поиск. СПб.: «Профессия», 2005. 288 с.
55. Рыбников А.И. Система управления предприятием типа ERP. M.: Азроконсалт, 1999. 214 с.
56. Салбиев А.Т. Исследование и разработка автоматизированной информационно-управляющей системы с интегрированной функцией поиска в массиве неструктурированных данных: дис. . канд. техн. наук. Владикавказ, 2007. 133 с.
57. Самардак A.C. Корпоративные информационные системы . Владивосток ТИДОТ ДВГУ, 2003. 252 с.
58. Селезнев К.В. Обработка текстов на естественном языке // «Открытые системы». 2003. № 12. С. 48-53.
59. Солганик Г.Я. Стилистика текста: Учебное пособие. М.: Флинта, Наука, 1997. 256 с.
60. Солтон Дж. Динамические библиотечно-информационные системы / Пер. с англ. М.: Мир, 1979. 558 с.
61. Стрелкова Елена. Интеграция данных предприятия // Открытые системы.2003. №4. С. 58-61.
62. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. Нью-Иорк / Пер. с англ.; под ред. А.И. Китова. М.: «Сов. радио», 1973. 560 с.
63. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А. А. Барсегян, M. С. Куприянов, В. В. Степаненко, И. И. Холод. СПб.: БХВ-Петербург, 2007. 384 с.
64. Ту Дж., Гонсалес Р. Принципы распознавания образов/Пер. с англ. М.: Мир, 1978.413 с.
65. Черняк Л.И. Навстречу системам хранения неструктурированных данных.
66. Открытые системыю.2004. № 3. С. 40^4.
67. Черняк Л.И. От информационно-поисковых систем к корпоративному поиску // «Открытые системы». 2005, № 11. С. 36—40.
68. Чугреев В.Л. Модель структурного представления текстовой информации и метод ее тематического анализа на основе частотно-контекстной классификации, дис. . канд. техн. наук. Санкт-Петербург, 2003. 185 с.
69. Электронные документы в корпоративных сетях / Клименко С.В., Крохин И.В., Кущ В.М., Лагутин Ю.Л. М.: Анкей-Экотрендз. 1999. 272 с.
70. Arthur D., Vassilvitskii S. K-means++: The advantage of careful seeding // Proceedings of the eighteenth annual ACM-SIAM Symposium on Discrete Algorithms. 2007. P. 1027-1035.
71. Baeza-Yates R., Ribeiro-Neto B. Modern Information Retrieval. ACM Press Series / Addison Wesley, New York, 1999. 513 p.
72. Berry M. W., Browne M. Understanding Search Engines Mathematical Modeling and Text. SIAM, Society for Industrial and Applied Mathematics/ 2005. 117p.
73. Christopher D.Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval. Cambridge University Press, 2008. 482 p.
74. Content Analytics research tools for unstructured content and rich media.
75. URL: http://www.aiim.org/PDFDocuments/38914.pdf (дата обращения: 17.11.2011)
76. Dominich S. Mathematical foundations of information retrieval. Springer, 2001. 284 p.
77. Dominich S. The Modern Algebra of Information Retrieval. Springer, 2008. 327 p.
78. Dominich, S. Kiezer, T. A Measure Theoretic Approach to Information Retrieval // Journal of the American Society for Information Science and Technology. 2007. vol. 58, no. 8, P. 1108-1122.
79. Govindaraju V., Ramanathan K. Similar document search and recommendation // Journal of Emerging Technologies in Web Intelligence. Special Issue: Intelligent Web Interaction. 2012. Vol 4, No 1. P. 83-94.
80. Hearst M. Search User Interfaces. Cambridge, Cambridge University Press, 2009. 404 p.
81. Kanade P.M., Hall L.O. Fuzzy Ants as a Clustering Concept // 22nd international conference of the North American^ fuzzy information processing society NAFIPS. Chicago, 2003. P. 227-232.
82. Kelledy F., Smeaton A.F. Automatic Phrase Recognition and Extraction from Text // Proceedings of the 19th Annual BCS-IRSG Colloquium on IR Research. Aberdeen, 1997. P. 493-496.
83. Khan M.S., Khor S.W. Web document clustering using a hybrid neural network // Applied Soft Computing. 2004. Vol. 4. P. 423^32.
84. Landauer Т. K., Foltz P.W., Laham D. Introduction to latent semantic analysis // Discourse Processes. 1998. №25. P.259-284.
85. Manning Christopher D., Schuetze Hinrich. Foundations of statistical natural language processing. The MIT Press Cambridge. 1999. 680 p.
86. Ortiz R., Pinto D., Tovar M., Jim'enez-Salazar H. BUAP: An Unsupervised Approach to Automatic Keyphrase Extraction from Scientific Articles. 2010. P. 174-177.
87. Query expansion using associated queries / B. Billerbeck et al. // Proceedings of the CIKM International Conference on Information and Knowledge Management. New Orleans, Louisiana, 2003. P. 2-9.
88. Salton G., Buckley C. Term-weighting approaches in automatic text retrieval // Information Processing & Management. 1988. Vol. 24. Issue 5. P. 513-523.
89. Sarafoglu R., Tütüncü К., Allahverdi N. A fuzzy clustering approach for finding similar documents using a novel similarity measure // Original Research Article Expert Systems with Applications. 2007. Vol. 33. Issue 3. P. 600-605.
90. Sara90glu R., Tütüncü К., Allahverdi N. A new approach on search for similar documents with multiple categories using fuzzy clustering // Original Research Article Expert Systems with Applications. 2008. Vol. 34. Issue 4. P. 2545-2554.
91. The Expanding Digital Universe. URL: http://www.emc.com/collateral/analyst-reports/expanding-digital-idc-white-paper.pdf (дата обращения: 17.11.2011)
92. Thuy Dung Nguyen and Min-Yen Kan. Keyphrase Extraction in Scientific Publications. 2007. P. 317-326.
93. Turney P. Learning to extract keyphrases from text. Technical Report ERB-1057. (NRC #41622),National Research, 1999. 43 p.
94. Witten I. H., Paynter G. W., Frank E., Gutwin C., Nevill-Manning C. G. Kea: practical automatic keyphrase extraction. // In Proceedings of Digital Libraries 99: The 4th ACM conference on Digital Libraries. 1999. P. 254-255.
95. Zimmermann H.J. Fuzzy Set Theory and its Applications. 3rd ed. Kluwer Academic Publishers. 1996. 315 p.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.