Многоагентная система для поиска и обработки тематико-ориентированной информации тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Карцан, Игорь Николаевич

  • Карцан, Игорь Николаевич
  • кандидат технических науккандидат технических наук
  • 2007, Красноярск
  • Специальность ВАК РФ05.13.01
  • Количество страниц 185
Карцан, Игорь Николаевич. Многоагентная система для поиска и обработки тематико-ориентированной информации: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Красноярск. 2007. 185 с.

Оглавление диссертации кандидат технических наук Карцан, Игорь Николаевич

Введение.

1 Мультиагентпые системы.

1.1 Основные понятия.

1.2 Архитектуры мультиагентпых систем.

1.3 Проектирование мультиагентных систем.

1.4 Агеитные системы и поиск информации.

1.5 Типовая структура и алгоритмы поисковой мультиагентной системы.

Выводы по разделу 1.

2 Принципы организации поисковых систем сети Internet.

2.1 Проблемы поиска в Интернете.

2.2 Виды и принципы работы поисковых систем.

2.3 Особенности поисковых систем и каталогов.

2.4 Принципы организации поисковых систем.

2.5 Метапоисковые системы.

2.6 Персонифицированная поддержка навигации в сети Internet.

2.7 Этапы процесса персонификации.

2.8 Системы создания информационных ресурсов и информационные ресурсы с поддержкой персонификации.

2.9 Перспективы применения персонификации в информационных системах.

Выводы по разделу 2.

3 Модели и алгоритмы многоагентных систем поиска и обработки мультилиигвистической информации.

3.1 Обобщенный алгоритм работы поисковых систем.

3.2 Модели информационного поиска.

3.3 Алгоритмическое обеспечение тематико-ориентированного мониторинга и персонификации.

3.4 Оценка качества поисковых алгоритмов.

Выводы по разделу 3.

4 Система формирования и управления тематическими коллекциями узкоспециализированной информации.

4.1 Функциональная структура системы.

4.2 Алгоритм работы подсистемы формирования тематико-ориентированных коллекций.

4.3 Алгоритм работы подсистемы обработки пользовательского запроса.

4.5 Реализация алгоритмов системы поиска информации.

4.6 Реализация алгоритмов системы обработки пользовательского запроса.

4.7 Архитектура подсистемы тематико-ориентированного мониторинга.

4.8 Проведение эксперимента.

Выводы по разделу 4.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Многоагентная система для поиска и обработки тематико-ориентированной информации»

Информационные технологии и компьютерные информационно-поисковые системы занимают все более существенное место в науке и образовании. И, естественно, возрастает потребность в оперативно доступных научно-образовательных материалах, позволяющих одновременно улучшить и ускорить как процесс обучения, так и научно-технический прогресс. Кроме того, в последние годы отмечается рост количества иностранной литературы, необходимой студентам, специалистам и инженерам, а также научным сотрудникам, что обуславливает потребность в иностранной научно-технической и познавательной информации. Поэтому неудивительно, что все больше внимания уделяется Internet, как обширному справочному инструменту. Это не случайно, тенденция развития Internet-технологий не стоит на месте. Ежедневно увеличивается количество информационных ресурсов, предоставленных для открытого доступа, увеличивается сфера развлечений и бизнеса. Все это позволяет сделать вывод о том, что увеличивается объем те-матико-ориентированной информации по всевозможным предметным областям. Так же развитие глобальной сети и широкие возможности подключения к ней обусловили увеличение числа пользователей Internet.

Однако, несмотря на популярность и динамический рост глобальной сети, Internet до сих пор при поиске информации возникает множество вопросов. На текущий момент времени можно выделить три типа поисковых машин в сети: поисковые сервисы, каталоги и относительно новый вид - ме-тапоисковые технологии. Самое интересное в их работе состоит то, что их принципы обработки и управления информации существенно отличаются друг от друга. На текущий момент времени производятся попытки по комбинированию данных алгоритмов и методов. Однако большинство данных исследований останавливаются только на этапе совмещения информационных баз, а не на выработке принципиально новых комбинированных поисковых агентов. А ведь комбинированные сервисы позволят решить проблему информационной избыточности сети Internet. Также большинство крупных поисковых систем строится на агентном принципе, что позволяет производить модификацию отдельных агентов не зависимо от работоспособности системы в целом.

Диссертационное исследование направлено на решение следующей научной проблемы, включающей: поиск тематико-ориентированной информации для формирования и актуализации тематико-ориентированных коллекций (сервисов); компьютерный анализ тематико-ориентированной информации с целью определения принадлежности ее к предметной области, для отнесения документов к рубрикам тематической коллекции (сервиса); использование частотных характеристик терминов для определения коэффициента ранжирования информации в рамках тематической коллекции (сервиса); организация отклика системы для конечного пользователя тематико-ориентированной коллекции (сервиса).

Наличие данных проблем, которые охватывают весь процесс работы тематико-ориентированного информационного сервиса, и обуславливает актуальность работы.

Объектом диссертационного исследования являются поисковые сервисы и тематико-ориентированные коллекции сети Internet.

Предмет исследований - модели и алгоритмы многоагентной сетевой поисковой технологии на основе компьютерных методов обработки информации.

Цель диссертационной работы: повышение эффективности много-агентных систем для поиска, анализа и компьютерной обработки тематико-ориентированной информации за счет реализации новых поисковых технологий, основанных на специализированных тематических коллекциях.

Поставленная цель достигается путем решения следующих задач:

• анализ компьютерных систем поиска и метапоиска информации в глобальной сети Internet;

• анализ алгоритмов работы многоагентных систем поиска и обработки информации в сети Internet;

• анализ существующих подходов к мониторингу различных аспектов работы пользователей с информационными системами и используемых в них алгоритмов и методов моделирования объектов предметной области;

• модификация и разработка новых алгоритмов поиска и управления информацией в тематико-ориентированных коллекциях, обеспечивающих высокий уровнь релевантности поисковых процедур;

• разработка алгоритма определения уровня релевантности Internet-отклика запросу, удовлетворяющему предметной области и тематике запроса в рамках многоязычной предметной области, с использованием мультилингвистических частотных словарей;

• разработка алгоритма тематико-ориентированного мониторинга предпочтений пользователя информационной системы и метода определения тематических предпочтений пользователя;

• разработка независимой структуры многоагентной системы с возможностью применения предлагаемых агентов в любых системах поиска и обработки информации в сети Internet.

Методы исследования

При выполнении работы использовались методы системного анализа, методы поиска и управления информацией, методологии структурного анализа и проектирования сложных систем, статистические методы обработки данных, аппарат теории графов.

Научной новизной обладают следующие результаты работы:

- алгоритм анализа отклика системы на пользовательский запрос при многоагентном поиске и обработке информации;

- алгоритмы ранжирования и определения релевантности узкоспециализированной информации для тематико-ориентированных коллекций;

- алгоритмическое обеспечение и архитектура подсистемы тематико-ориентированного мониторинга пользователей узкоспециализированной информационной коллекции;

- многоагентная система на базе метапоисковой технологии, обеспечивающая эффективное формирование и актуализацию тематико-ориентированных коллекций;

- структура и программная реализация многоагентной системы персонифицированного поиска и обработки тематико-ориентированной информации.

Значение для теории. Результаты, полученные в ходе выполнения диссертационной работы, создают теоретическую основу для разработки методов и алгоритмов формирования персонализированных компьютерных систем поиска и обработки тематико-ориентированной информации. Обоснована возможность применения частотных мультилингвистических тематических словарей для формирования и управления тематико-ориентированными коллекциями (сервисами).

Практическая ценность

Разработанное в диссертации модельно-алгоритмическое обеспечение позволяет повысить эффективность функционирования адаптивных много-агентных систем поиска информации и улучшить качество компьютерной обработки информации при анализе релевантности электронных документов. Это возможно в рамках нового направления в поисковой технологии анализа и управления информацией в Internet, основанного на многоязычных тематико-ориентированных частотных словарях. Разработанная в диссертации программная система обеспечивает автоматизированный поиск и формирование информационно-терминологического базиса мультилингвистической адаптивно-обучающей технологии.

Использование системы позволяет:

• эффективно формировать и управлять тематико-ориентированными коллекции узкоспециализированных источников информации (журнальные статьи, книги, монографии, диссертации и т.п. по заданным предметным областям);

• производить автоматизированный анализ тематических коллекций на качество представленной в них информации с точки зрения принадлежности к предметной области.

Реализация результатов работы

Разработанная автором диссертации компьютерная система поиска и обработки информации принята в опытную эксплуатацию на кафедрах Информатики, Информационных технологий и Юнеско Сибирского федерального университета.

Структура и объем работы. Диссертационная работа состоит из введения, четырех разделов, заключения и списка использованной литературы из 108 наименований.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Карцан, Игорь Николаевич

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Проведен анализ многоагентных систем поиска и метапоиска информации в глобальной сети Интернет. Показано, что использование мультилингвистических частотных узкоспециализированных словарей для поисковых технологий в сети Internet повышает эффективность сетевых поисковых сервисов как при определении уровня релевантности, так и при ранжировании информации.

2. В результате выполненного анализа существующих подходов к мониторингу различных аспектов работы пользователей тематических коллекций предложен и реализован алгоритм обработки запроса пользователя тематической коллекции с учетом его требований и информации об истории документов, хранимых в системе, что позволяет автоматизировать анализ результатов отклика системы.

3. Впервые предложены и реализованы алгоритмы поиска, ранжирования и определения релевантности исходной информации с использованием мультилингвистических тематических словарей для формирования мультилингвистических тематико-ориентированных информационных коллекций.

4. Реализованы и апробированы процедуры применения мультилингвистических частотных словарей для поиска узкоспециализированной информации в Internet, позволяющие производить персонифицированный поиск при максимальном охвате заданного сегмента сети Internet.

5. Разработан и реализован алгоритм обработки информации для определения уровня релевантности документов в отклике системы, что позволяет производить отсев нерелевантных документов в автоматизированном режиме. За счет этого время на обработку отклика снижается на 90% по сравнению с ручным режимом обработки информации.

6. Разработано алгоритмическое обеспечение и архитектура системы тематико-ориентированного мониторинга пользователей сети Internet и ее программная реализация в виде модельного прототипа, включающее алгоритмы тематико-ориентированного мониторинга предпочтений пользователя системы и формирования персонифицированного навигационного меню пользователя.

7. Предложена и реализована принципиально новая структура мно-гоагентной системы поиска и обработки информации, которая включает следующие блоки: интерфейсный агент; блок поиска информации с использованием тематико-ориентированных частотных многоязычных словарей; блок обработки информации, который так же использует тематико-ориентированные частотные многоязычные словари; блок тематико-ориентированного мониторинга (на основе профиля пользователя).

Таким образом, предложенная и реализованная в данной диссертационной работе система, позволяет эффективно решать задачи формирования и управления тематическими коллекциями узкоспециализированной информации с использованием частотных мультилингвистических словарей в сети Internet, что имеет существенное значение для теории и практики решения задач анализа и обработки мультилингвистической информации.

Перспективным направлением является дальнейшее развитие предлагаемых алгоритмов и методик определения релевантности и ранжирования информации в поисковых сервисах сети Internet.

ЗАКЛЮЧЕНИЕ

Список литературы диссертационного исследования кандидат технических наук Карцан, Игорь Николаевич, 2007 год

1. Движение, А.Н. Гарантоспособные вычисления: от идей до реализации в проектах / А.Н. Движение, Ж.-К. Лапри // ТИИЭР № 5, 1986. с. 8-21.

2. Адомавичус, Г. Использование методов добычи данных для создания профилей потребителей / Г. Адомавичус, А. Тужилин //Открытые системы №05-06/2001

3. Атанов, Г.А. Структурирование понятий предметной области с помощью методов представления знаний/ Г.А. Атанов, И.Н. Пустынникова //Искусственный интеллект, №2, 1997. с.29-40.

4. Башмаков, А.И. Технология и инструментальные средства проектирования тренажерно-обучающих комплексов для профессиональной подготовки и повышения квалификации. Часть 1. /А.И. Башмаков, И.А. Башмаков //Информационные технологии. №6, 1999. - с.40-45.

5. Башмаков, А.И. Технология и инструментальные средства проектирования тренажерно-обучающих комплексов для профессиональной подготовки и повышения квалификации. Часть 2. /А.И. Башмаков, И.А. Башмаков //Информационные технологии. №7, 1999. - с.39-45.

6. Бовтенко, М.А. Компьютерная лингводидактика: Учеб. пособие. Новосибирск: Изд-во НГТУ, 2000.

7. Бунин О. Персонификация сайтов Internet / О. Бунин, А. Зыков // Computerworld // №15-16/2001.

8. Буч Г, Язык UML. Руководство пользователя / Грейди Буч, Джеймс Рам-бо, Айвар Джекобсон: Пер. с англ. Слинкин А. А. — 2-е изд., стер — М.: ДМК Пресс; СПб.: Питер, 2004. — 432 е.: ил.

9. Ван Лоун, Ч. Матричные вычисления. Издательство "Мир", Москва, 1999.

10. Вендров, А.М. CASE-технологии. Современные методы и средства проектирования информационных систем. М.: Финансы и статистика, 1998.

11. Вендров, A.M. Один их подходов к выбору средств проектирования баз данных и приложений //Системы управления базами данных. №3, 1995. - с.75-86.

12. Вторая ежегодной конференции «Поисковая оптимизация и продвижение сайтов». 2002 http://www.wmate.ru.konf.htm.

13. Гаврилова, Т.А. Адаптивный диалог и модель пользователя / Т.А. Гаври-лова, Е.В. Зудилова//Диалог-95: материалы международного семинара по компьютерной лингвистике и ее приложениям. Казань, 1995. - с.88-97.

14. Гаврилова, Т.А. Базы знаний интеллектуальных систем. / Т.А. Гаврилова, В.Ф. Хорошевский // СПб.: Питер, 2001. 384с.

15. Гмурман, В.Е. Теория вероятностей и математическая статистика. — Учеб. пособие. М.: Высш. шк., 2000, — 479 с.

16. Даконта, М. XML и Java 2. / М. Даконта, А. Саганич // СПб.: Питер, 2001. -384с.

17. Джексон, Г. Проектирование реляционных баз данных для использования с микро-ЭВМ. М.:Мир, 1991.

18. Зеленков, П.В. Автоматизация формирования информационно-терминологического базиса мультилингвистических обучающих техноло-гий/И.В. Ковалев, П.В. Зеленков//Телекоммуникации и информатизация образования. №3 (28), 2005. - С. 68-82.

19. Зеленков, П.В. Автоматизация формирования мультилингвистического информационного базиса систем адаптивного обучения терминологической лексике текст. дис. канд. тех. наук: 05.13.01 /Ковалев И.В. Красноярск, 2003 - 136 с. - библиогр. 126-136 с.

20. Зеленков, П.В. Проблема развития метапоисковых технологий/ П.В. Зеленков, Т.А. Ковалева// Вестник НИИ СУВПТ № 14: Сб. науных трудов /Под общей ред. профессора Н.В. Василенко. Красноярск: НИИ СУВПТ. - 2004. - Вып. 14. - С. 95-103.

21. Зеленков, П.В. Программная система «Multi-BasisOptimization у1.0»/Ковалев И.В., Зеленков П.В., Огнерубов С.С., Ежеманская С.Н.// Компьютерные учебные программы и инновации. №7, 2005. - С. 20-21.

22. Калянов, Г.Н. CASE структурный и системный анализ. Автоматизация и применение. М.: Изд-во «ЛОРИ», 1996.

23. Калянов, Г.Н. Консалтинг при автоматизации предприятий. Подходы, методы, средства. -М.: СИНТЕГ, 1997.

24. Калянов, Г.Н. Сравнение и проблема выбора методов структурного системного анализа / Г.Н. Калянов, A.B. Козлинский, В.Н. Лебедев //PC WEEK/RE. №34, 1996.

25. Калянов, Г.Н. Сравнительный анализ структурных методологий / Г.Н. Калянов, A.B. Козлинский, В.Н. Лебедев //Системы управления базами данных. №5, 1997. - с.75-78.

26. Карберри, С. Модели пользователя: проблема неадекватности //Новое в зарубежной лингвистике. Вып. 24. - М., 1989. - с.259-291.

27. Карцан, H.H. Метапоисковая мультилингвистическая система Текст. / М.В. Карасева, И.Н. Карцан, П.В. Зеленков // Вестник СибГАУ: Сб. на-учн. трудов/ Под общ. ред. проф. Г.П.Белякова; Красноярск: СибГАУ. -2007.-Вып. 3(16).-С. 130-131.

28. Карцан, И.Н. Инструментарий поисковых систем сети Интернет Текст. / П.В. Зеленков, И.Н. Карцан, П.М. Лохмаков // Вестник НИИ СУВПТ: Сб. научн. трудов/ Под общ. ред. проф. Н.В.Василенко; Красноярск: НИИ СУВПТ. 2006. - Вып. 23. - С. 103-118.

29. Карцан, И.Н. Многоагентная система компьютерной обработки узкоспециализированной информации Текст. / И.Н. Карцан // Вестник НИИ СУВПТ: Сб. научн. трудов/ Под общ. ред. проф. Н.В.Василенко; Красноярск: НИИ СУВПТ. 2006. - Вып. 24. - С. 3-9.

30. Карцан, И.Н. Алгоритмическое обеспечение тематико-ориентированного мониторинга и персонификации информационных ресурсов Текст. / И.Н.

31. Карцан // Вестник НИИ СУВПТ: Сб. научн. трудов/ Под общ. ред. проф. Н.В.Василенко; Красноярск: НИИ СУВПТ. 2006. - Вып. 24. - С. 10-15.

32. Карцан, И.Н. Мультиагентные технологии поиска информации в распределенных источниках Текст. / И.Н. Карцан, Д.В. Кустов // Вестник НИИ СУВПТ: Сб. научн. трудов/ Под общ. ред. проф. Н.В.Василенко; Красноярск: НИИ СУВПТ. 2003. - Вып. 14. - С. 22-30.

33. Кириллов, В.П. ББАЭМ передовая технология разработки автоматизированных систем //Компьютеры + программы. - №2, 1994. - с. 8-17.

34. Когаловский М.Р. Перспективные технологии информационных систем. —М.: ДМК-Пресс. 2003. — 288с.

35. Кривошеев, А.О. Перспективные internet-технологии информационного обеспечения образовательных услуг Часть 1. / А.О. Кривошеев, Г.С. Го-ломидов, А.Н. Таран //Информационные технологии. №7, 1998. - с.38-44.

36. Макфредрис, П. Создание Web-страниц. М.: Астрель, 2004. - 230 с.

37. Манако, В. Коллекции интерактивных словарей для непрерывного обучения индивидуала. / В. Манако, А. Манако, К. Синица //Educational Technology & Society, 2001 № 4(1), http://ifets.ieee.Org/russian/depository/v4il/html/2.html

38. Марка, Д.А. Методология структурного системного анализа и проектирования SADT. М.: Метатехнология, 1993.

39. Медведев, А.В. Основы теории обучающихся систем. Учеб. пособие. Красноярск, КПИ, 1982. — 108 с.

40. Некрестьянов, И.С. Тематико-ориентированные методы информационного поиска текст. дис. канд. физ. мат. наук: 05.13.11 /Новиков Б.А. -Санкт-Петербург, 2000 136 с. - библиогр. 126-136 с.

41. Нелюбин, Л.Л. Компьютерная лингвистика и машинный перевод. М., 1991.

42. Перегудов Ф.И., Тарасенко Ф.П. Основы системного анализа- Томск: Изд-во НЛТ, 1997.-396 с.

43. Позин, Б.А. Современные средства программной инженерии для создания открытых прикладных информационных систем //Системы управления базами данных. -№1, 1995. с. 139-144.

44. Поисковый сайт Апорт. www.aport.ru

45. Поисковый сайт Рамблер. www.rambler.ru

46. Поисковый сайт Яндекс. www.yandex.ru.

47. Проект SESP (Search Engine Standards Project). Стандарты работы поисковых служб. http://www.searchenginewatch.com/standards/990204.html. -1999.

48. Результат исследования поведения более 20 млн. пользователей сети. -www.searchenginewatch.com/reports/netratings.html 1999.

49. Рубан А.И. Методы анализа данных. Учеб. пособие: В 2 ч. Ч. 1; КГТУ. Красноярск, 1994, —220 с.

50. Русский морфологический анализ. http://company.yandex.ru/articles/article 1 .html.

51. Русскин, В.М. Информационная методология SSADM: методика моделирования информационных потоков при разработке автоматизированных систем / В.М. Русскин, В.П. Кириллов //Компьютеры + программы. №3, 1995. - с.15-23.

52. Сайт толкового словаря. www.glossary.ru.

53. Серия опросов посвященных Internet активности. -http.V/www.yandex.ru.polling/index.html

54. Слынько Ю., Арсеньев С., Универсальная платформа интеллектуального бизнеса / Слынько Ю., Арсеньев С., // Открытые системы. — № 10/2001.

55. Стюарт Р., Норвиг П. Искусственный интеллект: современный подход, 2-е изд.: пер. с англ. — М.: Издательский дом «Вильяме», 2006. — 1408 с.

56. Талантов, М. Поиск в Интернете: подводные камни. // КомпьютерПресс №9, 1999.-е. 46-52.

57. Усачев, A.B. Мнемотехника мультилингвистического подхода. Труды XL Международной научной студенческой конференции "Студент и научно-технический прогресс": Информационные технологии. Новосибирск, НГУ, 2002г. С. 97-103.

58. Усачев, A.B. Нейросетевая кластеризация множественных значений терминологии с учетом лингвистической избыточности. Вестник НИИ

59. СУВПТ, сборник научных трудов, Красноярск, 2003г. С. 140-150.

60. Штрик, A. CASE: автоматизированное проектирование программного обеспечения //Монитор. №4,1992. - с.4-6.

61. Albrecht F., Koch N., Tiller T. SmexWeb: An Adaptive Web-based Hypermedia Teaching System.// Journal of Interactive Learning Research, Special Issue on Intelligent Systems/Tools in Training and Lifelong Learning. 2000. P. 367-388.

62. Andre E., Rist Т.: Towards a New Generation of Hypermedia Systems: Extending Automated Presentation Design for Hypermedia.// Report. DFKI GmbH. Saarbrucken. 1996.

63. Brusilovsky P. Methods and techniques of adaptive hypermedia.// User Modeling and User Adapted Interaction. 1996. Vol. 6. P. 87-129.

64. Cohn, D. Learning to probabilistically identify authoritative documents. In Proc. 17th International Conf. on Machine Learning, pages 167-174,2000.

65. Cutler M., Sterne J.: «E-Metrics» NetGenesis Corp., 2000

66. Danny Sullivan. Invisible Web Gets Deeper. 2000. http://www.searchenginewatch.com/sereport/00/08-deepweb.html

67. Dumais, S. Latent semantic indexing: TREC-3 report. In Proc. of the Third Text REtrieval Conference, 1995.

68. Fink J., Kobsa A. A Review and Analysis of Commercial User Modeling Servers for Personalization on the WWW.// User Modeling and User-Adapted Interaction. 2000. P. 209-249

69. Foltz, P.W. Using latent semantic indexing for information filtering. In ACM Conference on Office Information Systems (COIS), pages 40-47, 1998.

70. Gay, G. Collaborative Design in a Networked Multimedia Environment: Emerging Communication Patterns //Journal of Research on Computing in Education. Vol.26, Iss.3. - Spring, 1994. - Pp.418-432.

71. Goodfellow, R. CALL Programs for Vocabulary Instruction //Computer Assisted Language Learning Journal. Vol.8. - №2, 1995. - Pp.205-226.

72. Greg R. Notess. Search Engines Statistics. 2002. http://www.searchengineshowdown.com/stats/overlap.shtml

73. Internet Exceeds 2 Billion Pages. «Cyveillance», 2000. http://www.cyveillance.com/web/newsroom/releases/2000/2000-07-10.htm

74. Hopfield, J.J. Neural networks and physical systems with emergent collective computational abilities. Proc. Natl. Acad. Sci. 79,1982. p. 2554-2558.

75. Kleinberg, Jon M. Authoritative sources in a hyperlinked environment // Journal of the ACM, 46(5): 604-632, 1999.

76. Koch, T. The building and maintenance of robot based internet search services: A review of current indexing and data collection methods. Technical report, Lund University Library, Sweden, 1996.

77. Lawrence, S. Searching the World Wide Web. Science, 280(5360): 98-100, 1998.

78. Maganti, A. An investigation of linguistic features and clustering algorithms for topical document clustering. In Proc. of the SIGIR'2000, 2000.

79. Moran, S. The stochastic approach for link-structure analysis (salsa) and the tkc effect. In Proc. WWW9, 2000.

80. Mueller, Ch. Initiation a la statistique linguistique. Paris, 1978.

81. Nielsen J. Making Web Advertisements Work http://www.useit.com/alertbox/20030505.html.

82. Nielsen J. Intranet Portals: A Tool Metaphor for Corporate Information http://www.useit.com/alertbox/20030331 .html.

83. Nielsen J. Intranet Portals Get * Streamlined http://www.useit.com/alertbox/portals.html.

84. Nielsen J. Personalization is Over-Rated http://www.useit.com/alertbox/981004.html.

85. Obraczka, K. Distributed indexing of autonomous Internet services. Computing Systems, 5(4):433-459,1992.

86. Page, L. The pagerank citation ranking: Bringing order to the web. Technical report, Stanford Digital Libraries, 1998.

87. PageRing b Google http://digits.ru/articles/promotion/pagerank.html.

88. Powell, A. Evaluating database selection techniques: A testbed and experiment. In Proc. of the SIGIR'98, Melbourne, Australia, August 1998.

89. Rauch Henzinger, M. Improved algorithms for topic distillation in a hyperlinked environment. In Proc. Research and Development in Information Retrieval, pages 104-111,1998.

90. Ravi Kumar, S. Prabhakar Raghavan, Sridhar Rajagopalan, Andrew Tomkins, David Gibson, and Jon Kleinberg. Mining the Web's link structure. Computer, 32(8):60-67,1999.

91. Ribeiro-Neto, B. Modern Information Retrieval. ACM Press, 1999.

92. Salton, G. Introduction to modern Information Retrieval. McGraw-Hill Computer Science Series. McGraw-Hill, New York, 1983.

93. Schafer J.B., Konstan J.A., Riedl J., "E-Commerce Recommendation Applications", J. Data Mining and Knowledge Discovery, Jan. 2001

94. Soumen, Chakrabarti. Integrating the document object model with hyperlinks for enhanced topic distillation and information extraction. In Proc. WWW10, 2001.

95. Strachan, L., Anderson, J., Sneesby, M., Evans M.: Minimalist User Modelling in a Complex Commercial Software System. / User Modeling and User-Adapted Interaction 10. P. 109-146, 2000.

96. Weiss, R. HyPursuit: A hierarchical network search engine that exploits content-link hypertext clustering. In Proc. of Seventh ACM Conference on Hypertext, March 1996.

97. Zelenkov, P. Multilingual Adaptive Method of Learning Foreign Languages /Р. Zelenkov, E.Kofman// труды международной конференции « 14th IST Mobile & Wireless Communications Summit». Дрезден Германия: Technische Universität Dresden, 2005г. - C.228-233.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.