Модели и алгоритмы классификации объектов по специальным иерархическим классификаторам на основании тематической близости текстовых признаков тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Овчинников, Степан Александрович
- Специальность ВАК РФ05.13.01
- Количество страниц 144
Оглавление диссертации кандидат технических наук Овчинников, Степан Александрович
АННОТАЦИЯ.
ВВЕДЕНИЕ.
ПЕРЕЧЕНЬ СОКРАЩЕНИЙ, УСЛОВНЫХ ОБОЗНАЧЕНИЙ, СИМВОЛОВ И
ТЕРМИНОВ.
ГЛАВА 1. ОБЗОР МОДЕЛЕЙ И АЛГОРИТМОВ КЛАССИФИКАЦИИ ОБЪЕКТОВ.
1.1 Введение.
1.2 Содержательная постановка задачи классификации.
1.3 Понятие классификации. Разновидности классификаторов.
1.4 Признаки.
1.5 Функция расстояния (метрика) в пространстве признаков.
1.6 Модели текста в методах классификации.
1.7 Цели исследования.
ГЛАВА 2 МОДЕЛЬ ДЛЯ ПОСТАНОВКИ И РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ ОБЪЕКТОВ, ОПИСАННЫХ ТЕКСТОВЫМИ ПРИЗНАКАМИ. МОДЕЛЬ АНАЛИЗА ТЕМАТИЧЕСКОЙ БЛИЗОСТИ ТЕКСТОВ.
2.1 Основные определения.
2.2 Постановка задачи классификации в общем виде.
2.3 Модель анализа тематической близости.
2.4 Постановка задачи классификации на основе анализа близости текстовых признаков.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Модель структурного представления текстовой информации и метод ее тематического анализа на основе частотно-контекстной классификации2003 год, кандидат технических наук Чугреев, Валерий Леонидович
Разработка и исследование методов построения атрибутного тематического классификатора документов2009 год, кандидат технических наук Ха Ти Чунг
Логико-лингвистический интегратор русскоязычных текстов для информационной системы в строительстве2004 год, кандидат технических наук Марлов, Александр Владимирович
Разработка и исследование модели нейросетевого метода анализа текстовых документов2009 год, кандидат технических наук Шеменков, Павел Сергеевич
Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки2003 год, кандидат технических наук Сбойчаков, Константин Олегович
Введение диссертации (часть автореферата) на тему «Модели и алгоритмы классификации объектов по специальным иерархическим классификаторам на основании тематической близости текстовых признаков»
4.2 Архитектура автоматизированной системы КЕТА. Аспекты реализации.82
4.3 Представление данных в системе КЕТА.84
4.4 Решение задачи классификации основных фондов.88
4.5 Расчет доверительных интервалов серии экспериментов. Оценка экспериментальных данных.101
4.6 Основные результаты и выводы по главе 4.102
ЗАКЛЮЧЕНИЕ.102
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ.104
ПРИЛОЖЕНИЕ А. ПОНЯТИЯ КЛАССИФИКАЦИИ. ИСТОРИЧЕСКИЕ ПРИМЕРЫ КЛАССИФИКАТОРОВ.117
ПРИЛОЖЕНИЕ Б. ОПРЕДЕЛЕНИЯ ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ПОНЯТИЙ
126 3
ПРИЛОЖЕНИЕ В. ТЕМАТИЧЕСКИЙ РУБРИКАТОР ПОИСКОВОЙ СИСТЕМЫ, ОСНОВАННЫЙ НА ТЕМАТИЧЕСКОЙ БЛИЗОСТИ ТЕКСТОВЫХ
ПРИЗНАКОВ ОБЪЕКТОВ.130
ПРИЛОЖЕНИЕ Г. МНОГОУРОВНЕВЫЕ СПЕЦИАЛЬНЫЕ КЛАССИФИКАТОРЫ, ОСНОВАННЫЕ НА ТЕМАТИЧЕСКОЙ БЛИЗОСТИ
ТЕКСТОВЫХ ПРИЗНАКОВ ОБЪЕКТОВ КЛАССИФИКАЦИИ.132
ПРИЛОЖЕНИЕ Д. АНАЛИЗ ТАБЛИЦЫ ОСНОВНЫХ ФОНДОВ.136
ПРИЛОЖЕНИЕ Е. ПРОТОКОЛ ЭКСПЕРИМЕНТОВ.138
Аннотация
Документ представляет собой диссертацию на соискание степени кандидата технических наук по специальности «Системный анализ, управление и обработка информации». Работа посвящена разработке новых моделей и алгоритмов классификации объектов на основе анализа тематической близости значений естественно-языковых признаков.
Введение
Актуальность темы исследования
В настоящее время в различных областях человеческой деятельности накоплено огромное количество информации о различных материальных и нематериальных сущностях, их свойствах, поведении и связях [50][120]. Работа любого эксперта с набором понятий и сущностей всегда строится на использовании классификаций (на данном этапе будем называть классификацией способ объединения объектов в группы по их близости в рассматриваемой предметной области).
Построение классификаторов и механизмов классификации является хорошо известной задачей искусственного интеллекта и на протяжении многих лет является одним из наиболее востребованных и интенсивно развивающихся разделов соответствующей области знания [П4][75][41]. Классификатор объектов характеризуется качеством классификации и сложностью алгоритма распознавания новых объектов. Меры качества классификации традиционно делят на внешние (экспертные) и внутренние (меры, вычисляемые на основе анализа разделения объектов по группам) [67].
Наряду с наборами данных, содержащими одни только числа, все больший вес в принятии решений приобретают данные сложных, нетривиально интерпретируемых типов, главным из которых является текст. Все чаще важная для анализа информация представлена в виде текстов на естественном языке [50][59][60][61].
Отметим, что наиболее часто в реальных задачах речь идет о классификации наименований или описаний объектов.
Современные задачи классификации объектов тесно связаны с имеющимися классификаторами. Так, например, общее количество объектов, которые подлежат классификации по общероссийскому классификатору основных фондов ОКОФ, составляет более 1 миллиарда в настоящий момент и порядка 40 миллионов обновляется ежегодно (материалы сайта Госкомстата России gks.ru за 2004
2005 годы [29]). При этом классификатор ОКОФ содержит более 11000 групп объектов, и размерность задачи абсолютно исключает ручное выполнение такой классификации как по техническим, так и по экономическим соображениям.
Построение эффективной системы управления сферой образования, согласно концепции информационного обеспечения индустрии образования программы «Научное, научно-методическое, материально-техническое и информационное обеспечение системы образования» (Поляков 1999) также невозможно без разработки единой системы учета и классификации объектов, описанных текцНи стовыми признак [109][110][111].
Очевидно, что подобные задачи классификации малоформализованной информации могут решаться только с помощью автоматизированных систем (Поляков 2001 [111], Поспелов 1981 [112]).
Однако существующие модели естественного языка и алгоритмы анализа текстов на естественном языке, как правило, направлены на анализ текстов путем построения модели заложенных в тексте знаний. Даже наиболее развитые модели текста (Апресян 1989 [20], Мельчук 1965 [79], Жолковский 1967 [64], Растье 1990 [60], Красилов 1961 [59]) не позволяют решать задачу классификации наименований с требуемым уровнем эффективности, так как либо чрезвычайно сложны и специфичны, либо не имеют алгоритмического обеспечения предлагаемых в них методов.
Естественный язык как объект исследования рассматривается в различных предметных областях, таких как логика, аналитическая философия, филология и герменевтика как наука об интерпретации текстов [40], структурная лингвистика, семиотика как наука о знаковых системах [36], языкознание.
Несмотря на большое количество разработанных лингвистических моделей и методов классификации текстов (Поспелов 1973 [120]), задача анализа текстов на естественных языках решается недостаточно хорошо [24]. Таким образом, актуальной является задача разработки и внедрения алгоритмов классификации и кластеризации объектов, в описании которых присутствуют естественноязыковые признаки.
Цель работы
Целью работы является повышение эффективности выполнения классификации объектов, описанных естественно-языковыми признаками на основе тематической близости за счет разработки и применения новой модели, новых метрик в пространствах текстовых признаков, алгоритмов многоуровневой классификации. Под повышением эффективности понимается сокращение трудоемкости относительно ручной классификации при качестве классификации, не уступающем автоматизированным аналогам.
Для достижения данной цели были поставлены и решены следующие задачи:
- исследовать подходы к сравнению текстовых признаков, провести обзор моделей, алгоритмов и систем классификации на основании тематической близости текстовых признаков;
- описать особенности рассматриваемого класса задач, постановку задачи, описать модель представления текста для задачи анализа тематической близости, сформулировать задачу классификации с применением модели текстового признака;
- разработать алгоритмы решения задачи классификации на модели, в том числе алгоритмы вычисления расстояния в пространстве текстовых признаков;
- реализовать модели и алгоритмы в программном комплексе, проверить работу модели и алгоритмов на реальных задачах.
Методы исследований
Для решения поставленных задач были использованы методы системного анализа, методы искусственного интеллекта, методы интеллектуального анализа данных, а также применялись положения теории объектно-ориентированного проектирования программных систем и теории проектирования реляционных баз данных.
Научная новизна
Научная новизна работы заключается в следующем:
- предложено описание текстового признака объекта классификации, отличающееся от известных возможностью представления множества вариантов связей слов в предложениях, синонимии, тематической близости слов и позволяющее рассчитывать метрику в пространстве текстовых признаков, описывающем группы специальных иерархических рубрикаторов с учетом явления многозначности слов и вариативности описаний объектов классификации различными экспертами;
- предложена новая метрика для текстовых признаков объектов классификации, отличающаяся от известных возможностью построить жадный алгоритм выбора наиболее близких групп, построен алгоритм поиска оптимального сопоставления моделей текстовых признаков объектов классификации;
- предложен новый подход к оценке тематической близости понятий, отличающихся от известных совместным использованием словарей синонимов, толковых словарей, методов контент-анализа и позволяющий наполнять нужной информацией систему автоматизированной классификации, осуществлять гибкую настройку алгоритмов с учетом специфики задачи;
- впервые модифицирован подход к многоуровневой классификации, отличающийся построением агрегированных описаний групп по описаниям входящих в группы объектов с возможностью вычисления расстояния по методу ближайшего соседа;
Практическая ценность
Практическая ценность работы заключается в разработке подхода к решению задачи классификации объектов по специальным иерархическим классификаторам на основании тематической близости текстовых признаков, решением важной прикладной задачи классификации по классификатору ОКОФ.
Практическая применимость подхода доказана актом о внедрении (Акт № 1 к договору на создание и передачу научно-технической продукции № 57/732-06 от 11 июня 2006 года) и успешным применением к решению задачи классификации основных фондов по общероссийскому классификатору основных фондов.
Достигнуты следующие результаты.
- решены прикладные задачи классификации объектов, описанных естественноязыковыми признаками (ОКОФ);
- описаны и реализованы общие алгоритмы построения бета-моделей текста, реализованы алгоритмы вычисления расстояния в пространствах слов и бета-моделей;
- спроектирована и реализована «Автоматизированная система классификации объектов».
Апробация работы.
Работа имеет следующие внедрения и апробации:
- задача классификации основных фондов на примере ВУЗов ЮФО, система «КЕТА» применялась для классификации реальных наборов данных, обработано более 40 ООО основных фондов;
- портал volga34.ru (ООО «ИНТЕРВОЛГА»), модуль автоматической классификации поступающих ресурсов по многоуровневому рубрикатору (Акт № 1 к договору на создание и передачу научно-технической продукции № 57/732-06 от 11 июня 2006 года);
- программа зарегистрирована в Отраслевом фонде алгоритмов и программ (Свидетельство о регистрации №8210 от 26.04.2007).
Публикации
Основное содержание диссертации нашло отражение в 7 опубликованных научных работах, в том числе в 2 статьях в периодических и научно-технических изданиях, выпускаемых в Российской Федерации, в которых ВАК рекомендует публикацию основных научных результатов диссертаций; в одном свидетельстве об официальной регистрации программы для ЭВМ.
Структура и объем работы
Диссертация состоит из введения, четырех глав, выводов и приложений. Диссертация содержит 116 страниц основного текста, 13 рисунков, 80 формул. Библиографический список включает 138 наименований. Общий объем работы -143 страницы.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Автоматизация анализа массивов текстовых документов в информационно-коммуникационных средах2007 год, кандидат филологических наук Николаева, Ирина Викторовна
Разработка метода автоматического формирования рубрикатора полнотекстовых документов2008 год, кандидат технических наук Пескова, Ольга Вадимовна
Система поиска текстовых документов на основе автоматически формируемого электронного каталога2010 год, кандидат технических наук Борисюк, Федор Владимирович
Систематизация, разработка методов и коллективов решающих правил классификации библиографических текстовых документов2009 год, доктор технических наук Толчеев, Владимир Олегович
Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа2014 год, кандидат наук Лукашевич, Наталья Валентиновна
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Овчинников, Степан Александрович
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Описана постановка задачи многоуровневой классификации, отличающаяся от известных основанием классификации (тематическая близость текстовых признаков), наличием описаний методов учета языковых явлений (морфология, синонимия, грамматика).
2. Предложена модель, отличающаяся учетом особенностей естественноязыковых признаков, разработаны алгоритмы расчета близости слов и текстов, алгоритм построения моделей текстов языковых, ряд вспомогательных алгоритмов.
3. Предложенная модель и разработанные алгоритмы реализованы в виде автоматизированной системы «Классификация по естественным текстовым признакам».
4. Система была исследована на решении модельных задач, подготовленных на основе реальных данных. Точность работы системы при классификации по ОКОФ составила от 74% до 83% в разных экспериментах.
5. Созданная автоматизированная система «Классификация по естественным текстовым признакам» имеет широкий спектр применения, защищена Свидетельством о регистрации в ОФАП № 8210 от 26 апреля 2007 года.
В целом полученные результаты позволяют эффективность решения задачи классификации по многоуровневым классификаторам на основании учета тематической близости естественно-языковых признаков.
Заключение
Список литературы диссертационного исследования кандидат технических наук Овчинников, Степан Александрович, 2007 год
1. An intrusion-detection model, D. E. Denning, 1987, IEEE Transactions on Software Engineering, Vol. SE-13(No. 2):222-232 . Электронный pecypc.-[1999].- Режим доступа: http://www.cs.georgetown.edu/~denning/infosec/ids-model.rtf
2. Art В. Owen (Stanford University) Information Retrieval, and the Vector Space Model. . Электронный pecypc.-[1999].- Режим доступа: http://www-stat.stanford.edu/~owen/courses/399/ir4up.pdf
3. Champin P.-A., Solnon C. Measuring the similarity of labeled graphs, 2003.
4. Computer Security Threat Monitoring and Surveillance, James Anderson, 1980, Fort Washington, Pa. Электронный pecypc.-[1999].- Режим доступа: http://csrc.nist.gov/publications/history/ande80.pdf
5. Dear B.L. AI and the Authoring Process // IEEE Expert Magazine, Summer, 1987.-P. 17-23.
6. Dupuis L., Un système morphologique., «Information Storage and Retrieval», 1964, v. 2, № 1, с. 29—41; Мельчук И. А., Автоматический синтаксический анализ, т. 1, Новосибирск, 1964;
7. Effective training Электронный ресурс.-[1999].- Режим доступа: http://spamassassin.apache.0rg/iull/2.6x/dist/d0c/sa-learn.txt
8. Gary Robinson, A statistical approach to the spam problem, 2003, Электронный pecypc.-[1999].- Режим доступа: http://www.linuxjournal.com/article.php?sid=6467
9. Gruber, T.R. (1993). A Translation Approach to PortableOntology Specifica-tion.KnowledgeAcquisition5 : 199-220.
10. Hays D. G., Readings in automatic language processing, N. Y., 1966;
11. Karttunen L. Radical lexicalism.// In Baltin M. And Kroch A. Editors, Alternative Conceptions of Phrase Structure. The University of Chicago Press, Chi. cago. -1989
12. Land A.H., and Doig A.G. An autmatic method of solving discrete programming problems. Econometrica. v28 (1960), pp 497-520.
13. Natalya F. Noy and Deborah L. McGuinness. "Ontology Development 101: A
14. Guide to Creating Your First Ontology". Stanford Knowledge Systems Labora104tory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880, March 2001.
15. References for Graph Similarity Электронный pecypc.-[1999].- Режим доступа: 1. http://www.dbs.informatik.unimuenchen.de/~seidl/graphs/Sammoud О., Solnon С., Ghedira К. Ant Algorithm for the Graph Matching Problem, 2005.
16. The Evolution of Intrusion Detection Systems, Paul Inella, 2001, SecurityFo-cus. Электронный pecypc.-[1999].- Режим доступа: http://www.securityfocus.eom/infocus/l 514
17. Wikipedia, статья «Классификатор» Электронный ресурс.-[1999].- Режим доступа: wikipedia.org/wiki/Классификатор.
18. Wikipedia, статья «Фасетная классификация» Электронный ресурс.-[1999].- Режим доступа: wikipedia.org/wiki/ Фасетнаяклассификация.
19. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений.-М.: Статистика, 1974
20. Апресян Ю.Д., Богуславский И.М., Иомдин JI.JI., Лазурский А.В., Перцов Н.В., Санников В.З., Цинман JI.JI. Лингвистическое обеспечение системы ЭТАП-2. М„ Наука, 1989,295 с.
21. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: классификация и снижение размерности: Справочник. -М.: Финансы и статистика, 1989. -250 с
22. Анализ лексико-семантического варьирования В. В. Виноградов, А. И. Смирницкий, H. Н. Амосова, А. А. Уфимцева, Д. Н. Шмелев
23. Андрусенко Т.Б. Лингвистические структуры в компьютерных учебных средах. Киев: Наукова Думка, 1994. -160 с
24. Анисимов A.B., Марченко A.A., Система обработки текстов на естественном языке. Научно-теоретический журнал "Искусственный интеллект" No.4'2002,, УДК 681.3,
25. Апресян Ю. Д. Избранные труды, том I. Лексическая семантика: 2-е изд., испр. и доп. М.: Школа «Языки русской культуры» РАН, 1995. - VIII е., 472 с.
26. Андреев A.M. Автоматическая классификация текстовых документов с использованием нейросетевых алгоритмов и семантического анализа . Электронный ресурс. .-[1999].- Режим доступа: http ://www. inteltec.ru/publish/articles/textan/RCDL2003. shtml
27. Аристотель. Категории. Пер. А. В. Кубицкого. М. 1939.
28. Батыршин И.З., Халитов Р.Г. Иерархические алгоритмы кластеризации на базе классов толерантности //Исследование операций и аналитическое проектирование в технике.- Казань: КАИ, 1987. С. 105-110
29. Библиографическая информация об общероссийских классификаторах Электронный ресурс.-[1999].- Режим доступа: http://www.gks.ru/metod/OKBIB.htm
30. Блох М.Я. Теоретические основы грамматики. М., 1986.
31. Блумфилд JL, Язык, пер. с англ., М., 1968
32. Большая советская энциклопедия : в 30 т. / гл. ред. A.M. Прохоров. М. : Сов. энцикл., 1970-1981. -30 т.
33. Большой энциклопедический словарь. -2-е изд., перераб и доп. -М.: «Большая Российская энциклопедия»; СПБ.: «Норинт», 2002. 1456 с.
34. Бородкин Л.И. Математические методы и компьютер в задачах атрибуции текстов. В сб. (От Нестора до Фонвизина. Новые методы определения авторства, под редакцией Л.В. Милова. М., "Прогресс", 1994)
35. Браверман Э.М., Мучник И.Б. Структурные методы в обработке эмпирических данных. М.: Наука, 1983.
36. Вагнер Г. Основы исследования операций. -М.: Мир, 1972. -210 с
37. Вентцель Е.С. Исследование операций: задачи, принципы, методология. -М.: Наука, 1988.-250 с
38. Волоцкая 3. М., Формообразование при синтезе русских слов, в кн.: Сообщения отдела механизации и автоматизации информационных работ, в. 2 — Лингвистические исследования по машинному переводу, М., 1961, с. 169—194.
39. Гальперин И. Р. Текст как объект лингвистического исследования. М.: Наука, 1981.- 140 с
40. Городецкий Б.Ю. Компьютерная лингвистика: моделирование языкового общения (Вступительная статья)// Новое в зарубежной литературе. М.: «Прогресс». Вып. XXIV. Компьютерная лингвистика. Под ред. Городецкого Б.Ю. С. 5-31
41. Губин М.А. Модели и методы представления текстового документа в системах информационного поиска. . Электронный ресурс.-[ 1999].- Режим доступа: http://gubin.spb.ru/articles/thesis.pdf
42. Диссертация на тему «Методы статистического анализа космических радиосигналов». Электронный ресурс.-[1999].- Режим доступа: http://www.rsrea.ru/materials/nauka/a220806.pdf
43. Дюран Б., Оделл П. Кластерный анализ: Пер. с англ. -М.: Статистика, 1977. -125 с
44. Елисеева И.И., Рукавишников В.О. Группировка, корреляция, распознавание образов: Статистические методы классификации и измерения связей. М.: Статистика, 1977. - 143с.
45. Елисеева И.И Общая теория статистики : Учеб. для вузов по направлению и специальности "Статистика". / И. И. Елисеева, М. М. Юзбашев, 479,1. с. ил. 21 см, 4-е изд. М. Финансы и статистика 1999
46. Жамбю М. Иерархический кластер-анализ и соответствия. М: Финансы и статистика, 1988. - 342 с
47. Жолковский А. К., Мельчук И. А., О семантическом синтезе, в сборнике: Проблемы кибернетики, в. 19, М., 1967, с. 177—238
48. Журавлев Ю.И. Избранные научные труды. Изд. Магистр, 1999.
49. Загоруйко Н.Г. Методы распознавания и их применение. Сов. Радио, М., 1972 г.
50. Загоруйко Н.Г., Налетов А.М., Гребенкин И.М. На пути к автоматическому построению онтологии // Труды международной конференции Диа-лог'2003
51. Заде JI.A. Размытые множества и их применение в распознавании образов и кластер-анализе. В кн.: Классификация и кластер /Под ред. Дж.Вэн Райзина.- М: Мир, 1980.- С. 208-247
52. Зайченко Ю.П. Исследование операций. Электронный ресурс.-[1999].-Режим доступа: http://iasa.org.ua/iso.php?lang=rus
53. Зайченко Ю.П. Самообучение в интеллектуальных системах. Постановка задачи кластер-анализа. Критерии и метрики кластер-анализа. . Электронный ресурс.-[1999].- Режим доступа: http://iasa.org.ua/tpr.php?lang=eng&ch=2&sub=4
54. Зайченко Ю.П. Постановка задачи распознавания образов . Электронный ресурс.[ 1999].- Режим доступа: http://iasa.org.ua/tpr.php?lang=ukr&ch=l&sub=3
55. Зализняк A.A. Обратный (инверсионный) словарь русского языка. М.: Русский язык, 1977
56. Иванченко А.Г. Персептрон системы распознавания образов.// К.: Нау-кова думка, 1972
57. Информатика в семи томах. A.A. Красилов,Том 4. Представление знаний.
58. Интерпретирующая семантика /Франсуа Растье; Пер. с фр., примеч., предметно-именной указ. А.Е.Бочкарева,- Нижний Новгород: ДЕКОМ, 2001,- 367 е.: рис.- Доп. тит. л. на фр. яз.- Указ.с. 342-360.- ИСБН 5-89533-041-Х
59. Исследование операций : Нечет, оптимизация : Учеб. пособие для вузов по спец. "Автоматизир. системы обраб. информ. и управления" и "Прикл. математика". / Ю. П. Зайченко, 191 с. ил. 22 см, Киев Выща шк. 1991
60. Калинин A.A. Применимость Байесовского классификатора для задачи определения спама . Электронный ресурс.-[1999].- Режим доступа: http://www.spamtest.ru/document.html?context=15932&discuss=19230&retur п=1
61. Жолковский А. К., Леонтьева Н. Н., Мартемьянов Ю. С., О принципиальном использовании смысла при машинном переводе, в кн.: Машинный перевод, в. 2, М., 1961, с. 17—46
62. Иорданская JL Н., Автоматический синтаксический анализ, т. 2, Новосибирск, 1967;
63. Когаловский М. Р. Перспективные технологии информационных систем. М.: ДМК Пресс; М.: Компания АйТи, 1995. - 288 с.
64. Классификация и кластер /Под ред. Дж.Вэн Райзина М: Мир, 1980 - 389 с
65. Коваленко А. Вероятностный морфологический анализатор русского и украинского языков/ "Системный администратор" № 1, Октябрь 2002
66. Коваленко А. Вероятностный морфологический анализатор русского и украинского языков. Электронный ресурс.-[1999].- Режим доступа: http://linguist.nm.ru/stemka/stemka.tar.gz
67. Кондильяк, Трактат о системах, Соцэкгиз, 1938, стр. 3
68. Корбут A.A., Финкельштейн Ю.Ю. Дискретное программирование М. Наука. Гл. ред. физ.-мат. лит. 1969.
69. Костомаров М. Н. Стандартный язык описания информации о финансах, документах и показателях. ОКОК Электронный ресурс.-[1999].- Режим доступа: http://document.rU/readingroom/secretar/2000/3/al 5.pdf
70. Красилов А.А.ИНФОРМАТИКА В СЕМИ ТОМАХ, Том 2. Информатика смысла (Машинная лингвистика), Москва 1997 2003.
71. Кузнецов И.П. Механизмы обработки семантической информации. М.: Наука, 1978
72. Кузнецов О.П., Адемсон-Вельский Г.М. "Дискретная математика для инженера", М, "Энергоатомиздат", 1988г.
73. Мазуров Вл.Д. Метод комитетов в задачах оптимизации и классификации. Москва: Наука, 1990. -248 с.
74. Мельчук И. А., Морфологический анализ при машинном переводе (преимущественно на материале русского языка), в сборнике: Проблемы кибернетики, в. 6, М., 1961, с. 207—276;
75. Мальковский М.Г. Диалог с системой искусственного интеллекта. -М.: Изд-во МГУ, 1985.-214 с
76. Мальковский М.Г. Программно-информационное обеспечение адаптивных систем общения с ЭВМ на естественном языке. -М.: МГУ /Автореферат дисс. на соискание уч. степ, доктора физико-математических наук. 1990 г. - 34 с.
77. Мандель И.Д. Кластерный анализ. М.: Финансы и статистика, 1988. -176 с
78. Марусенко М.А., Атрибуция анонимных и псевдонимных литературных произведений методами теории распознавания образов. -Д.: ЛГУ, 1990. -164 с
79. Мельчук И. А., Порядок слов при автоматическом синтезе русского текста (предварительное сообщение), «Научно-техническая информация», 1965, № 12, с. 36-44
80. Мосин В.Н. Общие сведения о статистических критериях. . Электронный ресурс.-[1999].- Режим доступа: http://www.ergonomic-design.com/mathematics/criteriaintro.htm
81. Метрики в классификации: Электронный ресурс.-[1999].-Режим доступа: http://www.metric.ru/publications.asp?temno=301 &obno=305
82. Мешалкин Л.Д. Локальные методы классификация. М.: МГУ, 1969, авп.1.-с.58-78
83. Моделирование языковой деятельности в интеллектуальных системах. Под ред. А.Е.Кибрика и А.С.Нариньяни. М.: Наука, 1987
84. Налетов A.M. Взаимодействие систем анализа текстов и построения онтологии //Научная сессия МИФИ-2005: сб. науч. тр. /Моск. инж.-физ. ин-т (гос. ун-т) и др.- М., 2005.
85. Нариньяни A.C. Модель или алгоритм: новая парадигма информационной технологии //Информационные Технологии, 1997, с.11-16
86. Нариньяни A.C. Недоопределенность в системах представления и обработки знаний //Известия АН СССР. Техническая кибернетика. 1986. № 5. -С. 3-28
87. Обзор методов кластерного анализа. Лекции Института искусственного интеллектаhttp://www.intuit.ru/department/database/datamining/13/datamining13.html
88. Общероссийский классификатор информации об общероссийских классификаторах Электронный ресурс. .-[2007].- Режим доступа: http://194.226.82.76/government/governmentactivity/rfgovernmentdecisions/ar chive/2003/l 1 /12/imported-news 12282.htm
89. Овчинников С.А. Разработка алгоритмов построения и оценки качества кластеризации в задачах извлечения знаний из баз данных на основе алгоритма Кохонена // "Информационно-измерительные и управляющие системы", 2004, № 3, т. 2, с. 32-39
90. Распопов И. П., Актуальное членение предложения, Уфа, 1961
91. Свидетельство о регистрации АС «КЕТА» в ОФАП №8210 от 26.04.2007.
92. Петренко В.Ф. Введение в экспериментальную психосемантику: исследование форм репрезентации в обыденном сознании М.: Изд-во МГУ, 1983.- 177 с
93. Петренко В.Ф. Психосемантика сознания М.: МГУ, 1988. - 208 с
94. Павлинов И.Я., Зоологический музей МГУ им. М.В. Ломоносова Основные подходы в биологической систематике
95. Поспелов Г.С. Тематика. . Электронный ресурс.-[1999].- Режим доступа: http://slovari.yandex.ru/art.xml?art=litenc/leb/leb-2301 .htm&encpage=litenc
96. Процедуры и алгоритмы формирования комплексных программ / Г. С. Поспелов, В. А. Ириков, А. Е. Поспелов, В. А. Ириков, А. Е. Курилов ; Под ред. Г. С. Поспелова, 422,1. с. ил. 23 см, М. Наука 1985.
97. Положение о разработке, принятии, введении в действие, ведении и применении общероссийских классификаторов технико-экономической и социальной информации в социально-экономической области Электронный ресурс.-[1999].- Режим доступа:
98. Поляков A.A. Концепция создания интегрированной автоматизированной информационной системы Минобразования России. -М. 2000.
99. О.Поляков A.A. Концепция, информационное обеспечение индустрии образования программы «Научное, научно-методическое, материально-техническое и информационное обеспечение системы образования». М, 1999.
100. Поспелов Д.А. Логико-лингвистические модели в системах управления. -М.,1981
101. Искусственный интеллект основа новой информационной технологии / Г. С. Поспелов ; АН СССР, 278,1. с. ил. 17 см, М. Наука 1988
102. Искусственный интеллект прикладные системы / Г. С. Поспелов, Д. А. Поспелов, 48 с. ил. 24 см, М. Знание 1985
103. Процедуры и алгоритмы формирования комплексных программ / Г. С. Поспелов, В. А. Ириков, А. Е. Поспелов, В. А. Ириков, А. Е. Курилов ; Под ред. Г. С. Поспелова, 422,1. с. ил. 23 см, М. Наука 1985
104. Прикладная статистика: Классификация и снижение размерности: Справочник/ Под ред. С.А.Айвазяна. -М.: Финансы и статистика, 1989. 450 с
105. Рубанов Л.И. Метод классификации словаря для помехоустойчивой системы машинного понимания естественного языка //Известия РАН. Техническая кибернетика. 1991. № 5. С. 84 - 93
106. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. М.: Наука, 1989
107. Саати Т. Метод анализа иерархий. М., 1993.
108. Сборник статей / Поспелов Г. С. ; Рос. акад. наук, Вычисл. центр, 45 с. граф. 20 см, М. ВЦ РАН 1997
109. Сепир Э., Язык. Введение в изучение речи, пер. с англ., М., 1934;
110. Смирнов И., Безносюк Е., Журавлёв А. Психотехнологии: Компьютерный психосемантический анализ и психокоррекция на неосознаваемом уровне. М.: Издательская группа "Прогресс" - "Культура", 1995. - 416 с
111. Список основных общероссийских классификаторов в со-ставе ОКОК Электронный ресурс.-[1999] .-Режим досту-па: http://www.pcpi.ru/manage/page?tid=764400063&nd=842502301&prevDoc= 842502301
112. Станислав Лем "Сумма технологии", М./СП6., Terra Fantastica, 2002.
113. Стакан твердая или жидкая часть текста? Электронный ресурс.-[1999].-Режим доступа: 1. http://exlibris.ng.ru/philology/4glass.html/
114. Сулейманов Д.Ш. О семантическом анализе текстов в АОС Сб. научных тр. Вероятностные методы и кибернетика. -Вып. 20. Казань: Изд-во Казан. ун-та, 1984. - С. 106-116. статья
115. Тема документа. Электронный ресурс.-[1999].- Режим доступа: http://slovari.yandex.ru/art.xml?art=glnatural/232/232505.HTM&encpage=g lnatural&mrkp=%26text%3D%25F2%25E5%25EC%25E0%26reqtext%3D% 25F2%25E5%25EC%25E0%253A%253A470%26%26isu%3D2
116. Типология и классификация в социологических исследованиях. Отв. ред. В.Г.Андреенков, Ю.Н.Толстова. М.: Наука, 1982 296с.
117. Тришин В.Н. "О некоторых проблемах, связанных с учетом, переоценкой и налогообложением основных фондов" // Журнал "Вестник ассоциации "Русская оценка", 2001г., №4, стр.40-56.
118. Ш.Тришин В.Н. Что есть отчет об оценке основных средств предприятия, Московский оценщик, N6(37), декабрь 2005, стр.11-21
119. Ш.Тришин В.Н., Шатров М.В. Проблемы идентификации машин и оборудования в автоматизированных системах обеспечения оценочной деятель-ности//Вопросы оценки. 1997. №1.
120. Ш.Тришин В.Н., Шатров М.В. Система информационной поддержки оценщика ASIS (Appraiser Support Info Systemy/Инвестиции в России. 1995. №5.
121. Уоссермен Ф. Нейрокомпьютерная техника. М.: Мир, 1992
122. Факторный, дискриминантный и кластерный анализ: Пер с англ./Дж. -О.Ким, Ч.У.Мьюллер, У.Р.Клекка и др.; Под ред. И.С.Енюкова. М.: Финансы и статистика, 1989. - 215с.
123. Хакен Г. Синергетика / под ред. Ю.Л. Климонтовича, С.М. Осовца: пер. с англ.-М.: Мир, 1980.- 404с.
124. Шаров С.А. Средства компьютерного представления лингвистической информации.
125. Шатров М.В., Тришин В.Н., Малинин А.А. "Программная система ПиК-97 и некоторые вопросы переоценки на 1.01.97 г." // Бюллетень "Российский оценщик", 1997, №10-11, стр. 12-16.
126. Э.В. Попов. Общение с ЭВМ на естественном языке. М:, Наука, 1986
127. Экспертные системы для персональных компьютеров: методы, средства, реализации: Справочное пособие / Крисевич B.C., Кузьмич JI.A., Шиф А.М.и др. Минск: Выш.шк., 1990. -197 с
128. Электронные образовательные информационные ресурсы (справочное издание для профессиональных учебных заведений) под общей редакией д.т.н., профессора Полякова A.A. Авторы: Седякин В.П., Каптерёв А.И., Шлыкова О.В. -М.: Янус-К, 2003. 168 с.
129. Янковой А.Г. Многомерный анализ в системе STATISTICA. Одесса: Оптимум, 2001, 216 с.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.