Диагностика объектов, характеризующихся разнотипными признаками, по отношению к пересекающимся классам тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Красинский, Виталий Израилевич

  • Красинский, Виталий Израилевич
  • кандидат технических науккандидат технических наук
  • 2002, Новосибирск
  • Специальность ВАК РФ05.13.18
  • Количество страниц 152
Красинский, Виталий Израилевич. Диагностика объектов, характеризующихся разнотипными признаками, по отношению к пересекающимся классам: дис. кандидат технических наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Новосибирск. 2002. 152 с.

Оглавление диссертации кандидат технических наук Красинский, Виталий Израилевич

Введение

Г лава 1. Элементы теории нечетких множеств

1.1. Теория НМ как один из методов разработки систем искусственного интеллекта

1.2. Другие способы учета неопределенности.

1.3. Операции с нечеткими множествами, показатели размытости.

1.4. Построение функций принадлежности нечетких множеств.

1.5. Нечеткие отношения и нечеткие графы.

1.6. Нечеткие меры (меры доверия, меры возможности и необходимости) и их соотношение с вероятностными мерами.

1.7. Нечеткие выводы, или моделирование процессов принятия решений.

Г лава 2. Преобразование числовых и номинальных признаков многозначных объектов в значения функций принадлежности объектов к нечетким множествам

2.1. Способ нормализации НМ многозначных объектов.

2.2. Вычисление ФГ1 многозначных объектов к НМ по числовому признаку.

2.3. Вычисление диапазонов неаддитивных вероятностей Демпстера значений числового признака многозначных объектов.

2.4. ЕЗычисление ФП многозначных объектов к НМ по номинальному признаку.

2.5. Вычисление ФП объектов к НМ по числовому признаку при малом числе наблюдений.

Глава 3. Способы свертки НМ для ранжирования многозначных многомерных объектов и для сравнения разнотипных признаков по надежности диагностики объектов

3.1. Нечеткая матрица как отображение исходной ТЭД.

3.2. Рискованная стратегия, или экстремальный выбор.

3.3. Усредненная, или осторожная стратегия выбора

3.4. Выбор по минимуму коэффициента нечеткости Кофмана.

Глава 4. Диалоговая программа-диагност RECOFAM

Recognizer of Families)

4.1. Общее описание алгоритма диагностики растения.

4.2. Примеры результатов диагностики растений (гербарных образцов).

Глава 5. Предсказание ошибок в содержании документов базы данных электронного каталога гербария

5.1. Постановка задачи. Исходная информация.

5.2. Метод анализа информации и прогноза ошибок.

5.3. Результаты анализа прогноз ошибок.

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Диагностика объектов, характеризующихся разнотипными признаками, по отношению к пересекающимся классам»

Актуальность разработки настоящей темы обусловлена потребностью в математических методах анализа сложной биологической информации для решения классификационных и прогнозных задач. Природа бесконечно сложна, поэтому актуальным является поиск новых подходов для наиболее адекватного представления биологических знаний и анализа информации в целях решения научных и прикладных задач.

Одной из форм нечеткости классификационных единиц в ботанике (таксонов растений) является их мно1 означпостъ 15 пространстве числовых и номинальных признаков, когда в качестве значения признака таксона выступает список переменной длины (у разных таксонов длина списка разная). Причем эта ситуация одинакова для количественных и поминальных признаков. Например, у растений семейства Сеташасеае листья бывают очередные, супротивные. По признаку "тип соцветия" семейство растений ТаЬассае характеризуется списком трех значений: головка, кисть, цветки одиночные. По этому же признаку "тип соцветия" семейство Рпти1ассас имеет список из пяти значений: зонтик, кисть, метелка, цветки одиночные, цветки пазушные. Видно, что эти классы-таксоны пересекаются по признаку типа соцветия. Пример по числовому признаку: у растений семейства Вгаяйкассае число тычинок бывает 2, 4, 6.

Классификационные построения и диагностика особей при такой структуре исходной информации о таксонах затруднены. Методы математической статистики случаи многозначности трактуют как ошибки в исходных данных, поскольку эти меюды основаны па аксиоматической теории вероятностей, предполагающей разбиение множества объектов на непересекающиеся подмножества (полная труппа несовместных событий по значениям каждого признака). В современных информационных системах [Загоруйко П.Г., 1996] специально разрабатываются способы для выявления подобных ошибок,

Фрагмент ТЭД [из прилежания) для Трех классов- семей ст£ по д&ум признакам

К а ассы Тип лисп г 8 Количество тычинок егап1асе.а<г. очередные супротиЗныо. 5} 9, 10

Р х1ти£асеае 8езлцстн ы е мутобчатые супротивные 8

2с1орЬи£а'1Шсеае мутовчатые очередные супротибные 2, %5

Диаграмма Вен на

Тип л лисТьеЬ в л б очередные 2 ВпРпО У супротибные $ / 0 мутовчатые р безлистные 8пР

Кол и и.

-1-1-(-1-1-1-1-1-1

2 3 7 8 9 10 тычинок то сеть исходно принимается классическая теоретико-множественная модель для описания объектов.

До настоящего времени определители растений составляются ведущими ботаниками "вручную", на основании своего опыта и литературных данных. Эти определители, например, [Флора Сибири, 1988], [Определитель., 2000], строятся по типу двоичных вопросников. Авторы стараются предусмотреть все основные комбинации значений признаков для всех классов-таксонов. Но ввиду отмеченной выше многозначности таксонов и большого объема исходной информации обычно не удается учесть все ситуации. В ручных определи гелях пе предусматривается ответ пользователя "не знаю" на вопросы о значениях признаков исследуемого объекта. Также не предусматривается возможность начать диагностику с любого признака объекта предписывается жесткое следование порядку вопросов,, заложенному автором определителя. Поэтому такие "ручные диагносты" неработоспособны при сомнениях пользователя, либо при отсутствии на образце (особи) „некоторых органов, также они пеон гималыты по трудозатратам (числу признаков, значении которых должен определить пользователь).

В других областях биологии диагностика производится аналогично. Например, в большой работе [Вейатгт Р., 1999] приведены определи тельные таблицы для 60 тысяч видов бактерий. В этих таблицах порядок вопросов (опытов по измерению значений признаков) жесткий, признаки есть количественные и качественные, но все таксоны-виды бактерий однозначны. Отвсч "пе знаю" не предусмотрен.

Потребность в падежных компьютерных определителях растений подтверждается ведущими учеными-флористами.

Акту ал ы I о й задачей является разработка для учебных целей алгоритма и диалоговой программы, работающей с объектами-таксонами сложной списковой структуры.

Также актуальна задача верификации содержимого БД (в ботанике и в других прикладных областях исследований).

Например, названия таксонов растений можно трактовать как формальные классы системы кодирования по УДК статей и книг в библиог рафических ИПС, а списковые значения номинального признака как ключевые слова, индексирующие статьи.

Предлагаемый способ верификации документов БД но поминальным признакам на основе теории возможностей является, по нашему мнению, новым. Во всяком случае, в известных нам статьях [Kacprzyk J., 1995], [Мальковский М.Г., 1998], теория НМ применяется для формирования нечетких запросов к БД только по числовым признакам, по которым легко построить отношения порядка для объектов. Для построения ФП объектов к НМ по неметрическим признакам в работе [Мальковский М.Г., 1998] отмечается необходимость привлечения человека-эксперта для ранжирования документов БД. Наш способ свободен ог такого ограничения. Был сделан успешный прогноз ошибок в содержании документов электронной базы данных по каталогу гербария ЦСБС СО РАН [Красинский В.И., 2000 д, 2000 е]. При этом анализировались два номинальных признака, по одному из которых типу основного фитоценоза классы документов многозначны, а по другому признаку виду растения - однозначны.

Биологические проблемы формализации информации каталога гербария курировал д.б.н. И.М.Краспоборов. Вес технические, алгоритмические и программно-системные вопросы создания первого в СССР электронного каталога гербария решены диссертантом [Красинский В. П., 1990, 1991], [Краспоборов И.М., Красинский В.П., 1995 а, 1 995 б. 1996].

Предметом исследования в диссертации является математическое моделирование процесса диагностики биологических объектов, характеризующихся количественными и качественными признаками, и создание на этой основе диалоговой программы для ЭВМ. Подобные исследования постоянно находятся в центре внимания современных ученых [Abbott L.A. 1985], [Свиридов A.B., 1994], [Рябко Б.Я., Федотов A.A., 2000].

По классификации типов задач распознавания образов [Загоруйко Н.Г., 1979] представляемая работа соответствует задаче выбора информативных признаков и задаче диагностики объектов по разнотипным признакам. Диалоговый алгоритм диагностики соответствует последовательным процедурам принятия решений [Райфа Г., Шлсйфер Р., 1977].

Пересечение (многозначность) таксонов-классов в разнотипном признаковом пространстве является заданной неопределенностью, или нечеткостью, что не позволяет примеия 11) вероятностно-статистические методы анализа, основанные на классической теории множеств.

Целями диссертационной работы являлись:

1.Разработка способов преобразования числовых и поминальных признаков многозначных объектов-классов в функции принадлежности этих объектов к нечетким множествам.

2. Выбор способов свертки всех НМ для вычисления интегральных критериев ранжирования многозначных объек тов по совокупности разнотипных признаков.

3. Выбор кри териев ранжирования разнотипных признаков многозначных объектов по степени их (признаков) априорной диагностической способности.

4. Программирование, отладка и тестирование диалоговой оптимизирующей и рот рам мы-диагноста.

5. Создание варианта алгори тма диагностики по о тношению к пересекающимся классам объектов для прогноза ошибок в содержании документов базы данных.

Исходная информация, описывающая пересекающиеся классы-таксоны, предоставлена д.б.н. И.М.Краспоборовым. Это таблицы значений 11 разнотипных (7 номинальных и 4 числовых) морфологических признаков по 102 семействам двудольных растений Сибири. Общий объем двоичной информации в таблицах "объект-свойство", приведенных в приложении, составляет 102x94 бит. Многозначность классов проявляется в наличии нескольких единиц во многих строках таблиц (до 3/4 семейств) по большинству признаков, поэтому применение для распознавания статистических методов, основанных па аксиоматической теории вероятностей, невозможно. Можно сказать иначе: многозначност ь таксонов по каждому признаку не позволяет представить процесс диагностики исследуемого образца в виде двоичного графа-дерева решения в признаковом пространстве описания классов-таксонов. Это и объясняет основную причину трудностей при составлении определителей растений ведущими биологами "вручную", без опоры на математический алгоритм.

Для опенки интегральной степени многозначности (зашумленности, или избыточности описания) всех объектов-классов по веем признакам мы предлагаем следующий коэффициент эксцесса: сх = i хшш / (м-1ч) Здесь М число признаков; N число объектов; п индекс объекта; т индекс признака; i индекс значения признака многозначного объекта; хтт - значение признака объекта в двоичной матрице инцидентности "объект-свойство".

Сумма вычисляется по всем градациям всех признаков па всех объектах ("суммарный вес" двоичной ТЭД). Коэффициент сх равен единице в стандартном случае однозначности объектов-классов по всем признакам. Для исходных данных, приведенных в приложепи, получается ех = 1818/(11*102) = 1.62, то сеть, в среднем, каждый из 102 объектов "размазан" па 62% по каждому признаку.

Обратим виимаиис, что полученное значение 1.62 коэффициента избыточности исходных данных в точности равно пропорции золотого сечеиин\ [Стахов А.П., 1984]. Эта пропорция, обозначаемая обычно символом Ф, была известна еще в древнем Египте, а термин "Sectio aurca" приписываю! Леонардо да Винчи. Иррациональная величина пропорции: ф = (1+л/5)/2 « 1.6180.

Случайно ли совпадение ех=Ф? Исследование этого интереснейшего вопроса выходит за рамки представляемой диссертации, по факт заслуживает внимания, поскольку пропорция золотого сечения отражает многие фундаментальные законы природы и искусства, в том числе ап гиэнт ропийные свойства живых систем. Так, немецкий ботаник Ф.Людвиг в конце XIX века выявил подчиненность многих морфологических признаков (чисел органов растений) числовому ряду Фибоначчи. Также этому ряду подчиняется и расположение вегетативных органов растений.

Соответствие филлотаксиса (законов строения органов растений) числам Фибоначчи было известно еще И.Кеплеру, И.-В. Гёте. Современные ботаники [Cronquist А., 1988], занимающиеся классификационными пост роениями, также отмечают эту закономерность. Известно, что количество или соотношение атомов в молекулах большинства неорганических соединений также соответствует числам Фибоначчи.

Таблица исходных данных из приложения является усредненной (обобщающей) информацией о значениях морфологических признаков большинства растений но огромной территории Сибири. Отсюда, если принять гипотезу о неслучайности полученной величины коэффициента избыточности информации о свойствах совокупности крупных таксонов (семейств) растений, факт ех=Ф=1.62 может быть истолкован как свидетельство успешного выбора биологами системы признаков для идентификации семейс тва конкретного растения.

Факт информационной избыточности ех=1.62, который мы здесь констатируем, вполне соответствует необьяснспной пока биологической гипотезе о подчиненности филлотаксиса ряду чисел Фибоначчи, а в пределе, золотому сечению. Возможно, в нем отражается энерго-информационная "надежность" или "устойчивость" растений для сохранения своей структуры во внешнем мире. В нашей задаче разработки алгоритма формальной диагностики растений этот природный факт является основным затрудняющим условием.

По аналогии с описанной задачей диагностики семейств растений можно сформулировать и другие биологические, экономические, технические, поскольку многозначность объектов позволяет учитывать более реальные ситуации и явления. Так, многозначность числового объекта в телеметрической информации можно интерпретировать как смссь сигнала и шума, или неисправную работу устройства. Многозначные номинальные объекты типичны при исследованиях в социологии, медицине, квалиметрии.

Методом решения поставленной задачи моделирования многозначности классов-таксонов и диагностики объектов по совокупности разнотипных признаков в диссертационной работе избраны теория нечетких множеств и связанная с ней теория возможностей. Эти теории один из математических разделов искусственного интеллекта. Общая теория систем, теория измерений, теория голосования также использовались для теоретических и практических выводов.

В научной литературе описаны подходы к моделированию неопределенное гей, в том числе основанные на теории НМ.

В работах [Касрг/ук .Г., 1995], [Мальковский М.Г., 1998] теория НМ применяется для формирования нечетких запросов к БД только в одномерном случае для числового признака м 11 о г о з п а ч 11 ы х о б ъ с к т о в.

В большой статье [\Чгап1-К1ип 1., 1999] теория НМ применяется к многозначным объектам по совокупности только двух числовых признаков, находится нечеткое уравнение регрессии, также подчеркивается неприменимость статистических методов для анализа подобных объектов.

В качестве альтернативного теории НМ способа обработки нечеткой числовой информации можно было бы применить интервальное описание и связанные с ним методы анализа [Алсфельд Г., 1987], [Rocha L.R., 1996]. [Кашеварова Т.П., 1999]. В этом случае указываются минимальные и максимальные значения признаков для совокупности объектов (измерений). Внутри интервала принимается равномерное распределение вероятностей значений признака у объектов. Однако таблица исходных данных по семействам растений имеет боле сложную структуру, например, у упомянутого семейства Brassicaccac число тычинок не бывает 3, 5. Поэтому применение интервального анализа потребовало бы значительного огрубления исходных данных (упрощения модели). Кроме того, в интервальном анализе отсутствую! модели для представления и операций с нечисловой информацией.

В работе [Журавлев Ю.И., 1 978] описаны разные модели классификационных построений, по все они опираются па разбиение обучающей выборки на непересекающиеся четкие классы. Поэтому распознающие алгоритмы по определению должны относить исследуемые объекты к одному из этих классов, либо к никакому, без числовой характеристики этого случая сомнения, то есть фактически вводится еще один четкий класс неизвестного решения.

Работа [Лбов Г.С., 1994] посвящена методу прогнозирования совокупности значений временных рядов признаков разных типов на основе гипотезы стационарности рядов. При этом предполагается четкое разбиение многомерных объектов (сечений временных рядов) на классы по значениям каждого признака. В качестве примеров применения метода приводятся только одномерные случаи реальных прогнозов.

В монографии [Лбов Г.С., Старцева Н.Г., 1999] описан метод логических решающих функций для задач обработки разнотипной информации. Но эти функции есть четкие гиперплоскости границ разбиений объектов на классы в многомерном пространстве признаков, то есть принимается классическая теоретико-множественная модель.

В обзоре [Орлов А.И., 1995], и в других работах этого автора приводятся модели и методы для многокритериального анализа и применения нечетких множеств по отношению к объектам, характеризующимся номинальными признаками, по не 15 совокупности с числовыми.

Методы классификации многомерных объектов по качественным признакам, по в четкой теоретико-множественной постановке, можно найти в работе [Миркип Б.Г., 1976].

В статье [Загоруйко Н.Г., Лбов Г.С., 2000] представлена общая модель для выбора группы объектов по совокупности разнотипных признаков из всего множества объектов в условиях зависимостей между ними (что соответствует пересекающимся таксонам в нашей задаче диагностики). Вместо переборного способа решения предлагаются эвристики для успешного распознавания за реальное время. В терминах этой статьи диагностика растений относится к задаче выбора прецедентов. В качестве эвристики, позволяющей преодолеть неопределенность итогового выбора, мы используем критерий нечеткости, соответствующий семантике предметной области: "чем многозначнее таксон по какому-либо признаку, тем хуже диагностируются его представители". Вычисление ФП объектов к НМ соответствует снижению размерности признакового пространства. Можно сказать, что одну из сформулированных в упомянутой статье за/щч мы решаем на основе теории НМ, что позволило создать алгоритм и программу, диагностирующую реальные природные объекты в интерактивном режиме.

Работа [Лапко А.В., 1996] посвящена обзору применения статистических методов в медико-биологических исследованиях. В пей отсутствуют ссылки на успешные способы преодоления неопределенности описаний природных объектов, лишь констатируется, что исследование проблем принятия решений при моделировании биосистем при расплывчатых условиях находится па начальном этапе.

Известна система DELTA [Dallwitz M.J., 1980, 1993] для построения ключей-определителей ботанических объектов, но се алгоритмы связаны с ориентацией на методы распознавания образов, которые опираются на классические теоретико-множествен ные представления.

В статьях [Рябко Б.Я., 1982, 2000] предлагается способ диагностики ботанических объектов по двоичным признакам, но по каждому признаку объекты должны четко разделяться па два класса. Не допускается ответ "не знаю" на вопросы о значениях признака. Признается, что предложенный способ является очень упрощенной моделью, недостаточной для реальной диагностики растений, именно но причине полиморфизма таксонов. Кроме того, полуперсбориый алгоритм требует большого количества машинного времени для тестового примера из 15 искусственных объектов построение определи тельного ключа потребовало около часа работы персональной ЭВМ.

В обзорной работе [Пименов М.Г., 1 987] нет ссылок па методы и принципы для классификации сложных многозначных ботанических объектов. Также не упоминаются они и в более поздней работе [Свиридов A.B., 1994].

В журналах, посвященных математическому моделированию биологических задач Biometrika (Cambridge, England),

Biometrics (USA), Mathematical Biosciences (Elsevier), и в журналах по ИИ: Fuzzy Sets and Systems (Elsevier), Soft Computing (Springer) мы не нашли работ, описывающих способы классификации или диагностики многомерных многозначных объектов (просмотрены электронные рефераты за последние 5 лег).

Итак, в проанализированной отечественной и зарубежной литературе пе обнаружено конкретных способов классификации многозначных объектов по совокупности числовых и номинальных признаков, либо диагностики многомерных объектов по отношению к пересекающимся классам. Именно пересечение классов в разнотипном признаковом пространстве является нечеткостью, и основной проблемной ситуацией по отношению к проведенному исследованию.

Научная новизна диссертационной работы состоит в следующем:

1. Впервые для ботаники разработан алгоритм надежной диагностики растений по совокупности разнотипных признаков политомический ключ определения семейства. Алгоритм реализован в виде диалоговой программы для ЭВМ.

2. Предложены два новых алгоритмических (без участия человека-эксперта) способа вычисления функций принадлежности списковых объектов к нечеткому множеству для числового признака и для номинального признака.

3. Предложен способ разбиения па нечеткие классы малого числа объектов но значениям числового признака вычисление ФГ1 объектов к термам лингвистической переменной. Способ проверен на реальной биологической имформации.

4. Предложен способ верификации содержания индексированных но ключевым словам баз данных. Способ продемонстрирован на правильном предсказании ошибок в БД каталога гербария.

5. Предложен коэффициент эксцесса как средняя избыточноеп> описания класса для оценки степени многозначности классов по разным признакам. На всей таблице исходных данных по 102 семействам растений Сибири его значение получилось сх=1.62. Эта величина в точности равна пропорции золотого сечения.

То есть в усредненной избыточности информации о значениях морфологических признаков растений проявился один из фундаментальных антиэнтропийных законов природы.

Публикации. Основные результаты диссертации опубликованы в 19 печатных работах. При этом в совместных работах диссертан ту полностью принадлежат гипотезы для построения и разработки четких и нечетких математических моделей обработки информации, алгоритмическая и программная реализация этих моделей, программ управления базами данных и методов контроля информации, проведение расчетов, также совместное с биологами построение структур баз данных, тестирование программ, верификация баз данных, обсуждение по л у ч ен п ы х р с з ул ь тато в.

Диссертация состоит из введения, пяти глав, заключения, приложения с таблицей исходных данных по значениям 1 1 морфологических признаков 102 семейств двудольных растений Сибири, списка литературы из 154 наименований.

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Красинский, Виталий Израилевич

Заключение

Бурно развивающаяся в последние десятилетия теория нелегких множеств, относимая к методам искусственного интеллекта, нашла применение в различных приложениях, связанных с априорной неопределенностью информации, в том числе для формализации знаний, не измеряемых физическими приборами, а существующих как профессиональные мнения специалистов. Эта теория позволяет моделировать сложные явления природы, экономики, социологии, техники. Базы знаний и экспертные сисчсмы, основанные на нечетких продукционных правилах, внедряются в научных исследованиях и технических приложениях.

Решение только информационно-поисковых задач по флористическим БД. хотя и является важной частью прикладных исследований, уже недостаточно в научном плане с точки зрения современного уровня развития информационных j сх п о л о г и й. В работах по созданию первой в России электронной БД по каталогу гербария автором предложено кодировать экологическую и флористическую информацию, содержащуюся в неформализованных текстах документ ов-иикеток. После этого стало возможно применение разных методов содержательного анализа информации, в частности, на основе т еории H M предсказаны с тепени наличия ошибок в с о д с р ж а 11 и и до к у м с и т о в к ат a j юга.

Результаты, полученные по теме диссертационного исследования, можно сформулировать следующим образом:

1. Предложены два способа вычисления функций припадлежпос ги (ФП) многозначных (неопределенных, или списковых но значениям исходных признаков) объектов к нечетким Множествам (ММ) - соответственно, по числовым и помипальиым признакам.

Способ вычисления ФП объектов к НМ по числовым признакам па основе двух последовательностей фокальных элементов полностью применим к качественным признакам, измеренным в шкале порядка (баллов). Вычисления ФП не предполагают участие человск а-эК С П С рта.

2. Предложен метод диагностики многомерных объектов в условиях пересечения классов по всем разнотипным признакам, когда неприменимы вероятности о-статистически с модели анализа информации. Получены числовые критерии для ранжирования многомерных объектов по совокупности признаков и ранжирования разнотипных признаков по степени их априорной диагностической способности по отношению к неизвестным объектам. Работоспособность и эффективность метода продемонстрированы па примере обработки реальной б о та н и ч ее кой и н ф о р м а ц и и.

3. Разработан алгоритм и диалоговая программа диагностики растений cRECOFAM, позволяющая безошибочно определять принадлежность особи к ботаническому семейству при минимальном количестве вопросов, задаваемых пользователю относительно значений признаков диагностируемой особи. Допускается ответ "не знаю" па любой вопрос о значениях признаков. Программа внедрена в Новосибирском и Омском государственных педагогических университетах на кафедрах ботаники. Реализованный метод диагностики многомерных разнотипных объектов может применяться для решения сложных задач обработки зашумлепной информации (списковые признаки объектов) и в других областях науки и техники.

4. На конкретном примере продемонстрирован результат вычисления степеней ошибок индексирования документов электронной базы данных одного из разделов гербария NS

БД была создана в процессе работы над темой исследования). Количество фактических ошибок составило 76% от предсказанных. Эго показывает возможность использования предложенного метода диагностики многозначных объектов для выявления ошибок кодирования ключевыми словами документов, например, библиографических компьютерных БД.

5. Предложен коэффициент оценки усредненной избыточности описания многозначных объектов. Будучи примененным ко всей таблице исходных данных по семействам двудольных растений Сибири, коэффициент эксцесса получил значение пропорции золотого сечения Ф=1.62.

Фак I проявления одного из основных законов природы и искусства можно трактовать как свидетельство удачного выбора флористами системы признаков для формализованного описания таксонов-семейств растений.

6. Предложен способ нормализации нечетких множеств путем добавления к исходным нечетким объектам одного искусственного, имеющего инцидентность со всеми значениями признаков. Этот прием позволяет практически сохранить масштаб функций принадлежности объектов к НМ, что важно для многомерною нечеткого анализа.

7. Предложен способ вычисления гарантированных диапазонов пеаддитивпых вероятностей Дсмпстсра по числовому признаку мпо1 озпачпых объектов, что дает возможность решения задач допускового контроля объектов (изделий) в условиях ненадежных (нестабильных) измерений признаков объектов.

X. Предложен способ нечеткой классификации малого числа обьектов по числовому признаку (формализация термов лингвистической переменной), когда неприменимы статистические методы анализа. Способ основан па гипотезе автора о переменной линейной неразличимости объектов. Участие человека-эксперта не требуется. Этот способ может применяться в различных технических приложениях, когда числовой параметр-признак измерен в шкале отношений.

Предложенное в диссертации применение теории НМ для анализа многозначной флористической информации является примером приложения методов ИИ к задачам биологии. Обработка информации из больших БД, особенно в совокупности с дополнительными экспертными мнениями ведущих специалистов, методами искусственного интеллекта является перспективным направлением для решения

122 многомерных задач оптимизации (сравнения вариантов классификации биологических объектов, анализа эффективности различных природоохранных мероприятий). Нечеткие множества-признаки могут быть входной информацией для классификационных моделей на основе псйросетсй, также аргументами в нечетких продукционных правилах для построения экспертных систем.

По мнению автора, разработанный метод диагностики многомерных обьсктов по отношению к пересекающимся классам вполне применим и 15 других областях науки и техники, поскольку теория нечетких множеств неспсцифичпа к предметной области после формулировки семантики нечеткости исследуемых обьсктов и существующих между ними отношений.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.