Методика обучения студентов с профильной вузовской подготовкой в области математики интеллектуальному анализу данных тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Тербушева Екатерина Александровна

  • Тербушева Екатерина Александровна
  • кандидат науккандидат наук
  • 2022, ФГБОУ ВО «Российский государственный педагогический университет им. А.И. Герцена»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 184
Тербушева Екатерина Александровна. Методика обучения студентов с профильной вузовской подготовкой в области математики интеллектуальному анализу данных: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГБОУ ВО «Российский государственный педагогический университет им. А.И. Герцена». 2022. 184 с.

Оглавление диссертации кандидат наук Тербушева Екатерина Александровна

ВВЕДЕНИЕ

ГЛАВА 1. ОПРЕДЕЛЕНИЕ РОЛИ И МЕСТА ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В СОВРЕМЕННОМ ОБРАЗОВАНИИ

1.1. Понятие и применение интеллектуального анализа данных

1.1.1. Основные термины и понятия интеллектуального анализа данных

1.1.2. Понятие и тенденции применения интеллектуального анализа образовательных данных

1.2. Перспективность обучения студентов интеллектуальному анализу данных

1.2.1. Обучение интеллектуальному анализу данных как средство развития междисциплинарных связей

1.2.2. Интеллектуальный анализ данных как средство развития определенных составляющих научно-исследовательской компетенции для работы с цифровыми данными

1.3. Обзор российской и зарубежной практики обучения интеллектуальному анализу данных и интеллектуальному анализу образовательных данных

1.4. Обеспеченность методической литературой по интеллектуальному анализу данных и интеллектуальному анализу образовательных данных

Выводы по первой главе

ГЛАВА 2. ПРОЕКТИРОВАНИЕ МЕТОДИКИ ОБУЧЕНИЯ ИНТЕЛЛЕКТУАЛЬНОМУ АНАЛИЗУ ДАННЫХ

2.1. Теоретические аспекты формирования методики обучения интеллектуальному анализу данных

2.2. Содержание, методы и формы обучения интеллектуальному анализу данных

2.2.1. Отбор содержания обучения

2.2.2. Описание процесса обучения в перевернутой форме

2.2.3. Отбор и разработка методов обучения интеллектуальному анализу данных

2.3. Средства обучения интеллектуальному анализу данных

2.3.1. Отбор средств обучения интеллектуальному анализу данных

2.3.2. Комплекс практических заданий

Выводы по второй главе

ГЛАВА 3. ОПЫТНО-ЭКСПЕРИМЕНТАЛЬНАЯ РАБОТА ПО РЕАЛИЗАЦИИ МЕТОДИКИ ОБУЧЕНИЯ ИНТЕЛЛЕКТУАЛЬНОМУ АНАЛИЗУ ДАННЫХ

3.1. Констатирующий этап эксперимента

3.2. Поисковый этап эксперимента

3.3. Формирующий и контрольный этапы эксперимента

Выводы по третьей главе

ЗАКЛЮЧЕНИЕ

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

ПРИЛОЖЕНИЯ

ВВЕДЕНИЕ

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методика обучения студентов с профильной вузовской подготовкой в области математики интеллектуальному анализу данных»

Актуальность исследования.

Стремительное развитие информационных технологий и построение цифровой экономики в РФ приводят к накоплению большого объема цифровых данных в различных областях деятельности. Анализ таких данных становится основой современных исследований, важность подготовки бакалавров в этой области отражена в федеральных государственных образовательных стандартах ФГОС ВО 3++, программе фундаментальных научных исследований в Российской Федерации на долгосрочный период (2021-2030 годы), федеральном законе «Об образовании в Российской Федерации».

Под воздействием цифровизации происходит трансформация всей системы образования, направленная на достижение необходимых образовательных результатов за счет построения персонализированного процесса учения, обеспечения непрерывного образования, грамотного управления образовательным процессом с использованием потенциала данных в цифровой форме. К 2024 году согласно программе «Цифровая экономика Российской Федерации» в 100% государственных образовательных организациях высшего образования планируется внедрение цифровой инфраструктуры управления, образовательного процесса (с обратной связью), научных исследований и разработок. Это обусловливает повсеместное применение в образовательных учреждениях перспективных информационно-коммуникационных технологий обучения, а также средств, методов и технологий хранения, передачи и обработки информации, необходимой субъектам образования; комплексное внедрение интеллектуальных информационных технологий в цифровую образовательную среду [39, 95].

В цифровой образовательной среде педагоги и другие участники образовательного процесса имеют дело с электронными журналами, компьютерными обучающими программами, дистанционными системами управления курсами и другими источниками разнородных данных, содержащих

сведения о процессе обучения. Образовательные данные могут содержать скрытые шаблоны и закономерности, а их обнаружение может быть использовано для принятия решений с целью повышения качества образования или создания новых технологий. Следуя данной тенденции к цифровизации, будущим специалистам в области образования необходимо уметь анализировать различные данные. Таким образом, важной компетенцией в цифровой образовательной среде становится аналитика процессов и результатов обучения. Организация же исследований «превращается в «диалог» между системами сбора данных и аналитическими системами, где ученый выполняет роль «модератора» этого диалога», а важным шагом в развитии любой науки становится переход к высокоинтенсивной работе с данными [21].

В связи с вышесказанным актуальной задачей образования становится подготовка квалифицированных специалистов, владеющих современными методами и инструментами анализа данных, в том числе образовательных, для проведения исследований на высоком уровне и построения качественного образовательного процесса.

В 2008 году в международном научном сообществе было создано новое научное направление, связанное с разработкой методов изучения уникальных данных, получаемых из образовательных учреждений, и с использованием этих методов для лучшего понимания студенческого запроса и повышения качества процесса образования. Это направление получило название «Educational Data Mining». В русскоязычной литературе данное направление переводится как «Интеллектуальный анализ образовательных данных» (ИАОД). Также в русскоязычной литературе встречается другое название данного направления: анализ образовательных данных (АОД). Методы ИАОД могут применяться для обеспечения обратной связи с целью помощи преподавателям, разработки индивидуального образовательного маршрута, прогнозирования успеваемости учащихся, разделения студентов на группы по разным признакам, выявления поведенческих стереотипов студенчества, построения модели студента,

моделирования образовательного содержания обучения, разработки концептуальных карт, оценки качества образования и др. [93].

Дисциплины по интеллектуальному анализу данных и смежным дисциплинам, как машинное обучение, нейронные сети и другие, активно вводятся в программы обучения будущих специалистов в области информационных технологий. Также открываются отдельные магистратуры, готовящие специалистов по анализу данных. В данном случае предполагается, что ИТ-специалист сможет работать с любыми данными из любых областей. Но задачи и проблемы области образования, а также специфика обработки образовательных данных в них обычно не рассматриваются.

Несмотря на большие возможности ИАОД для проведения современных исследований и определения тенденций педагогического развития, целенаправленные программы обучения будущих специалистов интеллектуальному анализу образовательных данных в РФ практически отсутствуют1, также мало соответствующих русскоязычных курсов или учебной литературы.

Будущим специалистам в области образования необходимо знание современных цифровых технологий и инструментов для осуществления профессиональной деятельности. Особенно важно это для будущих педагогов математики, информатики и технологии, осуществляющих подготовку по важным для развития цифровой экономики направлениям, что было отмечено в программе цифровой экономики РФ. Согласно программе, на 2018-2024 годы запланировано: увеличение обучающихся по программам высшего образования в сфере информационных технологий; осуществление поддержки талантливых школьников и студентов в области математики, информатики и технологий цифровой экономики; поддержка распространения опыта и лучших мировых практик в преподавании предметных областей «Математика», «Информатика» и

1 Подобную учебную дисциплину нам удалось обнаружить только в Высшей Школе Экономики в магистерской программе «Цифровая трансформация образования» (https://www.hse.ru/ma/dt/courses/375294964.html)

«Технология», организации углубленного изучения математики и информатики. Согласно профессиональному стандарту педагога к учителям математики и информатики предъявляются повышенные требования (модуль «Предметное обучение. Математика») к ИКТ-компетентности: нужно быть способным формировать навыки, связанные с информационно-компьютерными технологиями; владеть общепользовательской, общепедагогической и предметно-педагогической ИКТ-компетентностями; формировать у обучающихся умения применять средства ИКТ в решении задачи там, где это эффективно; профессионально использовать элементы информационной образовательной среды; владеть компьютерными инструментами визуализации данных, вычислений, обработки данных, экспериментальных лабораторий; организовывать исследования, что подразумевает проведение экспериментов, обнаружение закономерностей, доказательство в частных и общем случаях.

По нашему мнению, обучение студентов педагогических вузов интеллектуальному анализу данных может обеспечить появление специалистов, способных к организации как своей профессиональной, так и учебной исследовательской деятельности с помощью современных методов и инструментов анализа данных [93]. Кроме того, такие специалисты смогут выступать в качестве посредников между запросами образовательной среды и ИТ-специалистами, проектирующими и разрабатывающими образовательные технологии.

Для организации процесса обучения интеллектуальному анализу данных в педагогическом вузе также необходимо учесть в совокупности:

- повышенные требования к ИКТ-компетенции у учителей математики и информатики по сравнению с другими учителями;

- готовность студентов к освоению курса по интеллектуальному анализу данных;

- необходимость комбинированной фундаментальной подготовки по ряду математических и ИТ-дисциплин для успешного освоения курса по ИАД;

- наличие эрудиции в области основных тенденций развития, современных проблем и запросов образования.

Эта специфика позволяет развернуть подготовку специалистов указанного типа в том числе и в педагогических вузах на факультетах математики, на которых часто осуществляется подготовка не только педагогов, но и прикладных специалистов в области математики и информатики.

К настоящему времени методика обучения интеллектуальному анализу данных еще не являлась предметом отдельного научного исследования в системе высшего профессионального образования в Российской Федерации.

Анализ научно-педагогической и методической литературы, стандартов в области образования позволяет выделить ряд существующих противоречий между:

- острой необходимостью в специалистах, владеющих современными методами анализа образовательных данных и отсутствием соответствующей подготовки в российских вузах;

- требованием к уровню развития у современного специалиста научно-исследовательской компетенции (НИК) для успешного проведения исследований и недостаточным ее уровнем у выпускников современных университетов, в том числе педагогических;

- необходимостью обучения современным методам анализа данных, повышенной трудоемкостью изучения ИАД, что обусловлено междисциплинарным характером дисциплины, и недостаточной разработанностью методических средств, обеспечивающих успешное обучение.

Все вышеизложенное подтверждает актуальность проблемы настоящего исследования, которая состоит в научном обосновании методики обучения студентов с профильной вузовской подготовкой в области математики интеллектуальному анализу данных, на примере педагогического вуза.

Объект исследования - процесс обучения интеллектуальному анализу данных студентов вузов с профильной подготовкой в области математики.

Предмет исследования - методика обучения интеллектуальному анализу данных студентов бакалавриата педагогического вуза с профильной подготовкой в области математики.

Цель исследования - теоретически обосновать и разработать методику обучения студентов педагогического вуза с профильной подготовкой в области математики интеллектуальному анализу данных.

Гипотеза исследования - методика обучения интеллектуальному анализу данных студентов педагогического вуза с профильной подготовкой в области математики приведет к развитию у учащихся ряда личностных качеств, необходимых для проведения исследований с помощью современных методов и инструментов анализа данных, если:

- содержание обучения, отобранное с учетом принципов фундаментальности, доступности, междисциплинарности и практической направленности, будет представлено в виде структуры c несколькими итерациями, включающими применение учащимися ключевых этапов и методов анализа с различной степенью сложности и детализации;

- основным средством обучения будет выступать комплекс практических заданий по интеллектуальному анализу данных, построенный на базе современных программных средств анализа данных, ориентированный на развитие у студентов определенных составляющих научно-исследовательской компетенции в части работы с цифровыми данными: знание аппарата ИАД, критическое отношение к результатам на всех этапах анализа данных, самостоятельность и преодоление трудностей в ходе анализа цифровых данных и др., и способствующий развитию высших форм познавательной деятельности в соответствие с таксономией Блума;

- обучение будет осуществляться в форме «перевернутый класс» с дистанционной поддержкой, что позволит уделить больше аудиторного времени освоению практического комплекса, а методы обучения будут включать самостоятельное изучение теоретических материалов, тестирование, чтение научных статей, выполнение практических заданий исследовательского характера

и др. и будут подчинены развитию совокупности выделенных составляющих научно-исследовательской компетенции, связанных с интеллектуальным анализом цифровых данных.

Задачи исследования.

1. Уточнив понятийный аппарат исследования, проанализировать потенциал развития методики обучения интеллектуальному анализу данных и выполнить обзор подходов к обучению ИАД.

2. Выполнить отбор содержания обучения интеллектуальному анализу данных и уточнить структуру его изложения.

3. Обосновать формирование элементов методики, включая выбор формы, методов и средств обучения, целесообразных для обучения интеллектуальному анализу данных.

4. Разработать и организовать учебно-методическое сопровождение построенной методики обучения интеллектуальному анализу данных.

5. Экспериментально проверить эффективность разработанной методики с точки зрения формирования умений, знаний и владений в области анализа данных и развития сопутствующих составляющих научно-исследовательской компетенции.

Для решения поставленных задач использовались следующие методы исследования:

- Теоретические: изучение и теоретический анализ философской, психолого-педагогической, методической и специализированной литературы, раскрывающей исследуемые в работе вопросы; анализ нормативных и программно-методических документов, относящихся к образовательной сфере и проблеме исследования; анализ учебных программ дисциплины «Интеллектуальный анализ данных» и существующих учебных пособий; изучение и обобщение опыта преподавания интеллектуального анализа данных и смежных дисциплин;

- Эмпирические: опрос, беседа, анкетирование, тестирование, наблюдение за учебным процессом и анализ продуктов исследовательской деятельности, педагогический эксперимент;

- Статистические: математические методы обработки экспериментальных данных и их качественный анализ.

На защиту выносятся следующие положения:

1. Включение в программу обучения студентов педагогического вуза с профильной вузовской подготовкой в области математики дисциплины «Интеллектуальный анализ данных» обусловлено социальным запросом на подготовку квалифицированных специалистов, владеющих современными методами и инструментами сбора, обработки и анализа цифровых данных для проведения исследований на современном уровне и построения качественного образовательного процесса;

2. Содержание обучения интеллектуальному анализу данных, отобранное в соответствии с принципами фундаментальности, актуальности, доступности и междисциплинарности, представлено в виде структуры с тремя итерациями2, что позволяет поэтапное освоение учебного материала, когда на каждой следующей итерации закрепляется, расширяется и дополняется материал предыдущих итераций;

3. Методика обучения интеллектуальному анализу данных, реализованная по организационной форме «перевернутый класс», позволяет сосредоточиться в аудиторные часы на высших уровнях освоения учебного материала (применение, анализ, синтез, оценка) по таксономии Б. Блума, что особенно важно в курсах практической направленности;

4. Результативность обучения интеллектуальному анализу данных обеспечивается применением методов обучения, эффективных для обучения в перевернутом формате и стимулирующих развитие определенных составляющих научно-исследовательской компетенции, которые актуальны для проведения

2 Итерация понимается нами как очередное циклично усложняющееся повторение определенной последовательности тем.

качественных исследований с помощью методов ИАД (метод тестирования, метод быстрого чередования, изучение научных статей, выполнение практических заданий и др.), и средств обучения, среди которых разработанные учебно-методические материалы и практические задания для самостоятельной работы в программной системе анализа данных Weka, сама система Weka и среда дистанционного обучения Moodle (СДО Moodle), позволяющая организовать смешанное обучение;

5. Предложенная методика обучения способствует успешному усвоению понятий и методов интеллектуального анализа данных, развитию личностных качеств, необходимых для интеллектуального анализа экспериментальных данных в цифровом виде, повышению мотивации к исследовательской деятельности с применением методов ИАД.

Теоретико-методологическую основу исследования составляют работы:

- по общей педагогике и дидактике (Ю.К. Бабанский, Б.С. Блум, В.В. Краевский, Д.Р. Кратвол, В.С. Кукушин, И.Я. Лернер, П.И. Пидкасистый, И.П. Подласый, А.М. Пышкало, В.А, Сластенин и др.);

- по интеллектуальному анализу данных (В.А. Дюк, И.А. Чубукова, М. Шапот и др.) и интеллектуальному анализу образовательных данных (В.А. Акимушкин, П.П. Белоножко, С. Вентура, М.В. Петрова, С.Н. Поздняков, С. Ромеро и др.);

- по методике обучения интеллектуальному анализу данных и смежным дисциплинам (В.Ю. Бодряков, М. Гальченко, Н.Н. Жуков, С.А. Нестеров, А.В. Смирнов, А.Г. Степанов и др.);

- по определению и развитию исследовательской компетентности (А.А. Бодалев, Ю.А. Комарова, В.В. Лаптев, В.В. Лебедев, Ю.В. Рындина, Е.В. Феськова и др.);

- по информатизации образования и смешанному обучению (Е.В. Баранова,

B.И. Богословский, З. Зайнуддин, Н.В. Макарова, Т.Н. Носкова, И.В. Симонова,

C. Х. Халили, Н. Черрез и др.);

- нормативно-правовые документы (ФЗ «Об образовании в Российской Федерации», программа «Цифровая экономика Российской Федерации», Федеральные государственные стандарты высшего образования и др.);

Основные этапы исследования. Исследование проводилось с 2015 по 2021 год и включало в себя четыре этапа.

Первый этап (2015-2017 гг.) - констатирующий, в ходе которого формулировалась исследовательская проблема, осуществлялся анализ исследуемой проблемы в психолого-педагогической и методической литературе.

Второй этап (2017-2019 гг.) - поисковый, на котором была сформулирована гипотеза исследования, разрабатывалось содержание обучения, производился отбор методов, форм и средств обучения, организована дистанционная поддержка обучения. Разработаны методические материалы. Проведена предварительная апробация методики.

Третий этап (2019-2020 гг.) - формирующий. Проведен педагогический эксперимент по апробации разработанной методики обучения интеллектуальному анализу данных, произведена обработка экспериментальных данных.

Четвертый этап (2021 г.) - контролирующий. Выполнено сравнение результатов обучения в контрольной и экспериментальной группах, сформулированы выводы и обобщения по проведенному исследованию, осуществлено литературное оформление текста диссертации.

Опытно-экспериментальной базой исследования являлся факультет математики РГПУ им. А. И. Герцена.

Научная новизна исследования заключается в том, что:

1. Определены составляющие научно-исследовательской компетенции, связанные с возможностью применения методов интеллектуального анализа данных для обработки и анализа цифровых данных: знание аппарата ИАД, владение программными средствами ИАД, критическое отношение к результатам на всех этапах анализа данных, поисковые умения в области ИАД, способность к коммуникации по вопросам ИАД и др.;

2. Впервые разработана и апробирована методика смешанного обучения интеллектуальному анализу данных с итеративной структурой построения содержания и активным применением дистанционных форм обучения для подготовки учащихся к анализу данных с помощью современных методов и компьютерных средств аналитики, а также к использованию получаемых результатов для принятия решений. В основе методики лежат средства и методы обучения, ориентированные на развитие выделенных составляющих научно-исследовательской компетенции, отобранные и разработанные для каждого этапа обучения;

3. Обоснован циклический процесс с повторяющимися пятью этапами (самостоятельное освоение, тестирование, совместное обсуждение, совместная деятельность, индивидуальная работа), реализующий организационную форму обучения «перевернутый класс»;

4. Аргументировано применение метода быстрого чередования на этапе совместной деятельности при обучении в форме перевернутого класса.

Теоретическая значимость исследования состоит в том, что:

- обоснована актуальность обучения интеллектуальному анализу данных студентов с профильной вузовской подготовкой в области математики;

- уточнены понятия «интеллектуальный анализ данных» и «интеллектуальный анализ образовательных данных»;

- выявлено, что в области интеллектуального анализа данных выделяются несколько ключевых технологий: предварительная обработка данных, поиск ассоциативных правил и шаблонов, классификация и кластеризация, которыми необходимо владеть для эффективного решения задач ИАД как по отдельности, так и в их взаимосвязи;

- детализирован структурно-компонентный состав научно-исследовательской компетенции, содержащий личностный, мотивационный, коммуникационный, организационный и отраслевой компоненты;

- разработаны показатели оценки сформированности ряда составляющих организационного компонента научно-исследовательской компетенции в части возможности интеллектуального анализа цифровых данных;

- выявлено, что перевернутая форма обучения, благодаря специфике ИАД, позволяет участникам педагогического процесса сосредоточиться при аудиторных формах обучения на высших уровнях освоения учебного материала согласно таксономии Б. Блума (применение, анализ, синтез, оценка), передавая на самостоятельную работу студентов базовые этапы учения (запоминание, понимание);

- введено понятие «метод быстрого чередования», под которым понимается метод активного обучения с частой сменой порций теоретического материала, сообщаемого преподавателем, и практической работы обучаемых, использующих этот материал.

Практическая значимость исследования состоит в том, что:

- разработаны и внедрены учебно-методические материалы для обучения студентов интеллектуальному анализу данных, включая теоретические материалы с примерами междисциплинарных связей, вопросы для тестирования, презентации с демонстрационными примерами по работе в компьютерной программе интеллектуального анализа данных Weka, а также методические указания к выполнению практических заданий;

- предложены в качестве ключевых средств обучения современная компьютерная программа интеллектуального анализа данных Weka и разработанный на ее базе авторский учебно-методический комплекс;

- организовано сопровождение смешанного обучения интеллектуальному анализу данных в среде дистанционного обучения Moodle с активным использованием деятельностных элементов среды.

Достоверность и обоснованность научных положений и результатов исследования обеспечивается анализом научной литературы по проблеме исследования, аргументированностью и логической непротиворечивостью

теоретических основ исследования, применением методов исследования, адекватных предмету, объекту, целям и задачам исследования, поэтапным проведением экспериментальной работы в течение 7 лет и положительными результатами апробации разработанной методики, соответствующими теоретическим выводам исследования, а также опытом работы соискателя в качестве преподавателя факультета математики РГПУ им. А. И. Герцена.

Апробация и внедрение результатов исследования осуществлялись на факультете математики РГПУ им. А. И. Герцена в соответствии с основными этапами научно-педагогического исследования в ходе выполнения теоретической и практической частей работы. Материалы диссертационного исследования были изложены автором и обсуждались на следующих всероссийских и международных конференциях:

• международная ежегодная научная Интернет-конференция «Новые образовательные стратегии в современном информационном пространстве» (РГПУ им. А. И. Герцена, Санкт-Петербург, 2017, 2018, 2020, 2021 гг.);

• научная конференция «Герценовские чтения - Некоторые актуальные проблемы современной математики и математического образования» (РГПУ им. А. И. Герцена, Санкт-Петербург, 2015, 2019 гг.);

• всероссийская конференция «Преподавание информационных технологий в Российской Федерации» (Москва, 2018, 2020 гг.)

• всероссийская научно-практическая конференция с международным участием «Дистанционное обучение в высшем профессиональном образовании: опыт, проблемы и перспективы развития» (СПбГУП, Санкт-Петербург, 2017, 2018 г.)

• международная конференция «Региональная информатика» (Санкт-Петербург, 2018 г.)

• международная научно-практическая конференция «Высокотехнологичная информационная образовательная среда» (РГПУ им. А. И. Герцена, Санкт-Петербург, 2015 г.)

По теме диссертационного исследования опубликованы 21 научная работа, в том числе 1 коллективная монография, 3 статьи в изданиях, рекомендованных Высшей аттестационной комиссией по специальности 5.8.2 Теория и методика обучения и воспитания, 5 работ проиндексированы в базе Scopus.

Учебная программа разработанного курса «Интеллектуальный анализ данных» была признана победителем конкурса учебных планов молодых преподавателей вузов, состоявшемся в рамках XVIII Всероссийской конференции «Преподавание информационных технологий в Российской Федерации» в 2020 г.

Объём и структура диссертации. Диссертация включает введение, три главы c 10 параграфами, заключение, список литературы и 6 приложений. Общий объем диссертации составляет 184 страницы, из них 149 страниц - основной текст, 16 страниц - список использованной литературы и 19 страниц -приложения. В работе содержатся 29 рисунков и 21 таблица. Список литературы содержит 142 источника, из них 33 на иностранном языке. Приложения включают авторские методические материалы по отдельным темам курса.

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Тербушева Екатерина Александровна, 2022 год

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Аджиев, В. MineSet - визуальный инструмент аналитика / В. Аджиев // Открытые системы. СУБД. - 1997. - № 3. - C. 72-77.

2. Адольф, В.А. Профессиональная компетентность современного учителя: монография / В.А. Адольф. - Красноярск: Красноярский государственный университет, 1998. - 310 с.

3. Акимушкин, В.А. Обзор методов Educational Data Mining для анализа протоколов взаимодействия обучаемого с «научными играми» / В.А. Акимушкин, С.Н. Поздняков // Компьютерные инструменты в образовании. - 2013. - № 6. - C. 16-32.

4. Алексеев, Е.С. Англо-русский толковый словарь по системотехнике ЭВМ: для пользователей ПЭВМ / Е.С.Алексеев, А.А.Мячев. - М.: Финансы и статистика, 1993. - 256 с.

5. Алымова, Е.В. Использование облачных баз данных для обучения специалистов таможенного дела основам Data Mining / Е.В. Алымова // Особенности государственного регулирования внешнеэкономической деятельности в современных условиях: материалы V всероссийской научно-практической конференции (Ростов-на-Дону, 15-16 ноября 2018). - Российская таможенная академия, Ростовский филиал, 2018. - С. 436-444.

6. Анализ данных и процессов / А.А. Барсегян, М.С. Куприянов, И.И. Холод [и др.]. - 3 изд. - СПб.: БХВ-Петербург, 2009. - 512 с.

7. Андреева, Н.М. Методика использования дорожных карт при электронном обучении студентов информатике: на примере экономических и биологических направлений подготовки: автореферат дис. ... канд. пед. наук: 13.00.02 / Н.М. Андреева. - Красноярск, 2015. - 25 с.

8. Бабанский, Ю.К. Методы обучения в современной общеобразовательной школе / Ю.К. Бабанский. - М.: Просвещение, 1985. - 208 с.

9. Баранова, Е.В. Опыт формирования научно-исследовательской компетентности будущих учителей информатики / Е.В. Баранова, В.В. Лаптев,

И.В. Симонова // Региональная информатика «РИ-2012». Материалы юбилейной XIII Санкт-Петербургской Международной конференции «Региональная информатика "РИ-2012"» (Санкт-Петербург, 24-26 октября 2012). - Санкт-Петербургское Общество информатики, вычислительной техники, систем связи и управления. - С. 216.

10. Баранова, Е.В. Развитие алгоритмической компетенции студентов при подготовке учителей информатики в условиях цифрового образования / Е.В. Баранова, И.В. Симонова // Перспективы науки. - 2019. - № 8 (119). - С. 113-122.

11. Баранова, Е.В. Развитие профессиональных компетенций бакалавров по направлению педагогического образования в области информатики в условиях цифрового образования / Е.В. Баранова, И.В. Симонова // Известия РГПУ им. А. И. Герцена. - 2018. - № 190. - С. 116-124.

12. Белоножко, П.П. Анализ образовательных данных: направления и перспективы применения / П.П. Белоножко, А.П. Карпенко, Д.А. Храмов // Интернет-журнал «Науковедение». - 2017. - Т. 9. - № 4. - 21 с.

13. Беляев, В.В. Использование методов интеллектуального анализа данных при обучении магистров направления подготовки «Экономика» / В.В. Беляев // Современное образование: содержание, технологии, качество. Материалы XXII международной научно-методической конференции. - СПб.: СПбГУ «ЛЭТИ» им. Ульянова (Ленина), 2016. - С. 21-23.

14. Беляева, Л.Н. Сетевой инструментарий лингвиста. Материалы для учебно-методического сопровождения дисциплины. Часть 1 / Л.Н. Беляева, К.Р. Пиотровская. - СПб: ООО «Книжный дом», 2014. - 48 с.

15. Бодалев, А.А. Вершина в развитии взрослого человека: характеристики и условия достижения / А.А. Бодалев. - М.: Флинта Наука, 1998. -168 с.

16. Бодряков, В.Ю. Формирование основ профессиональной исследовательской культуры студентов педагогического университета как ответ на вызовы современности / В.Ю. Бодряков, Л.Р. Ушакова // Профессиональная культура российской интеллигенции. - 2017. - С. 254-261.

17. Бодряков, В.Ю. Методические подходы к обучению студентов направления «Прикладная математика и информатика» основам интеллектуальной обработки Больших данных / В.Ю. Бодряков, А.А. Быков // Педагогическое образование в России. - 2016. - № 7. - C. 145-152.

18. Большой психологический словарь / Под ред. Б.Г. Мещерякова, В.П. Зинченко. - СПб.: Прайм ЕВРОЗНАК; М.: ОЛМА-Пресс, 2003. - 666 с.

19. Большой энциклопедический словарь / Под ред. А.М. Прохорова. - 2 изд. - М.: Большая Российская энциклопедия; СПб.: Норинт, 2000. - 1434 с.

20. Бороненко, Т.А. Роль методической системы обучения информатике в профессиональной подготовке педагогов / Т.А. Бороненко // Вестник Ленинградского государственного университета им. А. С. Пушкина. - 2012. - Т. 3.

- № 1. - С. 107-113.

21. Будущее образования: глобальная повестка [Электронный ресурс] // Доклад, подготовленный Агентством стратегических инициатив, Московской школой управления «Сколково» и Сколтехом. URL: https://drive.google.com/file/d/1P69ig6nmOZEEH2Sl1lKOoojfVFO7pZGg/view (дата обращения: 09.02.2022).

22. Бужинская, Н.В. Формирование исследовательской компетентности студентов в процессе изучения информатики / Н.В. Бужинская, Л.И. Миназова // Молодой ученый. - 2013. - № 1. - С. 34-38.

23. Буров, К. Обнаружение знаний в хранилищах данных. / К. Буров // Открытые системы. СУБД. - 1999. - № 05-06.

24. Вишнякова, С.М. Профессиональное образование: Словарь. Ключевые понятия, термины, актуальная лексика. / С.М. Вишнякова. - М.: НМЦ СПО, 1999.

- 538 с.

25. Гальченко, М.И. Data Mining и статистические методы при оценивании качества курсов повышения квалификации / М.И. Гальченко, А.Г. Гущинский // Открытое образование. - 2014. - № 6. - С. 15-21.

26. Гальченко, М.И. Задачи интеллектуального анализа данных в курсе «Информационные технологии» / М.И. Гальченко, А.П. Майоров, А.Г.

Гущинский // Преподавание информационных технологий в Российской Федерации: материалы X открытой Всероссийской конференции (16-18 мая 2012). - М.: МГУ им. М.В. Ломоносова, 2012. - С. 84-86.

27. Гейбука, С.В. Подготовка будущих учителей математики к формированию исследовательской деятельности школьников: автореферат дис. ... канд. пед. наук: 13.00.02 / С.В. Гейбука. - Новосибирск, 2005. - 20 с.

28. Гоголева, И.В. Развитие положительной мотивации учебной деятельности у студентов-экономистов вуза: (на основе междисциплинарной интеграции курса математики): дис. ... канд. пед. наук: 13.00.01 / И.В. Гоголева. -Якутск, 2005. - 247 с.

29. Готская, И.Б. Методическая система обучения информатике студентов педвузов в условиях рыночной экономики (теоретические основы, практика проектирования): дис. ... док. пед. наук: 13.00.02 / И. Б. Готская. - СПб., 1999. -406 с.

30. Дарвин, Ч. Сочинения. Т. 9: Записные книжки, дневники, воспоминания. Жизнь Эразма Дарвина / Ч. Дарвин. - М.; Ленинград: Гос. изд-во биол. и мед. литературы, 1959. - С. 166-242.

31. Дюк, В.А. Data Mining: учебный курс / В.А. Дюк, А.П. Самойленко. -СПб.: Питер, 2001. - 368 с.

32. Елагина, В.С. Исследовательская компетенция как компонент профессионально-педагогической компетентности студентов педагогического колледжа / В.С. Елагина, Н.В. Ковалева // Инновационное развитие профессионального образования. - 2015. - № 1 (07) - С. 118-121.

33. Епишкин, Н.И. Исторический словарь галлицизмов русского языка // Н.И. Епишкин. - Москва: ЭТС, 2010. - 5140 с.

34. Жуков, Н.Н. О содержании обучения будущих инженеров-программистов Дата-майнингу / Н.Н. Жуков // Ученые записки Института социальных и гуманитарных знаний. - 2015. - № 1. - C. 202-208.

35. Захарова, Т.Г. Организация повторения при подготовке к Всероссийской проверочной работе по математике в 5 классе / Т.Г. Захарова, И.К.

Кондаурова, П.А. Кондрацкова // Азимут научных исследований: педагогика и психология. - 2018. - № 2 (23). - С. 129-133.

36. Зеер, Э.Ф. Модернизация профессионального образования: компетентностный подход: учебное пособие / Э.Ф. Зеер, А.М. Павлова, Э.Э. Сыманюк. - М.: Московский психолого-социальный институт, 2005. -216 с.

37. Зенина, Л.В. Возможности современных компьютерных программ в процессе обучения иностранным языкам в вузе / Л.В. Зенина, Н.А. Каменева // Педагогика и психология образования. - 2013. - № 3. - С. 57-60.

38. Ильичев, Л.Ф. Философский энциклопедический словарь / Л.Ф. Ильичев, П.Н. Федосеев, С.М. Ковалев, В.Г. Панов. - М.: Советская энциклопедия, 1983. - 840 c.

39. Интеллектуальные технологии в цифровой среде университета: монография / под. ред. Т.Н. Носковой. - СПб.: Центр научно-информационных технологий «Астерион», 2020. - 288 с.

40. Кафедра организации здравоохранения [Электронный ресурс] // Med.spbu.ru: сайт медицинского факультета Санкт-Петербургского государственного университета. URL: https://med.spbu.ru/kafedry/kafedra-organizatsii-zdravookhraneniya.html (дата обращения: 9.02.2022).

41. Кислова, О.Н. Преподавание интеллектуального анализа данных студентам-социологам / О.Н. Кислова // Материалы всероссийской социологической конференции «Образование и общество» (Москва, 20-22 октября 2009). - M.: Институт социологии РАН. - С. 71-76.

42. Комарова, Ю.А. Научно-исследовательская компетентность специалистов: функционально-содержательное описание / Ю.А. Комарова // Известия Российского государственного педагогического университета им. А.И. Герцена. - 2008. - № 68. - С. 69-77.

43. Компетенции в образовании: опыт проектирования: сборник научных трудов / под ред. А.В. Хуторского. - М.: Научно-внедренческое предприятие «ИНЭК», 2007. - 327 с.

44. Копосова, Е.Г. Междисциплинарный подход в обучении математике студентов бакалавриата (на примере химических направлений подготовки): дис. ... канд. пед. наук: 13.00.08 / Е.Г. Копосова. - СПб., 2010. - 195 с.

45. Кордуэлл, M. Психология. А-Я. Словарь-справочник / М. Кордуэлл. -М.: Фаир-пресс, 2000. - 440 с.

46. Кречетов, И.А. Об одном алгоритме адаптивного обучения на основе кривой забывания / И.А. Кречетов, В.В. Кручинин // Доклады Томского государственного университета систем управления и радиоэлектроники. - 2017. -№ 1. - С. 75-80.

47. Кузнецов, А.А. Общая методика обучения информатике. Часть 1: Учебное пособие для студентов педагогических вузов / А.А. Кузнецов, Т.Б. Захарова, А.С. Захаров. - М.: Прометей, 2016. - 300 с.

48. Кузнецова, Ю.М. Изучение положения дел в науке с помощью методов интеллектуального анализа текстов / Ю.М. Кузнецова, Г.С. Осипов, Н.В. Чудова // Управление большими системами. Наукометрия и экспертиза в управлении наукой. - 2013. - № 44. - C. 106-136.

49. Кукушин, В.С. Дидактика (теория обучения): учебное пособие / В.С. Кукушин. - М.: ИКЦ «МарТ»; Ростов-н/Д: ИКЦ «МарТ», 2003. - 368 с.

50. Лаптев, В.В. Научный подход к построению программ исследования качества образования / В.В. Лаптев // Модернизация общего образования на рубеже веков: сборник научных трудов. - СПб.: Изд-во РГПУ им. А.И. Герцена, 2001. - С. 3-10.

51. Лебедев, В.В. Исследовательская компетентность педагога: технология мыследеятельности / В.В. Лебедев // Наука и школа. - 2010. - № 1. -С. 30-35.

52. Лернер, И.Я. О методах обучения / И.Я. Лернер, М.Н. Скаткин // Советская педагогика. - 1965. - № 3. - С. 115-128.

53. Лудченко, А.А. Основы научных исследований: учебное пособие / А.А. Лудченко, Я.А. Лудченко, Т.А. Примак. - 2 изд. - К.: О-во «Знания», КОО, 2001. - 113 с.

54. Майер, Р.В. Закономерности усвоения, забывания и имитационное моделирование обучения / Р.В. Майер // Инновации в образовании. - 2017. - № 5.

- С. 145-152.

55. Майер, Р.В. Чередование теоретических и практических занятий как эффективный метод обучения: Результаты имитационного моделирования / Р.В. Майер // Современное образование. - 2015. - № 4. - С. 145-155.

56. Макарова, Н.В. Определение информатики как предмета обучения в высшей школе / Н.В. Макарова, А.Г. Степанов // Учёные записки международного банковского института. - 2014. - № 7. - С. 74-85.

57. Малев, В.В. Общая методика преподавания информатики: учебное пособие / В.В. Малев. - Воронеж: ВГПУ, 2005. - 271 с.

58. Маркова, А.К. Психология профессионализма / А.К. Маркова. - М.: Международный гуманитарный фонд «Знание», 1996. - 187 с.

59. Назарова, Т.С. Средства обучения // Российская педагогическая энциклопедия: Т.2 / под ред. В.В. Давыдова. - М.: Большая российская энциклопедия, 1993. - 1160 с.

60. Нестеров, С.А. Об обучении технологиям интеллектуального анализа данных в рамках курса «Корпоративные системы баз данных» / С.А. Нестеров // Преподавание информационных технологий в Российской Федерации: материалы XIV открытой Всероссийской конференции (Санкт-Петербург, 19-20 мая 2016). -М.: OOO «1 C-Паблишинг», 2016. - С. 78-79.

61. Новиков, Д.А. Закономерности итеративного научения / Д.А. Новиков. - М.: Институт проблем управления им. В.А. Трапезникова РАН, 1998.

- 77 с.

62. Нуриева, Э.Н. Междисциплинарные связи как способ формирования общекультурных и общепрофессиональных компетенций / Э.Н. Нуриева, Л.В.

Бакеева // Вестник Казанского технологического университета. - 2012. - Т. 15. -№ 23. - С. 222-225.

63. Овсяницкая, Л.Ю. Интеллектуальный анализ данных как составляющая педагогического управления / Л.Ю. Овсяницкая // Образование и наука. - 2013. - № 10 (109). - C. 80-90.

64. Ожегов, С.И. Толковый словарь русского языка / С.И. Ожегов, Н.Ю. Шведова; Российская АН, Инст-т рус. яз., Российский фонд культуры. - 2-e изд., испр. и доп. - М.: Азъ, 1994. - 907 с.

65. Петрова, М.В. Исследование возможностей методов интеллектуального анализа данных при моделировании образовательного процесса в вузе / М.В. Петрова, Д.А. Ануфриева // Вестник Чувашского университета. - 2013. - № 3. - С. 280-285.

66. Пигарев, А.Ю. Методические аспекты адаптивного обучения физике / А.Ю. Пигарев // Научно-педагогическое обозрение. Pedagogical Review. - 2015. -№ 3 (9). - С. 62-68.

67. Пиотровская, К.Р. Интеллектуальный анализ данных и развитие научно-исследовательских компетенций бакалавров / К.Р. Пиотровская, Е.А. Тербушева // Современные проблемы науки и образования. - 2017. - № 1. - С. 93.

68. Платонов, К.К. Структура и развитие личности / К.К. Платонов; отв. ред.: А.Д. Глоточкин. - М.: Наука, 1986. - 256 с.

69. Плотникова, Н.И. Общеучебные компетенции в структуре дистанционного курса на английском языке / Н.И. Плотникова // Компетенции в образовании: опыт проектирования: сборник научных трудов / под ред. А.В. Хуторского. - М.: Научно-внедренческое предприятие «ИНЭК», 2007. - 327 с.

70. Подласый, И.П. Педагогика. Книга 2 / И.П. Подласый. - 2-е изд. -М.: Гуманитар. изд. центр «ВЛАДОС», 2007. - 575 с.

71. Поличка, А.Е. Принципы отбора содержания обучения бакалавров для реализации педагогического потенциала математических дисциплин / А.Е. Поличка, М.А. Кислякова // Сибирский педагогический журнал. - 2017. - № 3. -С. 71-74.

72. Психология и педагогика: учебник для бакалавров / под ред. П.И. Пидкасистого. - М.: Юрайт, 2019. - 724 с.

73. Пышкало, А.М. Методическая система обучения геометрии в начальной школе: авторский доклад по монографии «Методика обучения геометрии в начальных классах», представленной на соискание ученой степени д-ра пед. наук / А.М. Пышкало. - М.: Академия пед. наук СССР, 1975. - 60 с.

74. Родионова, З.В. Обзор современных инструментов электронного обучения / З.В. Родионова // Вестник НГУЭУ. - 2014. - № 2. - С. 280-285.

75. Российская педагогическая энциклопедия / Под ред. В.Г. Панова. -М.: Большая Российская энциклопедия, 1993. - 1160 с.

76. Российская энциклопедия по охране труда. В 3 томах. Том 2. Л-Р / Под ред. А.Л. Сафонова (отв. ред.) и др. - 2-е изд. - М.: НЦ ЭНАС, 2007. - 407 с.

77. Рубинштейн, С.Л. Основы общей психологии / С.Л. Рубинштейн. -СПб: Питер, 2002 г. - 720 с.

78. Рындина, Ю.В. Исследовательская компетентность как психолого-педагогическая категория / Ю.В. Рындина // Молодой ученый. - 2011. - № 1. - С. 228-232.

79. Савина, О.Ю. Моделирование прототипа интерактивной обучающей программы по работе с трудно дифференцируемой лексикой / О.Ю. Савина // Вестник ВГУ. Серия: Лингвистика и межкультурная коммуникация. - 2017. - № 1. - С. 151-154.

80. Сандриева, Л.М. Реализация технологии проблемного обучения при изучении курса информатики в техническом вузе / Л.М. Сандриева, Г.Л. Салихова // Проблемы современного педагогического образования. - 2018. - № 58-2. - С. 213-216.

81. Сластенин, В.А. Психология и педагогика: учебное пособие для студентов высших учебных заведений / В.А. Сластенин, В.П. Каширин. - М.: Академия, 2001. - 480 с.

82. Смирнов, А.В. Формирование практических навыков в области Data Mining с помощью курсового проектирования студентов / А.В. Смирнов //

Современное образование: содержание, технологии, качество. - 2015. - № 2. - С. 169-170.

83. Смирнова, Н.В. Опыт построения модели психического состояния обучаемых по истории их работы в следящей интеллектуальной обучающей системе / Н.В. Смирнова // Управление большими системами: сборник трудов. -2014. - № 49. - С. 96-128.

84. Софронова, Н.В. Теория и методика обучения информатике: учебное пособие для вузов / Н.В. Софронова, А.А. Бельчусов. - 2-е изд., перераб. и доп. -М.: Юрайт, 2019. - 401 с.

85. Социология: Энциклопедия / А.А. Грицанов, В.Л. Абушенко, Г.М. Евелькин [и др.]. - Минск: Книжный Дом, 2003. - 1312 c.

86. Степанов, А.Г. Методика обучения и информационная поддержка учебной дисциплины, связанной с обработкой больших данных / А.Г. Степанов, В.С. Блюм, В.С. Васильева // Устойчивое развитие цифровой экономики, промышленности и инновационных систем: сборник научных трудов. - СПб.: ПОЛИТЕХ-ПРЕСС, 2020. - С. 560-562.

87. Степанов, А.Г. Подходы к определению средств для построения методики обучения работе с большими данными / А.Г. Степанов, Г.А. Плотников, В.С. Васильева // Информатика и образование. - 2021. - № 4. - С. 54-62.

88. Стефанова, Н.Л. Теоретические основы развития системы методической подготовки учителя математики в педагогическом вузе: дис. ... док. пед. наук: 13.00.02 / Н. Л Стефанова. - СПб., 1996. - 366 с.

89. Ступина, М.В. Теоретико-методологические основания отбора содержания обучения будущих инженеров ИТ-профиля / М.В. Ступина // Преподаватель XXI век. - 2017. - № 1-1. - С. 205-213.

90. Тайзетдинова, А.Г. Анализ автоматизированных систем дистанционного обучения / А.Г. Тайзетдинова // Инновационное развитие профессионального образования. - 2016. - № 2 (10). - С. 32-38.

91. Теоретические основы процесса обучения в советской школе / под ред. В.В. Краевского, И.Я. Лернера. - М.: Педагогика, 1989. - 316 с.

92. Тербушева, Е.А. Аналитический потенциал платформы МооШе для мониторинга качества персонифицированного обучения / Е.А. Тербушева, К.Р. Пиотровская // Общество. Коммуникация. Образование. - 2021. - Т. 12. - № 4. -С. 19-34.

93. Тербушева, Е.А. Методика обучения интеллектуальному анализу образовательных данных студентов педагогического вуза / Е.А. Тербушева // Открытое образование. - 2019. - № 3. - С. 14-24.

94. Тербушева, Е.А. Развитие научно-исследовательских компетенций бакалавров в курсе интеллектуального анализа данных / Е.А. Тербушева // Научное обозрение: гуманитарные исследования. - 2017. - № 20-21. - С. 28-37.

95. Технология концентрированного обучения студентов в холистичных компьютерных аудиториях единой электронной информационно-образовательной среды педагогического вуза / В.И. Богословский, В.Н. Аниськин, С.В. Горбатов [и др.] // Самарский научный вестник. - 2017. - Т. 6. - № 3 (20). - С. 263-270.

96. Толковый словарь русского языка / Под ред. Д.В. Дмитриева. - М.: Астрель, 2003. - 1578 с.

97. Толковый словарь русского языка. В 4 томах. Том 1. / Под. ред. Д.Н. Ушакова. - М.: Гос. ин-т «Советская энцикликлопедия»; ОГИЗ, 1935. - 1562 с.

98. Торкунова, Ю.В. Формирование научно-исследовательской компетентности магистров / Ю.В. Торкунова, А.Е. Упшинская // Современные проблемы науки и образования. - 2016. - № 6. - С. 441.

99. Ульянова, О.В. Междисциплинарность как основополагающий принцип формирования профессиональной компетентности студентов технических вузов / О.В. Ульянова // Профессиональное образование в России и за рубежом. - 2012. - № 4 (8). - С. 65-68.

100. Ушинский, К.Д. Собрание сочинений. Том 3: Педагогические статьи 1862-1870 гг. / К.Д. Ушинский. - М.; Ленинград: Академия педагогических наук РСФСР, 1948. - С. 177-178.

101. Феськова, Е.В. Становление исследовательской компетентности учащихся в дополнительном образовании и профильном обучении: автореферат дис. ... канд. пед. наук: 13.00.01 / Е.В. Феськова. - Красноярск, 2005. - 22 с.

102. Хуторной, А.В. Современная дидактика: учебное пособие / А.В. Хуторской. - М.: Высшая школа, 2007. - 639 с.

103. Хуторской, A.B. Ключевые компетенции как компонент личностно-ориентированной парадигмы образования / А.В. Хуторской // Народное образование. - 2003. - № 2. - С. 58-64.

104. Чмыхова, Е.В. Тестирование знаний студентов и методологические проблемы использования его результатов / Е.В. Чмыхова, А.Т. Терехин // Стандарты и мониторинг образования. - 2010. - № 4. - С. 25-29.

105. Чошанов, М.А. Гибкая технология проблемно-модульного обучения: Методическое пособие / М.А. Чошанов. - М.: Народное образование, 1996. - 160 с.

106. Чубукова, И.А. Data mining: учебное пособие / И.А. Чубукова. - 2-e изд. - М.: Интернет-Университет Информационных Технологий: БИНОМ. Лаборатория знаний, 2008. - 382 с.

107. Шапот, М. Интеллектуальный анализ данных в системах поддержки принятия решений / М. Шапот // Открытые системы. СУБД. - 1998. - № 1. - С. 30-35.

108. Шапот, М. Интеллектуальный анализ данных и управление процессами / М. Шапот, В. Рощупкина // Открытые системы. СУБД. - 1998. - № 4.

109. Яфизова, Р.А. Реализация междисциплинарных связей математики и информатики в системе среднего профессионального образования / Р.А. Яфизова // Сибирский педагогический журнал. - 2011. - № 12. - С. 160-166.

110. Aher, S.B. Applicability of data mining algorithms for recommendation system in e-learning / S.B. Aher, L. Lobo // Proceedings of the International Conference on Advances in Computing, Communications and Informatics (ICACCI'12). - New York, 2012. - ACM. - P. 1034-1040.

111. Amresh, A. Evaluating the effectiveness of flipped classrooms for teaching CS1 / A. Amresh, A.R. Carberry, J. Femiani // In Proceedings of Frontiers in Education

Conference (FIE), 2013. - Oklahama City, OK: IEEE Xplore Digital Library, 2013. - P. 733-735.

112. Anderson, L.W. A Taxonomy for Learning, Teaching, and Assessing: a Revision of Bloom's Taxonomy of Educational Objectives / L.W. Anderson, D.R. Krathwohl; Editors L.W. Anderson, D.R. Krathwohl, P.W. Airasian [et al.] - New York: Longman, 2001. - 352 с.

113. Automatically Recognizing Facial Expression: Predicting Engagement and Frustration / J.F. Grafsgaard, J.B. Wiggins, Kr.El. Boyer [et al.] // In Proceedings of the 6th International Conference on Educational Data Mining (EDM 2013), 2013. - P. 43-50.

114. Ayala, B.R. A machine learning approach to evaluating translation quality / B.R. Ayala, J. Chen // Proceedings of the 17th ACM/IEEE Joint Conference on Digital Libraries (JCDL'17), Piscataway, 2017. - IEEE Press. - P. 281-282.

115. Baker, R. The state of educational data mining in 2009: A review and future visions / R. Baker, K. Yacef // Journal of Educational Data Mining. - 2009. - V. 1. - № 1. - P. 3-17.

116. Dickey, D. Teaching Data Mining in a University Environment / D. Dickey // SAS Users Group International 30 (SAS SUGI 30) proceedings, Philadelphia, Pennsylvania, April 10-13, 2005. - 11 p.

117. Educational Data Mining Course [Электронный ресурс] // Helsinki.fi: веб-сайт университета Хельсинки. URL: https://courses.helsinki.fi/en/data20007/124845599 (дата обращения: 09.02.2022).

118. Elghazaly, T. Political Sentiment Analysis Using Twitter Data / T. Elghazaly, A. Mahmoud, H.A. Hefny // Proceedings of the International Conference on Internet of things and Cloud Computing (ICC'16), New York, 2016. - ACM. - P. 1-5.

119. Gannod, G.C. Using the inverted classroom to teach software engineering / G.C. Gannod, J.E. Burge, M.T. Helmick // In Proceedings of 2008 ACM/IEEE 30th International Conference on Software Engineering. - Leipzig, Germany: ACM Digital Library. - P. 777-786.

120. Giudici, P. Applied Data Mining for Business and Industry. 2-nd Edition. / P. Giudici, S. Figini. - John Wiley & Sons, 2009. - 264 p.

121. Guo, P.J. How video production affects student engagement: An empirical study of MOOC videos / P.J. Guo, J. Kim, R. Rubin // In Proceedings of the 1st ACM conference on Learning @ Scale (L@S 2014), 4-5 March 2014, Atlanta, Georgia, USA. - New York: ACM. - P. 41-50.

122. Hajizadeh, N. Analysis of factors that affect students' academic performance - Data Mining Approach / N. Hajizadeh, M. Ahmadzadeh // International Journal of advanced studies in Computer Science and Engineering. - 2014. - V. 3. - I. 8. - 4 p.

123. Han, J. Data Mining: Concepts and Techniques, 2nd edition / J. Han, M. Kamber. - The Morgan Kaufmann Series in Data Management Systems, 2006. - 743 p.

124. Karabulut-Ilgu, A. A systematic review of research on the flipped learning method in engineering education / A. Karabulut-Ilgu, N. Jaramillo Cherrez, C.T. Jahren // British Journal of Educational Technology. - 2018 - V. 49 (3). - P. 398-411.

125. Krathwohl, D.R. A Revision of Bloom's Taxonomy: An Overview / D.R. Krathwohl // Theory Into Practice. - 2002. - V. 41 (4). - P. 212-218.

126. Learning Analytics Courses [Электронный ресурс] // Ts.columbia.edu: сайт педагогического колледжа Колумбийского университета. URL: https://www.tc.columbia.edu/human-development/learning-analytics/courses/ (дата обращения: 09.02.2022).

127. Maiorana, F. A teaching experience on a data mining module / F. Maiorana // Proceedings of the Federated Conference on Computer Science and Information Systems (FedCSIS), 2012. - P. 871-874.

128. Margoniner, V. Learning gains in introductory astronomy: Online can be as good as face-to-face / V. Margoniner // The Physics Teacher. - 2014. - V. 52. - P. 298301.

129. Master of science in learning analytics [Электронный ресурс] // Ts.columbia.edu: сайт педагогического колледжа Колумбийского университета. URL: https://www.tc.columbia.edu/human-development/learning-analytics/degrees--requirements/learning-analytics-ms/ (дата обращения: 9.02.2022).

130. Rahal, I. Undergraduate research experiences in data mining / I. Rahal // Proceedings of the 39th ACM technical symposium on Computer science education, SIGCSE, 2008. - Portland, OR, United States. - 2008. - P. 461-465.

131. Romero, C. Educational Data Mining: A Review of the State of the Art / C. Romero, S. Ventura // IEEE Transactions on Systems Man and Cybernetics. Part C (Applications and Reviews). - 2010. - V. 40 - № 6. - P. 601-618.

132. Ryan S. Baker courses [Электронный ресурс] // upenn.edu: веб-сайт университета Пенсильвании. URL: http: //www.upenn.edu/learninganalytics/ryanbaker/teaching.html (дата обращения: 09.02.2022).

133. Sakha'a, Al M. Improve Teaching Method of Data Mining Course / Al M. Sakha'a, A. Malibari // International Journal of Modern Education and Computer Science. - 2012. - № 2. - P. 15-22.

134. Saquer, J. A data mining course for computer science and non-computer science students / J. Saquer // Journal of Computing Sciences in Colleges. - 2007. - V. 22. - № 4. - P. 109-114.

135. Shute, V.J. Measuring and Supporting Learning in Games: Stealth Assessment / V.J. Shute, M. Ventura. - London, Cambridge: The MIT Press, 2013. - 89 p.

136. Talbert, R. Inverting the Linear Algebra classroom / R. Talbert // PRIMUS: Problems, Resources, and Issues in Mathematics Undergraduate Studies. - 2014. - V. 24. - P. 361-374.

137. Tan, P.N. Introduction to data mining / P.N. Tan, M. Steinbach, V. Kumar. - Boston: Pearson Addison Wesley, 2006. - 792 p.

138. Taxonomy of Educational Objectives, Handbook I: Cognitive Domain / B.S. Bloom, M.D. Englehart, E.J. Furst [et al.]. - New York: Longman, 1956. - 230 p.

139. Top 10 algorithms in data mining / X. Wu, V. Kumar, J.R. Quinlan [et al.] // Knowledge and Information Systems. - 2007. - V. 14 (1). - P. 1-37.

140. Understanding in-video dropouts and interaction peaks in online lecture videos / J. Kim, P.J. Guo, D.T. Seaton [et al.] // In Proceedings of the 1st ACM

conference on Learning @ Scale (L@S 2014), 4-5 March 2014, Atlanta, Georgia, USA. - New York: ACM. - P. 31-40.

141. Xiaobing, J. Teaching Quality Monitoring of Higher Education Based on Data Mining / J. Xiaobing // Advances in Social Science, Education and Humanities Research (ASSEHR): proceedings on International Conference on Sports, Arts, Education and Management Engineering (SAEME), 2018. - V. 199. - P. 498-505.

142. Zainuddin, Z. Flipped Classroom Research and Trends from Different Fields of Study / Z. Zainuddin, S. Halili // The International Review of Research in Open and Distributed Learning. - 2016. - V. 17 (3). - P. 313-340.

ПРИЛОЖЕНИЯ

Приложение 1.

Итоговая анкета

Был ли практикум ИАД для Вас полезен?

- да

- нет

Был ли практикум ИАД для Вас интересен?

-да -нет

Является ли форма подачи материала для Вас доступной?

-да -нет

-частично

Было ли Вам интересно работать с Вашими данными в рамках домашних заданий?

- да

- нет, слишком простые

- нет, слишком сложные

- нет, было бы интересней работать с данными из своей профессиональной области -ваш вариант:

Что Вам понравилось в курсе, показалось особенно интересным?

Что для Вас оказалось сложным:

непонятным:

неинтересным:

Что Вам категорически не понравилось и почему?

В рамках курса мне бы хотелось изучить/рассмотреть подробнее (можно выбирать несколько вариантов ответа):

- практикоориентированные примеры и задачи

- тезаурус понятий курса

- используемые в курсе алгоритмы

- другие алгоритмы ИАД

- другие программы для ИАД

- познавательная загрузка была достаточной

- ваш вариант:_

Я думаю, что мне могут пригодиться полученные знания

- да

- нет

Я планирую изучать данный предмет дальше самостоятельно

- да

- нет

- при необходимости в дальнейшей профессиональной деятельности -ваш вариант:_

Знаете ли Вы что одним из видов деятельности, к которому готовится каждый выпускник ВУЗа в соответствие с государственными образовательным стандартами, является педагогическая деятельность?

- да

- нет

Было бы Вам интересно узнать о применении ИАД в образовании (в педагогике)?

- да, было бы интересно, хотя преподавать не планирую.

- да, было бы интересно, т. к. не исключаю, что буду работать в сфере образования.

- нет, т. к. собираюсь работать в других областях.

- нет.

Таблица A - Учебные пособия по ИAД за период 2000-2008 гг.

Книга/ пособие Содержание

Корнеев В.В. и др., Базы данных. Интеллектуальная обработка информации, 2000. 1. Базы данных в фактографических системах 2. Системы обработки транзакций 3. Принцип построения систем, ориентированных на анализ данных 4. Документальные системы 5. Семантическое моделирование в базах данных 6. Системы, основанные на знаниях 7. Нейросетевые системы 8. Генетические алгоритмы 9. Нечеткая логика и ее применение в экспертных системах 10. Параллельные базы данных.

Дюк В., Самойленко А., Data Mining, учебный курс, Спб, 2001. 1. Общие представления о Data Mining 2. Современные методы анализа данных 3. Нейросетевое представление неизвестных знаний и закономерностей 4. Эволюционные алгоритмы 5. Обнаружение логических закономерностей в данных 6. Примеры

Кричевский М.Л., Интеллектуальный анализ данных в менеджменте, СПбГУАП, 2005. 1. Искусственные нейронные сети 2. Нечеткая логика 3. Генетические алгоритмы

Чубукова И.А. Data Mining, 2008. 1. Методы, стадии, задачи, сферы применения Data Mining 2. Методы классификации и прогнозирования (деревья решений, метод опорных векторов, метод ближайшего соседа, байесовская классификация, нейронные сети) 3. Методы кластерного анализа (иерархические методы, итеративные методы) 4. Методы поиска ассоциативных правил 5. Методы визуализации 6. Комплексный подход к внедрению Data Mining, OLAP и хранилищ данных в СППР 7. Процесс Data Mining (начальные этапы, очистка данных, построение и использование модели) 8. Стандарты Data Mining 9. Инструменты DM (SAS Enterprise Miner, PolyAnalyst, Cognos, STATISTICA Data Miner, Oracle Data Mining, Deductor, KXEN)

Технология Data Mining: Интеллектуальный анализ данных, Степанов Р.Г., КГУ им. В.И.Ульянова-Ленина, 2008 1. Введение 2. Элементы теории информации 3. Классификация с обучением 4. Поиск ассоциативных правил 5. Кластерный анализ 6. Введение в теорию нечетких множеств

Таблица Б - Ученые пособия по ИЛД за период 2009-2012 гг.

Книга/ пособие Содержание

Баргесян А.А. и др., Анализ данных и процессов: учеб. пособие, 3 изд., 2009. 1. Системы поддержки принятия решений (15-29) 2. Хранилище данных (29-50) 3. OLAP-системы (50-68) 4. Интеллектуальный анализ данных (68-102) 5. Классификация и регрессия (102-140) 6. Поиск ассоциативных правил (140-159) 7. Кластеризация (159-192) 8. Визуальный анализ данных (192-211) 9. Анализ текстовой информации (211-242) 10. Стандарты Data Mining (242-271) 11. Библиотека Xelopes (271-303) 12. Распределенный анализ данных (303-325) 13. Data Mining в реальном времени (325-350) 14. Извлечение знаний из Web - Web Mining (350-382) 15. Средства анализа процессов - Process Mining (382-439)

Практикум по анализу данных на компьютере, Кацко И.А., Паклин Н.Б., 2009. 1. Статистический анализ данных (методы стат. анализа, практические занятия по темам: знакомство с системой Statistica, Дисперсионный анализ, Регрессионный анализ, Ковариационный анализ, Кластерный и дискриминантный анализ, Факторный анализ, Анализ временных рядов) 2. Интеллектуальный анализ данных (Методы ИАД, практические занятия по темам: Аналитическая платформа Deductor, Многомерные отчеты и OLAP, Искусственные нейронные сети, Логическая регрессия и деревья решений в задаче кредитного скоринга, Ассоциативные правила)

Нестеров С.А., Базы данных. Интеллектуальный анализ данных: учеб. пособие, СПб, 2011, 271 с. 1. Основы интеллектуального анализа данных (7-22) 2. Краткий обзор алгоритмов интеллектуального анализа данных (22-46) 3. Основные конструкции языка DMX (46-86) 4. Особенности использования встроенных алгоритмов интеллектуального анализа СУБД MS SQL SERVER 2008 (86111) 5. Лабораторные работы (111-260)

Интеллектуальный анализ данных, Г.Ю. Чернышова, СГСЭУ, 2012 1. Основы интеллектуального анализа данных (1-17) 2. Методы интеллектуального анализа данных (17-71) 3. Процесс применения интеллектуальных технологий (71 -90)

Сотник С.Л., Шумейко А.А. , Интеллектуальный анализ данных, учеб. пособие, 2012 1. Базовая информация (лин. алгебра и теор. вер) (7-20) 2. Метод наименьших квадратов (20-32) 3. Метод главных компонент (32-46) 4. Мягкие вычисления в обработке данных (в т.ч. эволюционные вычисления) 5. Методы кластеризации (96-112) 6. классификаторы (112-143) 7. использование генетических алгоритмов для построения векторного классификатора (143-152) 8. метод опорных векторов (152-161) 9. визуализация многомерных данных (161-175) 10. рекомендующие системы (175-200)

Таблица В - Учебные пособия по ИAД за период 2013-2019 гг.

Книга/ пособие Содержание

Технология интеллектуального анализа данных, С.В.Афанасьева, НИУ "Высшая школа информатики", 2013 1. Основные понятия интеллектуального анализа данных (916) 2. Технология интеллектуального анализа данных (16-22) 3. Aлгоритмы интеллектуального анализа данных (22-28) 4. Средства анализа таблиц для Excel (28-67) 5. Клиент интеллектуального анализа данных для Excel (67150)

Интеллектуальный анализ данных, Яцков Н.Н., БГУ, 2014 1. Введение в интеллектуальный анализ данных (4-12) 2. Статистические методы (12-57) 3. Методы классификации (57-74) 4. Нейронные сети (74-84) 5. Кластерный анализ (84-102) 6. Aссоциативные правила (102-111) 7. Стохастические методы поиска (111-121) 8. Методы визуализации данных (121 -131) 9. Процесс интеллектуального анализа данных (131-140) 10. Стандарты и рынок инструментов интеллектуального анализа данных (140-149)

Классификация, регрессия и другие алгоритмы Data Mining с использованием R, Шитиков В.К., Мастицкий С.Э., 2017, 351 c. 1. Реализация моделей Data Mining в среде R 2. Статистические модели: критерии и методы их оценивания 3. Пакет CARET - инструмент построения статистических моделей в R 4. Построение регрессионных моделей различного типа 5. Бинарные матрицы и ассоциативные правила 6. Бинарные классификаторы с различными разделяющими поверхностями 7. Модели классификации для нескольких классов 8. Моделирование порядковых и счетных переменных 9. Методы многомерной ординации 10. Кластерный анализ 11. RATTLE: графический интерфейс R для реализации алгоритмов Data Mining

Интеллектуальный анализ данных. Алгоритмы Data Mining, Герасименко Е.М., 2017, 84 с. 1. Кластеризация. Лабораторная работа: построение модели кластеризации в Orange 2. Web mining и Text mining. Лабораторная работа: тональный анализ текста в Orange 3. Классификация. Лабораторная работа: построение модели классификации. Сравнение различных алгоритмов классификации и выбор оптимального в Orange 4. Рекомендации. Коллаборативная фильтрация. Лабораторная работа: алгоритм slope one, сравнение результатов работы алгоритмов коллаборативной фильтрации в Orange.

Методы интеллектуального анализа данных, Рыбанов А.А., Вологодский государственный технический университет, 2017, 62 с. Многомерные базы данных (многомерная модель данных, определение и основные понятия OLAP, сравнение систем MOLAP и ROLAP Пример разработки структуры многомерного представления финансовой информации в виде куба данных

Окончание таблицы В

Книга/ пособие Содержание

Интеллектуальный анализ данных, Кузнецов С.Ю. и др., Волгоградский государственный технический университет, 2019, 92 с. 1. Интеллектуальный анализ данных: цели, задачи, основные этапы 2. Статистические методы анализа 3. Анализ временных рядов 4. Основы нейросетевых технологий 5. Основы кластерного анализа 6. Основы социометрического анализа

Лекция по теме «Классификация» для первой итерации обучения интеллектуальному анализу данных

Классификаторы в Weka - это модели для прогнозирования номинальных (категориальных) или численных величин. Точнее, это некоторые алгоритмы, выдающие на выходе такие модели.

Задача прогнозирования численной переменной (атрибута) называется задачей регрессии, задача прогнозирования номинальной переменной (атрибута) -задачей классификации.

Атрибут, предсказание которого нас интересует, будем называть атрибутом класса в задаче классификации и прогнозируемым атрибутом в задаче линейной регрессии.

Например, пусть имеются данные о стоимости квартир в рублях в зависимости от площади, района и числа комнат. Хотим предсказать возможную стоимость (в руб.) продажи квартир клиентов, которые обратились к агенту по недвижимости. Это задача регрессии, т. к. предсказываем численную переменную - стоимость квартиры.

Площадь (м. кв.) Район Число комнат Стоимость (млн. руб.)

64 1 2 3,7

128 1 5 8,2

79,5 2 3 9,0

47 1 1 ?

67 2 2 ?

Пусть есть данные о клиентах банка, такие как размер заработной платы, наличие машины, число детей, кредитная история

(положительная/отрицательная). Хотим предсказать, можно ли новому клиенту

одобрить заявку на кредит. Т. е. по сути хотим предсказать значение атрибута "кредитная история", который имеет два значения: положительная, отрицательная. Поэтому, это задача классификации. Этапы классификации:

Разделение известных данных на два подмножества (обозначим их как обучающий набор и тестовый набор).

Известные данные - данные с известным значением атрибута (например, данные

об уже имеющихся клиентах с их кредитной историей).

Обучающий набор также иногда называется тренировочным набором.

- Построение модели классификатора на основе первого подмножества (обучение модели).

Проверка модели на основе второго подмножества. Классификация новых данных на основе модели.

+

+

+

+

Обучающий набор +

+ и

+

+

+

+

+

+

Тестовый набор +

+ 1

+

+

9

9

Набордля

классификации 9

9

построение -т/ (обучение) модели

проверка -К. (тестирование) модели

классификация объектов на основе модели

Алгоритмы классификации (классификаторы) можно разделить на:

- Ленивые - в процессе обучения ничего не делают, только сохраняют тренировочные данные (обучающий набор). Начинают классификацию только тогда, когда появляются новые немаркированные данные;

- Активные - создают классификационную модель в процессе обучения. Когда вводятся новые данные, такой классификатор «скармливает»

данные классификационной модели. Новые данные классификатор подает на вход построенной модели и получает класс объекта на выходе.

В Weka все классификаторы разбиты на следующие группы: байесовские, на основе функций, ленивые, усиленные, различные другие, на основе правил и на основе деревьев.

Примеры простейших классификаторов.

Простые алгоритмы часто работают очень хорошо. Нужно пробовать простые вещи перед тем, как пробовать сложные. Это связано с тем, что существует много видов простых структур данных:

✓ когда один атрибут делает всю работу (т. е. только один атрибут из всех на самом деле влияет на значения атрибута класса);

✓ атрибуты вкладывают (влияют) одинаково и независимо;

✓ результаты зависят от линейной комбинации атрибутов;

✓ и другие;

Для подобных данных могут хорошо сработать простые алгоритмы. Приведем примеры таких алгоритмов:

Классификатор ZeroR просто ищет самый популярный класс и предсказывает его все время. Все новые объекты классифицируются как принадлежащие самому популярному классу. Это очень простой и тривиальный классификатор. Если большинство клиентов в примере с банковскими данными имеют кредитную историю - "положительная", то и новый клиент будет отнесен к этому классу.

Алгоритм OneR показывает хорошие результаты прогнозирования, когда в данных один атрибут делает всю работу. Можно сказать, что алгоритм обучает 1-уровневое дерево решений. Алгоритм делает следующее:

для каждого атрибута

для каждого значения атрибута делать правило следующим образом: подсчитать как часто каждый класс появляется,

найти наиболее частый класс, присвоить этот класс этому значению атрибута вычислить частоту ошибок для этого правила выбрать атрибут с наименьшей частотой ошибок.

Таким образом, мы выбираем некоторый атрибут сперва и делаем одну ветвь для каждого возможного значения атрибута. Каждой ветви присваивается самый частый класс, который встречается для объектов с соответствующим значением атрибута. Частота ошибок — это доля экземпляров, которые не принадлежат частому классу их соответствующей ветви. Выбираем атрибут с наименьшей частотой ошибок.

Попробуйте выполнить алгоритм OneR для данных, содержащих информацию о погодных данных и статусе игры. Атрибутом класса является атрибут Play, который показывает, состоялась ли игра при данных погодных условиях:

Оutlook Temp Humidity Wind Play

sunny hot high false no

sunny hot high true no

overcast hot high false yes

rainy mild high false yes

rainy cool normal false yes

rainy cool normal true no

overcast cool normal true yes

sunny mild high false no

sunny cool normal false yes

rainy mild normal false yes

sunny mild normal true yes

overcast mild high true yes

overcast hot normal false yes

rainy mild high true no

Ниже подсказка с подсчетами:

Атрибут Правило Ошибка Суммарная ошибка

Outlook Sunny ^ No 2/5 4/14

Overcast ^ Yes 0/4

Rainy ^ Yes 2/5

Temp Hot ^ No 2/4 5/14

Mild ^ Yes 2/6

Cool ^ Yes 1/4

Humidity High ^ No 3/7 4/14

Normal ^ Yes 1/7

Wind False ^ Yes 2/8 5/14

True ^ No 3/6

В ходе выполнения алгоритм OneR выберет атрибут с наименьшей частотой ошибок - Outlook (так же можно выбрать Humidity, поскольку у них одинаковые показатели ошибки). При классификации нового объекта (например, Outlook-'Rainy", Temp = "Mild", Humidity="High", Wind = "False", Play = ??) алгоритм будет смотреть только на значение атрибута Outlook - в нашем случае оно равно Rainy и в соответствие с таблицей выше отнесет объект к классу Yes.

Пример разработанной презентации по теме «Классификация» для первой

итерации курса

Этапы классификации

Метки данных: "+" - класс известен, "?" - класс не известен

+

+

+

Облчаюший набор + [-

+

+

+

+

+

+

Тестовый набор +

+ [_

+

+

?

Набор для

классификации

построение -т/ (обучение)

проверка (тестирование)

МП71РТТН

классификация объектов на основе модели

Классификаторы

Ленивые - в процессе обучения ничего не делают, только сохраняют данные.

Активные - создают классификационную модель в процессе обучения. Новые данные классификатор подает на вход построенной модели и получает класс объекта на выходе.

Наивный байесовский классификатор

Предполагает, что все атрибуты независимы, т.е. значение одного атрибута не влияет на значение другого

на практике почти не бывает таких данных, отсюда и приставка "Наивный" В основе лежит теорема Байеса:

P(c|d) = P(d|c)*P(c)/P(d)

Р (Class А | atrl, atr2,..., atrn) = Р (atrl I Class A) * P (atr21 Class A) *... P (atrn | Class A) •P(ClassA) / P(atrl) *....* P(atrn)

Наивный байесовский классификатор. Пример.

• Данные bank-data.attr

• Weka -> classifiers -> NaiveBayes

Результат:

• Точность классификации 65,5%

• Статистика Каппа 0,2956

Ленивые классификаторы. Алгоритм к ближайших соседей

Задача: определить к какому классу относится новый объект.

Алгоритм: kNN (k-Nearest Neighbors/ к ближайших соседей)

Этапы алгоритма:

• Поиск к ближайших объектов (соседей) из уже известных. Для определения близости двух объектов используются различные метрики.

• Определение класса объекта на основе классов соседей

- определяем новый объект к классу, к которому относятся большинство соседей

- Каждому соседу задаем некоторый вес. Считаем, что ближайшие соседи имеют больший вес.

Алгоритм К ближайших соседей. Пример.

• Данные bank-data.attr

• Weka -> classifiers -> lazy-> Ibk

• Параметры:

— KNN - число используемых ближайших соседей

- distanceWeighting- позволяет задавать веса соседям, чем ближе сосед-тем больший вес

Результат (KNN = 2, distanceWeighting = по.., test cross-validation 10 folds):

• Точность классификации 57,2%

Результат (KNN = 5, distanceWeighting = по.., test cross-validation 10 folds):

• Точность классификации 65,1667%

Усиленные классификаторы

Составной классификатор- это набор классификаторов, чьи индивидуальные предсказания объединяются некоторым образом, чтобы классифицировать новые объекты.

Алгоритм Ас1аВоо$1

На каждой итерации алгоритм:

- отбирает часть тренировочных данных

- Строит простой классификатор

- Проверяетточностькаждого классификатора и выбирает наилучший из них

- Лучшему классификатору присваивается вес и он включается в ансамбль

- Данные, которые классифицированы неверно, приобретают больший вес

Алгоритм Ас1аВоо51. Пример.

Запустить алгоритм несколько раз с различным числом итераций: питКегайопБ = 1, 5, 10,15, 25. Сравнить точность алгоритма классификации в зависимости от числа итераций

Алгоритм J48. Пример.

Данные bank-data.attr

Weka -> classifiers -> trees->J48

Большинство параметров алгоритма - для

фазы сокращения дерева

Классы классификации - значения атрибута

pep (т.е. да/нет)

Точность классификации (при значниях параметров по умолчанию и тестировании модели на обучающем наборе) = 92.3333%

Классификация новых объектов

1. Загрузить новые данные на вкладке препроцессинг

2. Выбрать "Supplied test set" в окне Test sets и указать путь к файлу с новыми данными

3. Выбрать More options -> output predictions-> CSV (выводить предсказания класса в формате csv)

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.