Применение машинного обучения на основе типа личности пользователя для задач профилирования пользователей социальных сетей и рекомендации контента тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Ян Ци

  • Ян Ци
  • кандидат науккандидат наук
  • 2023, ФГАОУ ВО «Национальный исследовательский университет ИТМО»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 172
Ян Ци. Применение машинного обучения на основе типа личности пользователя для задач профилирования пользователей социальных сетей и рекомендации контента: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГАОУ ВО «Национальный исследовательский университет ИТМО». 2023. 172 с.

Оглавление диссертации кандидат наук Ян Ци

Table of contents

Реферат

Synopsis

CHAPTER 1. Introduction

1.1 Background

1.2 Thesis structure

CHAPTER 2. Literature Overview

2.1 Individual Personality

2.2 Automated Personality Profiling

2.3 Personality-Driven Applications

2.3.1 Personalized Recommender Systems

2.3.2 Personality-Driven Personalized Recommender Systems

2.3.3 Personality-Driven Content Generation

2.4 Datasets For Personality-Driven Applications

2.5 Summary

CHAPTER 3. Data Gathering Framework and Feature Extraction

3.1 MSMMP: Multi-Source Multimodal Personality Dataset

3.1.1 Data Acquisition

3.1.2 Data Representation

3.2 MMREC dataset

3.2.1 Data Acquisition

3.2.2 Data Representation

3.3 Summary

CHAPTER 4. Individual User Personality Profiling

4.1 PERS framework

4.1.1 Problem Definition

4.1.2 Structure of PERS Framework

4.1.3 Base Classifiers

4.2 Evaluation

4.2.1 Baselines

4.2.2 Evaluation Metrics

4.2.3 Evaluation Across MBTI Categories

4.2.4 Evaluation Across Different Modalities

4.2.5 Evaluation Across Different Sources

4.3 Summary

CHAPTER 5. Multimodal Personality-Driven Content

Recommendation

5.1 PersiC Model

5.1.1 Proposed Method

5.1.2 Loss Function and Optimization

5.2 Experimental Evaluation

5.2.1 Quality Metrics

5.2.2 Baselines

5.2.3 Evaluation Results

5.2.4 Ablation Study and The Influence of Personality Traits

5.3 Summary

CHAPTER 6. Evaluation in Real-World Industrial Environment

6.1 Real World Evaluation of The PersiC Model

6.2 Summary

CHAPTER 7. Conclusions And Future Work

7.1 Conclusions

7.2 Limitations and Future Work

7.3 Personality-Driven Content Generation Platform

Bibliography

List of abbreviations

List of graphic materials

List of Figures

List of Tables

Appendix A. Publications

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Применение машинного обучения на основе типа личности пользователя для задач профилирования пользователей социальных сетей и рекомендации контента»

Общая характеристика диссертации

Актуальность темы и мотивация. Личностные качества человека являются ключевыми факторами, лежащими в основе принятия решений, которые ежедневно влияют на жизненный путь каждого человека. Определение личностных черт, например типа личности Майерс-Бриггс, а также понимание зависимостей между личностными чертами и поведением пользователей на различных платформах социальных сетей имеет в наше время огромное значение как для академических исследований в этой области, так и для практических приложений. Появление разнообразных и универсальных социальных сетей позволяет автоматически и эффективно выполнять профилирование личности пользователя на основе данных, представленных в различных формах и модальностях.

Применение автоматического профилирования личности на основе данных пользователей из социальных сетей может оказать существенное влияние на общество. Например, считается, что работа приносит больше удовольствия и пользы и для самого человека, и для общества, если существует соответствие между личностью и родом занятий. Понимание личностных качеств может оказаться полезным для задач управления персоналом, чтобы правильно подобрать должности и содержание работы для каждого кандидата [1]. Анализ поведения, представленного на платформах социальных сетей, может послужить ключом к пониманию состояния психического здоровья людей [2]; это позволяет вмешиваться на ранних стадиях потенциальных психических заболеваний [3].

Помимо воздействия на общество, автоматическое профилирование личности также может быть полезным для применения в промышленной среде,

например для персонализированных онлайн-сервисов. Чтобы увеличить свои доходы от рекламы, глобальные платформы для закупки медиа, например Facebook Ads, постоянно сокращают охват брендированных органических сообщений, заставляя бренды и цифровые медиа-агентства постоянно увеличивать медиа-бюджеты, расходуемые на цифровую рекламу [4]. Этот растущий масштаб деятельности по покупке медиа [5] вызывает быстрый спрос на технологии проверки контента и производства [6,7], которые могли бы облегчить бремя, возлагаемое на маркетинговые команды, когда дело доходит до крупных проектов, масштабное создание контента и A/B-тестирование. Чтобы эффективно использовать органический и платный маркетинг в социальных сетях, необходимо понимать аудиторию и адаптировать контент в соответствии с ее интересами и онлайн-поведением, что невозможно сделать вручную в больших масштабах.

В то же время, различные схемы категоризации типов личности — такие, как, опять же, индикатор типа личности Майерс-Бриггс — позволяют выявить зависимости между личностными чертами и предпочтениями пользовательского контента в более широком масштабе путем категоризации поведения аудитории тем или иным унифицированным и структурированным способом, что приводит к повышению производительности различных приложений, в частности персонализированных рекомендаций контента.

Тем не менее, в настоящее время имеющиеся результаты в области автоматического профилирования личности на основе мультимодальных данных социальных сетей, полученных из нескольких источников, относительно редки, и уровень влияния различных данных, доступных в социальных сетях, на качество предсказаний полученных из них моделей машинного обучения еще предстоит всесторонне оценить. Кроме того, уровень влияния различных личностных черт на точность контентных рекомендаций до сих пор широко не использовался и всесторонне не оценивался. Еще более того, у исследовательского сообщества нет наборов данных, которые могли бы служить ориентиром и стимулировать дальнейшие исследования в этой области. В настоящей диссертации предлагаются подходы к решению этих проблем.

Степень разработанности темы исследования. Хотя теория моделирования личностных черт была создана давно, работы по автоматическому профилированию личности стали появляться только в начале 2000-х годов, в частности в первом крупномасштабном проекте по сбору таких данных MyPersonality [8], который вскоре стал основой для более масштабных исследований профилирования личностных черт в социальных сетях [9-11].

На сегодня уже разработано много систем, предназначенных для автоматического профилирования личностных черт пользователей на основе текстового содержания их публикаций на одной из платформ социальных сетей. В частности, работы в рамках подхода LIWC (Linguistic Inquiry and Word Count) в основном сосредоточены на обработке текста и прогнозировании черт личности с использованием словесных категорий [12,13], в то время как работы [14,15] вместо этого используют предварительно обученные вложения GloVe для текстовых данных [16]; они первыми представили результаты унимодального предсказания черт личности на основе машинного обучения. Тем временем, с развитием обработки мультимедийных данных другие модальности, например изображения, геолокация или эмоции, стали использоваться для определения личностных качеств пользователей [17-19]. Хотя такие исследования совершили существенные продвижения в этой области, большинство из них по-прежнему были сосредоточены на одном источнике данных или одной их модальности.

Однако в настоящее время социальные сети демонстрируют тенденцию к многоцелевому развитию, и контент на платформах социальных сетей не состоит исключительно из текстов, а имеет несколько модальностей: изображения, видео, отметки местоположения и т.д. По сравнению с унимодальным контентом, мультимодальный контент более полно раскрывает информацию о психологическом и физическом состоянии пользователя. Несколько исследований были посвящены профилированию пользователей на основе мультимодальных данных. Например, в работе [20] была предложена модель мультимодального ансамбля для решения проблемы демографического профилирования на основе мультимодальных данных; эта работа позже была расширена для использования данных датчиков и многозадачного обучения из нескольких источников для

профилирования состояния здоровья пользователя [21]. Далее, в работе [22] был предложен метод факторизации для моделирования внутримодальных и интермодальных отношений в мультимодальных входных данных. Хотя мультимодальные данные уже рассматривались в этих работах, во всех них по-прежнему отсутствует обработка данных из нескольких источников в разных социальных сетях, что ограничивает их применимость в большинстве реальных сценариев.

Кроме того, хотя уже показано, что личностные черты коррелируют с моделями поведения людей, существуют лишь считанные исследования по интеграции личностных черт в персонализированные системы, в частности системы контентных рекомендаций. Влияние личности на предпочтения пользователей в отношении разнообразия рекомендаций впервые было исследовано в работах [23,24]. Разнообразие относится к рекомендации пользователям разнообразного набора объектов, чтобы они могли более эффективно находить неожиданные для себя, но высоко оцениваемые объекты. Подходы, связанные с разнообразием, обычно используют фиксированную стратегию для корректировки степени разнообразия в рамках набора рекомендаций, что, однако, не учитывает, что разные пользователи могут иметь разное отношение к разнообразию объектов.

В настоящее время использование мультимодальных пользовательских данных из нескольких источников для профилирования личностных качеств пользователей развито слабо, что тормозит развитие научной области в целом и интеграцию существующих разработок в коммерческие продукты в частности.

Целью исследования является разработка новых методов и подходов для автоматического профилирования личностных качеств пользователей на основе их мультимодальных следов в социальных сетях и повышения эффективности персонализированных рекомендаций контента с учетом автоматически оцениваемых личностных характеристик.

Для достижения данной цели в рамках диссертации были поставлены и решены следующие научные задачи.

1. Анализ области исследования и аналитический обзор современных методов и подходов к профилированию личности, персонализированным рекомендациям контента, а также сбору и представлению мультимодаль-ных наборов данных, собранных из нескольких источников.

2. Исследование и анализ современных методов машинного обучения, классификация и оценка эффективности полученных результатов для мультимодальной классификации данных из нескольких источников и рекомендации персонализированного контента.

3. Проектирование и подготовка экспериментальной среды, включая сбор мультимодального набора данных следов пользователя в социальных сетях на основе нескольких источников и подготовку соответствующих прототипов программного обеспечения.

4. Исследование и разработка методов мультимодального слияния цифровых следов пользователей на платформах социальных сетей для профилирования личностных качеств пользователя.

5. Исследование и разработка методов объединения представления личности пользователя и его цифрового следа для предоставления персонализированных рекомендаций контента.

6. Крупномасштабное экспериментальное исследование и качественная и количественная оценка эффективности уни- и мультимодальных методов автоматического профилирования личности и рекомендаций персонализированного контента, основанного на личностных чертах пользователя, и его применение в индустрии цифровой рекламы.

Объектом исследования диссертации являются паттерны поведения пользователей, представленные в социальных сетях.

Предметом исследования диссертации являются методы извлечения и представления мультимодальных признаков, автоматического профилирования черт личности человека и повышения эффективности рекомендации персонализированного контента по чертам личности.

Методы исследования. Для решения поставленных задач использовался широкий класс методов, в том числе модели и методы системного анализа,

теория искусственного интеллекта, методы семантического анализа данных, методы математической статистики, методы разработки программного обеспечения и обслуживания программных систем.

Научная новизна диссертации отражена в следующих пунктах.

1. Разработан новый подход к сбору данных, который позволяет получать крупномасштабные мультимодальные данные из нескольких источников, размеченные данными о личностных чертах пользователя, чтобы уменьшить систематическую ошибку, вызванную недостатком данных и проблемой единственного источника.

2. Разработан новый двухэтапный ансамблевый подход к профилированию личности; при помощи этого метода было экспериментально показано, что возможно надёжно и точно автоматически предсказать личностные черты пользователя на основе большого мультимодального датасета, собранного из нескольких источников.

3. Разработана новая рекомендательная система на основе контента; было экспериментально продемонстрировано, что автоматически выведенные личностные черты пользователя могут быть использованы для улучшения контентных рекомендаций в социальных сетях.

4. Был проведен качественный и количественный анализ, продемонстрировавший различия в предпочтениях потребления контента пользователями с разными личностными чертами на основе данных социальных сетей.

Практическое значение. Во-первых, предлагаемые методы были реализованы в реальном приложении, и были проведены эксперименты с предлагаемыми методами в промышленной среде. Эксперименты доказали эффективность разработанных методов для повышения эффективности цифровой рекламы в социальных сетях и производительности персонализированных рекомендаций по контенту. Кроме того, собранный набор данных стал еще одним важным индикатором для оценки эффективности профилирования личности и рекомендаций по контенту. Этот набор данных может быть использован для других исследований в будущем.

Результаты, вынесенные на защиту.

1. Новые подходы к сбору данных из нескольких социальных сетей, позволяющие собирать крупномасштабные мультимодальные данные, размеченные чертами личности пользователей и их контентными предпочтениями из нескольких социальных сетей.

2. Новый двухэтапный ансамблевый подход к профилированию личности на основе больших мультимодальных данных, собранных из нескольких источников, и анализ влияния личностных черт пользователей и типа платформы социальной сети на качество автоматического профилирования черт личности пользователей.

3. Новый метод контентных рекомендаций, использующий черты личности пользователей для рекомендаций контента в социальных сетях, и анализ эффективности введения признаков черт личности пользователей в рекомендательных системах.

Надежность и валидность полученных результатов обеспечиваются правильным обоснованием постановки задачи, точной формулировкой критериев оценки и доказательностью оценок, а также подтверждаются результатами вычислительных экспериментов по использованию методов и алгоритмов, предложенных в диссертации. Полученные результаты согласуются с результатами, полученными в промышленных условиях.

Соответствие паспорту специальности. Диссертация выполнена в соответствии с паспортом научной специальности высшей аттестационной комиссии Российской Федерации «1.2.1 — искусственный интеллект и машинное обучение» согласно пунктам "2. Исследования в области оценки качества и эффективности алгоритмических и программных решений для систем искусственного интеллекта и машинного обучения. Методики сравнения и выбора алгоритмических и программных решений при многих критериях", "4. Разработка методов, алгоритмов и создание систем искусственного интеллекта и машинного обучения для обработки и анализа текстов на естественном языке, для изображений, речи, биомедицины и других специальных видов данных", "13. Методы и средства формирования массивов данных и прецедентов, включая «большие данные», необходимых для решения задач искусственно-

го интеллекта и машинного обучения. Проблемно-ориентированные коллекции данных для важных прикладных областей."

Внедрение результатов исследования. Результаты диссертационной работы были использованы при выполнении работы по бюджетной теме «Выполнение передовых исследований и разработок в области сильных алгоритмов искусственного интеллекта».

Апробация результатов исследования. Результаты работы были представлены на ряде конференций, в том числе на следующих: 30-я Международная конференция ACM по мультимедиа (MM 2022), 14-я Международная конференция ACM по веб-поиску и интеллектуальному анализу данных (WSDM 2021), 2-й семинар по интеллектуальному анализу и поиску перекрестных данных в ICMR (ICDAR 2021), Конференция AAAI по искусственному интеллекту (AAAI'20).

Публикации. Основные результаты настоящей диссертации представлены в шести публикациях. Четыре из них опубликованы в материалах конференций, индексируемых Scopus и Web of Science.

Публикации на международных конференциях, индексируемых Scopus и Web of Science:

1. Yang Q., Farseev A., Nikolenko S., Filchenkov A. Do we behave differently on Twitter and Facebook: Multi-view social network user personality profiling for content recommendation // Frontiers in Big Data - 2022, Vol.5.

2. Farseev A., Yang Q., Filchenkov A., Lepikhin K., Chu-Farseeva Y., Loo D. SoMin.ai: Personality-Driven Content Generation Platform // 14th ACM International Conference on Web Search and Data Mining, WSDM 2021 -2021, pp. 890-893.

3. Yang Q., Farseev A., Filchenkov A. Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia for Human Personality Profiling // ICDAR 2021 - Proceedings of the 2nd Workshop on Intelligent Cross-Data Analysis and Retrieval - 2021, pp. 39-47.

4. Yang Q., Farseev A., Filchenkov A. I Know Where You Are Coming From: On the Impact of Social Media Sources on AI Model Performance // AAAI Conference on Artificial Intelligence - 2020, Vol. 34, pp. 13971-13972.

Публикации в других журналах:

5. Ян Ц. Cross-source multi-view learning for personality profiling // Сборник трудов X Конгресса молодых ученых (Санкт-Петербург, 14-17 апреля 2021 г.) - 2021. - Т. 2. - С. 280-283.

6. Ян Ц. Towards Multi-View Multi-Source Learning from Social Multimedia for Human Personality Profiling // Альманах научных работ молодых ученых Университета ИТМО - 2021. - Т. 3. - С. 235-240.

Личный вклад автора. Автор разработал, внедрил и доказал эффективность личностно ориентированного мультимодального обучения для профилирования пользователей и рекомендаций по контенту, которое включает в себя: методологию сбора мультимодальных данных из нескольких источников, методологию мультимодального представления данных, методологию мультимодального объединения данных; профилирование личности и модели контентных рекомендаций, ориентированные на черты личности пользователей. Основные результаты по теме диссертации представлены в 6 публикациях, 4 статьи проиндексированы в базах данных Scopus и Web Of Science.

Александр Фарсеев во всех работах, выполненных в соавторстве, обеспечивал общее руководство исследованиями, давал рекомендации по разработке моделей и методов, а также давал советы при написании статей.

Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения и списка литературы. Общий объем диссертации составляет 129 страниц, включая библиографию из 159 названий.

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Заключение диссертации по теме «Другие cпециальности», Ян Ци

Заключение

Целью настоящего диссертационного исследования была разработка новых методов и моделей для автоматического профилирования личностных качеств пользователей на основе их мультимодальных следов в социальных сетях и повышения эффективности персонализированных рекомендаций контента с учетом автоматически выводимых личностных характеристик.

В рамках данной диссертационной работы были получены следующие основные теоретические и практические результаты:

— новые подходы к сбору данных из нескольких социальных сетей, позволяющие собирать крупномасштабные мультимодальные данные, размеченные чертами личности пользователей и их контентными предпочтениями из нескольких социальных сетей;

— новый двухэтапный ансамблевый подход к профилированию личности на основе больших мультимодальных данных, собранных из нескольких источников, и анализ влияния личностных черт пользователей и типа платформы социальной сети на качество автоматического профилирования черт личности пользователей;

— новая контентная рекомендательная система, использующая черты личности пользователей для рекомендаций контента в социальных сетях, и анализ эффективности введения признаков черт личности пользователей в рекомендательных системах;

— экспериментальное исследование на реальных данных в промышленной среде, показавшее эффективность и практичность внедрения автоматического профилирования черт личности пользователей в индустрии маркетинга в социальных сетях.

Благодарности

В заключение хочу выразить искреннюю благодарность и признательность моему научному руководителю, профессору Александру Фарсееву, чьи предложения и поддержка помогли мне проникнуть в невиданные джунгли исследований. Учиться под его руководством и наблюдением было большой привилегией и радостью. Кроме того, для меня было большой честью наблюдать его личность и усердие, которыми я буду дорожить всю свою жизнь. Моя благодарность ему не знает границ.

Также хочу выразить искреннюю благодарность профессору Сергею Нико-ленко за бескорыстную помощь. Я также чрезвычайно благодарен всем моим друзьям и коллегам, которые любезно оказали мне помощь и поддержку в ходе работы над этой диссертацией.

Кроме того, я благодарен всем тем, кто посвятил свое время чтению этой диссертации и дал мне много полезных советов, которые пригодятся мне в моих дальнейших исследованиях.

И последнее, но от того ничуть не менее важное: я хочу выразить благодарность любви всей моей жизни Чжан Минь за ее любовь, большое внимание и безоговорочное доверие ко мне на протяжении всех этих лет.

Список литературы диссертационного исследования кандидат наук Ян Ци, 2023 год

References

Amirhosseini, M. H., and Kazemian, H. (2020). Machine learning approach to personality type prediction based on the myers-briggs type indicator®. Multimodal Technol. Interact. 4,9. doi: 10.3390/mti4010009

Argamon, S., Dhawle, S., Koppel, M., and Pennebaker, J. W. (2005). "Lexical predictors of personality type," in Proceedings of the Joint Annual Meeting of the Interface and the Classification Society of North America.

Arnoux, P.-H., Xu, A., Boyette, N., Mahmud, J., Akkiraju, R., and Sinha, V. (2017). "25 tweets to know you: a new model to predict personality with social media," in Proceedings of the International AAAI Conference on Web and Social Media (Montreal, QC).

Bell, R., Koren, Y., and Volinsky, C. (2007). "Modeling relationships at multiple scales to improve accuracy of large recommender systems," in Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (San Jose, CA), 95-104.

Breiman, L. (2001). Random forests. Mach. Learn. 45, 5-32. doi: 10.1023/A:1010933404324

Buraya, K., Farseev, A., and Filchenkov, A. (2018). "Multi-view personality profiling based on longitudinal data," in International Conference of the Cross-Language Evaluation Forum for European Languages (Avignon: Springer), 15-27.

Buraya, K., Farseev, A., Filchenkov, A., and Chua, T.-S. (2017). "Towards user personality profiling from multiple social networks," in Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 31 (San Francisco, CA).

Cai, Y., Li, X., Wu, L., and Li, Q. (2022). "Knowledge-graph-aware recommendation in movie domain," in Proceedings of 2021 Chinese Intelligent Automation Conference, ed Z. Deng (Singapore: Springer Singapore), 211-218.

Chen, T., and Guestrin, C. (2016). "Xgboost: a scalable tree boosting system," in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD '16 (New York, NY; Association for Computing Machinery), 785-794.

Daneshvar, S., and Inkpen, D. (2018). "Gender identification in Twitter using N-grams and LSA: notebook for PAN at CLEF 2018," in CEUR Workshop Proceedings, Vol. 2125.

Debra, L., and Worthington, P. (2003). Exploring the relationship between listening style preference and personality. Int. /. Listen. 17, 68-87. doi: 10.1080/10904018.2003.10499056

Deng, J., Dong, W., Socher, R., Li, L.-J., Li, K., and Fei-Fei, L. (2009). "ImageNet: a large-scale hierarchical image database," in CVPR09 (Miami, FL).

Dhelim, S., Aung, N., Bouras, M. A., Ning, H., and Cambria, E. (2021). A survey on personality-aware recommendation systems. CoRR, abs/2101.12153. doi: 10.1007/s 10462-021-10063-7

Digman, J. M. (1990). Personality structure: emergence of the five-factor model. Annu. Rev. Psychol. 41,417-440. doi: 10.1146/annurev.ps.41.020190.002221

Dumais, S. T. (2004). Latent semantic analysis. Ann. Rev. Inf. Sci. Technolo. 38, 188-230. doi: 10.1002/aris. 1440380105

Dunn, P. G., de Ruyter, B., and Bouwhuis, D. G. (2012). Toward a better understanding of the relation between music preference, listening behavior, and personality. Psychol. Music 40,411-428. doi: 10.1177/0305735610388897

Farseev, A. (2017). 360° user profile learning from multiple social networks for wellness and urban mobility applications (Ph.D. thesis). National University of Singapore (Singapore).

Farseev, A., and Chua, T.-S. (2017a). Tweet can be fit: Integrating data from wearable sensors and multiple social networks for wellness profile learning. ACM Trans. Inf. Syst. 35,1-34. doi: 10.1145/3086676

Farseev, A., and Chua, T.-S. (2017b). "Tweetfit: Fusing multiple social media and sensor data for wellness profile learning," in Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence. AAAI (San Francisco, CA).

Farseev, A., Chu-Farseeva, Y.-Y., Qi, Y., and Loo, D. B. (2020a). Understanding economic and health factors impacting the spread of COVID-19 disease. medRxiv. doi: 10.2196/preprints. 19386

Farseev, A., Lepikhin, K., Schwartz, H., Ang, E. K., andPowar, K. (2018). "Somin. ai: social multimedia influencer discovery marketplace," in Proceedings of the 26th ACM International Conference on Multimedia (Seoul), 1234-1236.

Farseev, A., Nie, L., Akbari, M., and Chua, T.-S. (2015). "Harvesting multiple sources for user profile learning: a big data study," in Proceedings of the 5th ACM on International Conference on Multimedia Retrieval (Shanghai: ACM), 235-242.

Farseev, A., Samborskii, I., and Chua, T.-S. (2016). "bbridge: a big data platform for social multimedia analytics," in Proceedings of the 24rd ACM international conference on Multimedia (Amsterdam: ACM).

Farseev, A., Samborskii, I., Filchenkov, A., and Chua, T.-S. (2017). "Cross-domain recommendation via clustering on multi-layer graphs," in Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval (ACM), 195-204.

Farseev, A., Yang, Q., Filchenkov, A., Lepikhin, K., Chu-Farseeva, Y.-Y., and Loo, D.-B. (2020b). "Somin.ai: personality-driven content generation platform," in WSDM '21: Proceedings of the 14th ACM International Conference on Web Search and Data Mining.

Gao, C., Li, Y., Feng, F., Chen, X., Zhao, K., He, X., et al. (2021). Cross-domain recommendation with bridge-item embeddings. ACM Trans. Knowl. Discov. Data 16,1-23. doi: 10.1145/3447683

Gao, R., Hao, B., Bai, S., Li, L., Li, A., and Zhu, T. (2013). "Improving user profile with personality traits predicted from social media content," in Proceedings of the 7th ACM Conference on Recommender Systems (Hong Kong), 355-358.

Gelli, F., Uricchio, T., He, X., Del Bimbo, A., and Chua, T.-S. (2018). "Beyond the product: discovering image posts for brands in social media," in Proceedings of the 26th ACM International Conference on Multimedia, MM '18 (New York, NY: Association for Computing Machinery), 465-473.

Gil de Zuniga, H., Diehl, T., Huber, B., and Liu, J. (2017). Personality traits and social media use in 20 countries: how personality relates to frequency of social media use, social media news use, and social media use for social interaction. Cyberpsychol. Behav. Soc. Network. 20,540-552. doi: 10.1089/cyber.2017.0295

Gjurkovic, M., and Snajder, J. (2018). "Reddit: a gold mine for personality prediction," in Proceedings of the Second Workshop on Computational Modeling of People's Opinions, Personality, and Emotions in Social Media (New Orleans, LA: Association for Computational Linguistics), 87-97.

Halko, N., Martinsson, P. G., and Tropp, J. A. (2011). Finding structure with randomness: Probabilistic algorithms for constructing approximate matrix decompositions. SIAMRev. 53,217-288. doi: 10.1137/090771806

He, K., Zhang, X., Ren, S., and Sun, J. (2016). "Deep residual learning for image recognition," in 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (Las Vegas, NV: IEEE), 770-778.

He, X., Deng, K., Wang, X., Li, Y., Zhang, Y., and Wang, M. (2020). "LightGCN: simplifying and powering graph convolution network for recommendation," in Proceedings of the 43rd International ACM SIGIR conference on research and development in Information Retrieval, 639-648.

He, Z., Zhao, H., Lin, Z., Wang, Z., Kale, A., and Mcauley, J. (2021). Locker: Locally Constrained Self-Attentive Sequential Recommendation. New York, NY: Association for Computing Machinery.

Ho, T. K. (1998). The random sub space method for constructing decision forests. IEEE Trans. Pattern Anal. Mack Intell. 20,832-844. doi: 10.1109/34.709601

Holtgräves, T. (2011). Text messaging, personality, and the social context. J. Res. Pers. 45, 92-99. doi: 10.1016/j.jip.2010.11.015

Jolliffe, I. (2011). Principal Component Analysis. Berlin; Heidelberg: Springer Berlin Heidelberg.

Jolliffe, I. T., and Cadima, J. (2016). Principal component analysis: a review and recent developments. Philos. Trans. R. Soc. A 374, 20150202-20150202. doi: 10.1098/rsta.2015.0202

Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., et al. (2017). "Lightgbm: a highly efficient gradient boosting decision tree," in Advances in Neural Information Processing Systems, Vol. 30, eds I. Guyon, U. V. Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, and R. Garnett (Long Beach, CA: Curran Associates, Inc.).

Khan, A. S., Ahmad, H., Asghar, M. Z., Saddozai, F. K, Arif, A., and Khalid, H. A. (2020). Personality classification from online text using machine learning approach. Int. J. Adv. Comput. Sci. Appl. 11, 358. doi: 10.14569/1JACSA.2020.0110358

Kim, D., and Suh, B. (2019). "Enhancing vaes for collaborative filtering: flexible priors gating mechanisms," in Proceedings of the 13th ACM Conference on Recommender Systems (Copenhagen), 403-407.

Koren, Y., and Bell, R. M. (2011). "Advances in collaborative filtering," in Recommender Systems Handbook, eds F. Ricci, L. Rokach, B. Shapira, and P. B. Kantor (New York, NY: Springer), 145-186.

Kosinski, M., Matz, S., Gosling, S., Popov, V., and Stillwell, D. (2015). Facebook as a research tool for the social sciences. Am. Psychol. 70, 543-556. doi: 10.1037/a0039210

Kumar, K. N. P., and Gavrilova, M. L. (2019). "Personality traits classification on twitter," in 2019 16th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS) (Taipei: IEEE), 1-8.

Lee, K, Maji, S., Ravichandran, A., and Soatto, S. (2019). "Meta-learning with different iable convex optimization," in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (Long Beach, CA: IEEE), 10657-10665.

Liang, D., Krishnan, R. G., Hoffman, M. D., and Jebara, T. (2018). "Variational autoencoders for collaborative filtering," in Proceedings of the 2018 World Wide Web Conference (Lyon), 689-698.

Lobel, S., Li, C., Gao, J., and Carin, L. (2019). "Ract: toward amortized ranking-critical training for collaborative filtering," in International Conference on Learning Rep resen tatio ns.

Lu, H.-P., and Hsiao, K.-L. (2010). The influence of extro/introversion on the intention to pay for social networking sites. Inf Manag. 47, 150-157. doi: 10.1016/j.im.2010.01.003

Mairesse, F., Walker, M. A., Mehl, M. R., and Moore, R. K. (2007). Using linguistic cues for the automatic recognition of personality in conversation and text.}. Artif. Int. Res. 30,457-500. doi: 10.1613/jair.2349

Mao, K, Zhu, J., Xiao, X., Lu, B., Wang, Z., and He, X. (2021). "Ultragcn: ultra simplification of graph convolutional networks for recommendation," in Proceedings of the 30th ACM International Conference on Information Knowledge Management (Queensland, QLD), 1253-1262.

Martin, C. (1997). Looking at Type: The Fundamentals. Gainesville: Center for Application of Psychological Type. Inc.

Matthews, B. (1975). Comparison of the predicted and observed secondary structure of t4 phage lysozyme. Biochim. Biophys. Acta 405, 442-451. doi: 10.1016/0005-2795(75)90109-9

MIN. (2022). Daily Social Media Usage Worldwide. Stat ist a. Available online at: https:// www. stat ist a. com/st at ist ics/433871 /da ily- so c ial - media - usage - wo rldwide

Mirvakhabova, L., Frolov, E., Khrulkov, V., Oseledets, I., and Tuzhilin, A. (2020). "Performance of hyperbolic geometry models on top-n recommendation tasks," in Fourteenth ACM Conference on Recommender Systems, 527-532.

Mnih, A., and Salakhutdinov, R. R. (2007). "Probabilistic matrix factorization," in Advances in Neural Information Processing Systems 20 (NIPS 2007) (Vancouver).

Murray, J. B. (1990). Review of research on the myers-briggs type indicator. Percept. Motor Sfa'Ss 70(3_Suppl.), 1187-1202. doi: 10.2466/pms.l990.70.3c.ll87

Myers, I. (1998). MBTI Manual: A Guide to the Development and Use of the Myers-Briggs Type Indicator. Consulting Psychologists Press.

Nguyen, D. Q., Vu, T., and Nguyen, A. T. (2020). "BERTweet: a pre-trained language model for English Tweets," in Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: System Demonstrations, 9-14.

Pennebaker, J., and King, L. (1999). Linguistic styles: language use as an individual difference. J. Pers. Soc. Psychol 77, 1296-1312. doi: 10.1037/0022-3514.77.6.1296

Pennington, J., Socher, R., and Manning, C. D. (2014). "Glove: global vectors for word representation," in Empirical Methods in Natural Language Processing (EMNLP) (Doha), 1532-1543.

PIN. (2022). Global Pinterest User Distribution by Gender 2022. Statista. Available online at: https://www.statista.com/statistics/248168/gender-distr ibut io n- of- p interest - users

Qi, Y., Aleksandr, F., and Andrey, F. (2020). I know where you are coming from: on the impact of social media sources on ai model performance (student abstract). Proc. AAAI Conf. Artif. Intett. 34,13971-13972. doi: 10.1609/aaai.v34il0.7258

Rangel Pardo, F., Montes-y-Gomez, M., Potthast, M., and Stein, B. (2018). "Overview of the 6th author profiling task at PAN 2018," in CLEF 2018 Evaluation Labs and Workshop (Avignon) (CEUR-WS.org).

Rangel, F., Rosso, P., Potthast, M., Stein, B., and Daelemans, W. (2015). "Overview of the 3rd author profiling task at pan 2015, in CLEF.

Sedhain, S., Menon, A. K, Sanner, S., and Xie, L. (2015). "Autorec: autoencoders meet collaborative filtering," in Proceedings of the 24th international conference on World Wide Web (Florence), 111-112.

Shen, Y., Wu, Y., Zhang, Y., Shan, C., Zhang, J., Letaief, B. K, et al. (2021). "How powerful is graph convolution for recommendation?" in Proceedings of the 30th ACM International Conference on Information Knowledge Management (Queensland, QLD), 1619-1629.

Shenbin, I., Alekseev, A., Tutubalina, E, Malykh, V., andNikolenko, S. I. (2020). "Recvae: a new variational autoencoder for top-n recommendations with implicit feedback," in Proceedings of the 13th International Conference on Web Search and Data Mining (Houston), 528-536.

Sumner, C., Byers, A., Boochever, R., and Park, G. J. (2012). "Predicting dark triad personality traits from twitter usage and a linguistic analysis of tweets," in

2012 11th International Conference on Machine Learning and Applications, Vol. 2 (Florida, FL), 386-393.

Syn, S. Y., and Oh, S. (2015). Why do social network site users share information on facebook and twitter? /. Inf. Sci. 41, 553-569. doi: 10.1177/016555151558 5717

Tadesse, M. M., Lin, H., Xu, B., and Yang, L. (2018). Personality predictions based on user behavior on the facebook social media platform. IEEE Access 6, 61959-61969. doi: 10.1109/ACCESS.2018.2876502

Tandera, T., Hendro, Suhartono, D., Wongso, R., and Prasetio, Y. L. (2017). Personality prediction system from facebook users. Procedia Comput. Sci. 116, 604-611. doi: 10.1016/j.procs.2017.10.016

Tanjim, M. M., Su, C., Benjamin, E, Hu, D., Hong, L., and McAuley, J. (2020). Attentive Sequential Models of Latent Intent for Next Item Recommendation.. New York, NY: Association for Computing Machinery.

Tsai, Y. H., Liang, P. P., Zadeh, A., Morency, L., and Salakhutdinov, R. (2019). "Learning factorized multimodal representations," in 7th International Conference on Learning Representations, ICLR 2019 (New Orleans, LA: OpenReview.net).

TWI. (2022). Twitter, Facebook, orInstagram? Which Platform(s) You Should Be On. Available online at: https://blog.hubspot.com/marketing/twitter-vs-facebook

Wang, X., He, X., Wang, M., Feng, F., and Chua, T.-S. (2019). "Neural graph collaborative filtering," in Proceedings of the 42nd international ACM SIGIR conference on Research and development in Information Retrieval (Paris), 165-174.

Wu, Y., DuBois, C., Zheng, A. X., and Ester, M. (2016). "Collaborative denoising auto-encoders for top-n recommender systems," in Proceedings of the Ninth ACM International Conference on Web Search and Data Mining (San Francisco, CA), 153-162.

Zhang, F., Yuan, N. J., Lian, D., Xie, X., and Ma, W.-Y. (2016). "Collaborative knowledge base embedding for recommender systems," in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD '16 (New York, NY: Association for Computing Machinery), 353-362.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.