Психолингвистические исследования медийного дискурса с использованием методов машинного интеллекта
Психолингвистические аспекты потенциально опасного медийного дискурса
В рамках данного направления учёные РУДН формируют типологии потенциально опасных дискурсов, приёмов манипулятивного воздействия, целевых аудиторий воздействия и их психоэмоциональных реакций, а также выявляют связанные с ними лингвистические маркеры. Отличие от большинства аналогичных исследований в том, что формируемые типологии изначально ориентированы на накопление больших массивов медийных текстов, размещаемых на краудсорсинговых платформах, и их дальнейшую компьютерную обработку. Конечным результатом являются открытые наборы данных для построения моделей машинного интеллекта, способных автоматически оценивать типы и степень опасности медийного дискурса. Данная задача существенно расширяет проблематику обнаружения фейковых новостей (fake news detection) и поэтому становится такой трудной. Создание открытых данных и соревнований по таким задачам способствует консолидации научного сообщества, росту престижа коллектива-инициатора и образованию новых научных фронтиров.
Методы и технологии компьютерной лингвистики и искусственного интеллекта в исследованиях медийного дискурса
Ученые РУДН разрабатывают модели и технологии автоматической обработки текстов. Основное внимание уделяется современным методам обучения нейронных сетей для автоматической разметки текстов. Используются также и классические методы компьютерной лингвистики для решения таких стандартных подзадач, как выделение именованных сущностей, синтаксический парсинг, выявление семантических ролей, отношений и фактов, анализ тональности, тематическое моделирование.
Отличие от большинства аналогичных исследований в том, что построение математических моделей для классификации медийного дискурса требует активного междисциплинарного взаимодействия специалистов в области психолингвистики, политической лингвистики, компьютерной лингвистики и машинного обучения. Конечный результат – создание свободно доступных программных средств, способных автоматически оценивать типы и степень опасности медийного дискурса.