Семинар «Анализ методов выявления искусственно сгенерированных текстов»
16 декабря в 16:30 по московскому времени
Институт прикладной математики и телекоммуникаций проводит семинар «Анализ методов выявления искусственно сгенерированных текстов».
Лектор
Сергей Сергеевич Волков — аспирант кафедры информационных технологий РУДН.
Современные модели генерации текстов показывают достаточно хорошие результаты в ряде задач, связанных с написанием небольших текстовых фрагментов. Результаты применения данных моделей могут быть использованы в том числе с целью создания большого количества фейковой информации (новости, рецензии, отзывы, и т. п.). В связи с этим, возникает необходимость разработки алгоритмов, способных отличать тексты, написанные человеком, от автоматически сгенерированных.
Данный доклад посвящен исследованию методов машинного обучения в решении задач генерации текстов, а также анализу методов, способных выявлять искусственно синтезированные тексты. Рассматриваются существующие подходы к генерации текстов и варианты их практического применения. Приводится разбор существующих наборов данных для анализа эффективности работы методов выявления искусственно синтезированных текстов. Также рассматривается подход к созданию собственного набора данных для решения данной задачи.