Математики РУДН и Свободного университета Берлина предложили новый способ использования нейронных сетей для работы с зашумленными данными больших размерностей

Математики РУДН и Свободного университета Берлина предложили новый способ использования нейронных сетей для работы с зашумленными данными больших размерностей

Математики РУДН и Свободного университета г. Берлина предложили новый подход к изучению распределений вероятностей наблюдаемых данных с помощью искусственных нейронных сетей. Новый подход лучше взаимодействует с так называемыми выбросами — с теми объектами входных данных, которые значительно выделяются из общей выборки.

Восстановление распределения вероятностей наблюдаемых данных искусственными нейронными сетями — это наиболее важная часть машинного обучения. Распределение вероятностей не только позволяет прогнозировать поведение исследуемой системы, но и количественно оценить неопределенность, с которой делаются прогнозы. Главная трудность заключается в том, что, как правило, наблюдаются лишь сами данные, но их вероятностные распределения в точном виде не доступны. Для решения этой проблемы используют байесовские и близкие к ним приближенные методы. Но их использование увеличивает сложность нейронной сети и соответственно ее обучения.

Математики РУДН и Свободного университета г. Берлина использовали детерминированные веса для нейронных сетей, а выходами сетей закодировали распределения латентных переменных для искомого маргинального (частного) распределения. Анализ динамики обучения таких сетей позволил им получить формулу, которая корректно оценивает дисперсию распределения наблюдаемых данных, несмотря на наличие в данных выбросов. Предложенную модель проверили на разных данных: синтетических и реальных. Новый метод позволяет восстанавливать распределения вероятностей с более высокой точностью по сравнению с другими современными методами. Точность оценивалась по методу AUC (area under the curve — это площадь под графиком, который позволяет оценить среднеквадратичную ошибку предсказаний в зависимости от размера выборки, оцененной сетью как «надежная»; чем выше оценка AUC, тем качественнее предсказания).

Статья опубликована в журнале Artificial Intelligence.

Новости
Все новости
Наука
16 января
В РУДН обсудили, как научная дипломатия поможет сохранить диалог в Арктике

Ежегодное заседание Международного экспертного совета по сотрудничеству в Арктике состоялось в стенах РУДН. Более 100 участников обсудили вопрос актуальности «Научной дипломатии как инструмента сохранения диалога в Арктике».

Наука
6 декабря 2024
Счастливое материнство: нерешенные проблемы акушерства, гинекологии и перинатологии обсудили на семинаре в РУДН

Около 200 участников из России и 20 стран мира встретились на Всероссийском междисциплинарном научном семинаре с международным участием «Право в медицине. Медицина в праве: точки соприкосновения». Тема — «Счастливое материнство: нерешенные проблемы акушерства, гинекологии и перинатологии».

Наука
5 декабря 2024
Реформатор здравоохранения: 150 лет со дня рождения Николая Семашко

Почему люди стали уделять внимание гигиене? Зачем появилась диспансеризация? Кто сделал медицинскую помощь общедоступной и бесплатной? Все эти вопросы напрямую связаны с Николаем Семашко, выдающимся руководителем здравоохранения, создателем отделения санитарного просвещения, педагогом, врачом и ученым в области социальной гигиены.