Научная работа: темы и направления для студентов 3 курса МФТИ (2020 год)

Разработка методов и алгоритмов фильтрации данных в задачах анализа здоровья населения

Научный руководитель к.ф.-м.н., доцент Руднев С.Г., комната 715, email: rdnv2019@yandex.ru

Благодаря развитию медицинских информационных систем и автоматизации сбора данных в настоящее время накоплены большие объёмы данных, характеризующих здоровье населения России и риски развития хронических неинфекционных заболеваний. Повышение качества таких данных является необходимым условием формирования объективной картины здоровья населения и оценки эффективности принимаемых мер контроля. Здравоохранение является ведущей статьёй бюджетных расходов в большинстве стран мира и потому – привлекательной сферой для мошенничества. Анализ массовых данных инструментальных измерений в российских центрах здоровья в 2010-2015 году выявил высокий уровень неоднородности качества данных и высокий процент сфальсифицированных данных (с выполнением принципа Парето) [1,2,3]рис. 1.

Студентам в рамках научно-исследовательской работы предлагается разработать эффективные методы и алгоритмы фильтрации данных профилактического скрининга населения России (по данным центров здоровья за 2010-2020 гг.), сравнить эффективность индивидуальных и групповых методов фильтрации, методов машинного обучения. Полученные результаты будут использованы при разработке автоматизированной системы динамического мониторинга качества данных и борьбы с мошенничеством в сфере здравоохранения.

 

Рис. 1. Динамика процентной доли “выбросов” (outliers) и фальсификатов данных (fraud cases) в базе данных импедансометрии центров здоровья по годам обследования и федеральным округам России [3]. Общий размер выборки 2,29 млн человек.

 


Научная работа: темы и направления в 2020 году