Определение достоверности информационных данных, получаемых с датчиков технологического объекта
УДК: 004.04
DOI: -
Авторы:
КРАВЧЕНКО Д.А.
1
1 Газпром добыча Уренгой, Новый Уренгой, Россия
Ключевые слова: достоверные данные, элемент с особым предельным состоянием, статистические и методы машинного обучения, методы Local Outlier Factor и Silhouette Score, метод Gradient Boosting Regression Tree, метод F1-score
Аннотация:
Определение достоверности информационных данных, получаемых с датчиков технологического объекта, возможно с помощью различных методов. Метод Local Outlier Factor (LOF) относится к статистическим. Он базируется на анализе локальной плотности информационных элементов, что позволяет обнаруживать достоверные/недостоверные данные, основываясь на их относительной плотности. Следует отметить важную процедуру метода, которая заключается в усреднении расстояния от информационного элемента до каждого его k-ближайшего соседа. Значение k обозначает, какое число соседей учитывается. Правильный выбор k необходим для оценки принадлежности информационного элемента к области достоверных/недостоверных данных. Для автоматизации процесса обнаружения достоверных/недостоверных данных предлагается модифицировать метод LOF, а именно добавить поиск оптимального значения k. Расчет оптимального значения k проводится с помощью методов Silhouette Score, Gradient Boosting Regression Tree, F1-score. Для этого разрабатывается модель на основе численных методов, которая вычисляет оптимальные значения k для LOF. Для каждого этапа исследования выполнен анализ и даны соответствующие рекомендации по выбору k. Показаны достоинства и недостатки модифицированного метода LOF.
Список литературы:
1. The Cambridge History of Ancient China: From the Origins of Civilization to 221 BC / Edited by M. Loewe, E.L. Shaughnessy. – Cambridge University Press, 1999. – XXIX, 1148 p.
2. Лепеш Г.В. Индустриализация для всех отраслей экономики // Технико-технологические проблемы сервиса. – 2011. – № 3(17). – С. 3–5.
3. Корякин А.Ю. Комплексные решения задач разработки и эксплуатации скважин Уренгойского добывающего комплекса. – М.: РГУ нефти и газа (НИУ) им. И.М. Губкина, 2016. – 272 с.
4. Кравченко Д.А. Прогнозирование состояния объектов газопромысловой технологии // Автоматизация, телемеханизация и связь в нефтяной пром-сти. – 2021. – № 8(577). – С. 20–35. – DOI: 10.33285/0132-2222-2021-8(577)-20-35
5. Смирнов С.П. Метод оценки достоверности результатов оценки видов и последствий отказов (FMEA) сложных технических систем на основе анализа коммуникаций, осуществленных в процессе идентификации рисков // E-Scio. – 2022. – № 6(69). – С. 533–538.
6. Samariya D., Thakkar A. A Comprehensive Survey of Anomaly Detection Algorithms // Annals of Data Science. – 2023. – Vol. 10, Issue 3. – P. 829–850. – DOI: 10.1007/s40745-021-00362-9
7. Applied Cloud Deep Semantic Recognition: Advanced Anomaly Detection / Edited by M. Roopaei, P. Najafirad (P. Rad). – New York: Auerbach Publications, 2018. – 202 p.