Top.Mail.Ru

Научно-технический журнал

«Автоматизация и информатизация ТЭК»

ISSN 2782-604X

Особенности анализа данных при построении модели прогноза объема выпуска конечного продукта на химическом производстве

УДК: 004.896+517.977.58
DOI: -

Авторы:

КОЧУЕВА О.Н.1,
НИКИТИН К.М.2,
ВЕРХОЛОМОВ А.В.2,
МОНАХОВ А.А.1
1 РГУ нефти и газа (НИУ) имени И.М. Губкина, Москва, Россия
2 Цифровые технологии и платформы, Москва, Россия

Ключевые слова: прогнозирование, химическое производство, корреляционный анализ, Lasso-регрессия, отбор значимых признаков, методы машинного обучения

Аннотация:

Статья посвящена исследованию особенностей построения моделей на основе методов машинного обучения для прогнозирования выхода конечного продукта при промышленном производстве азотной кислоты. Предлагаемый подход может быть применен для построения моделей, основанных на собранном объеме реальных данных, для различных производственных процессов. Проведение активного эксперимента в производственных условиях для идентификации таких моделей не требуется, что позволяет получить значительный экономический эффект. При построении моделей на основе алгоритмов машинного обучения учитываются особенности конфигурации оборудования на конкретном предприятии, определяется время реакции системы на управляющие воздействия. Авторами предлагается процедура определения временного интервала между изменением входных параметров и соответствующей реакцией целевой переменной. Процедура основана на применении Lasso-регрессии, ее результат подтверждается анализом важности признаков при построении модели с помощью алгоритма Random Forest.

Список литературы:

1. Ильин А.П., Кунин А.В., Ильин А.А. Производство азотной кислоты: учеб. пособие. – Иваново: Ивановский гос. хим.-технолог. ун-т, 2011. – 269 с.
2. Нурутдинов Н.Н., Гершкович Ю.Б. Методика идентификации динамических моделей с переменным транспортным запаздыванием // Автоматизация и информатизация ТЭК. – 2023. – № 6(599). – С. 22–29. – DOI: 10.33285/2782-604X-2023-6(599)-22-29
3. Работников М.А., Шумихин А.Г. Алгоритмы упреждающего управления с применением адаптивной динамической модели процесса // Химия. Экология. Урбанистика. – 2023. – Т. 3. – С. 281–284.
4. Амирханов И.Р., Калеева Е.С., Фатун Д.А. Система оптимизации в реальном времени: методы и реализация // Автоматизация и информатизация ТЭК. – 2023. – № 2(595). – С. 13–19. – DOI: 10.33285/2782-604X-2023-2(595)-13-19
5. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. Data Mining, Inference, and Prediction. – 2nd Edition. – New York, NY: Springer, 2009. – 767 p. – DOI: 10.1007/978-0-387-84858-7
6. Ladha L., Deepa T. Feature Selection Methods and Algorithms // Int. J. on Computer Science and Engineering. – 2011. – Vol. 3, No. 5. – P. 1787–1797.
7. Sorzano C.O.S., Vargas J., Montano A.P. A survey of dimensionality reduction techniques. – 2014. – DOI: 10.48550/arXiv.1403.2877
8. Tibshirani R. Regression shrinkage and selection via the LASSO // J. of the Royal Statistical Society. Series B (Methodological). – 1996. – Vol. 58, Issue 1. – P. 267–288. – DOI: 10.1111/j.2517-6161.1996.tb02080.x
9. Киселева В.А., Кузин А.А., Шульпина П.Д. Отбор признаков в машинном обучении // Телекоммуникации и информ. технологии. – 2023. – Т. 10, № 2. – С. 21–29.
10. Методика выбора входных признаков для алгоритмов машинного обучения / В.В. Тагунов, К.Я. Кудрявцев, А.И. Петрова, Т.И. Возненко // Вестн. Нац. исслед. ядерного ун-та "МИФИ". – 2022. – Т. 11, № 1. – С. 51–58. – DOI: 10.56304/S2304487X22010114
11. Breiman L. Random forests // Machine learning. – 2001. – Vol. 45, Issue 1. – P. 5–32. – DOI: 10.1023/A:1010933404324
12. Kochueva O., Akhmetzianov R. Surrogate Models for the Compressibility Factor of Natural Gas // Distributed Computer and Communication Networks: Control, Computation, Communications: 26th Int. Conf., DCCN 2023, Moscow, Sept. 25–29, 2023. – Cham: Springer, 2024. – P. 516–526. – DOI: 10.1007/978-3-031-50482-2_40