Научно-технический журнал

«Автоматизация и информатизация ТЭК»

ISSN 2782-604X

Автоматизация и информатизация ТЭК
Применение алгоритмов обработки естественного языка для автоматической классификации буровых операций

УДК: 681.5:622.24
DOI: 10.33285/2782-604X-2022-8(589)-35-42

Авторы:

ДЖАФАРОВ РЕНАТ ФАРХАДОВИЧ1,
ДАДАШЕВ МИРАЛИ НУРАЛИЕВИЧ2
1 Газпром ЭП Интернэшнл Б.В, Санкт-Петербург, Россия
2 РГУ нефти и газа (НИУ) имени И.М. Губкина, Москва, Россия

Ключевые слова: строительство скважины, математическая модель, коэффициент корреляции, рекуррентные нейронные сети, буровые операции, автоматизация

Аннотация:

Каждая операция, выполняемая в процессе строительства скважины, классифицируется в соответствии со стандартом, принятым в компании-заказчика. Определение категорий буровых операций необходимо, в частности, для выявления недочетов в исходном плане работ и их корректировки при строительстве последующих скважин, что в конечном счете требуется для правильного распределения бюджета компании. Однако существенную роль в данном случае играет человеческий фактор. Часто одну и ту же операцию специалисты классифицируют по-разному. В статье приведена математическая модель на основе рекуррентной нейронной сети типа LSTM, которая автоматически относит операции к той или иной категории, исходя из их свободного текстового описания. Подобный подход позволяет полностью исключить субъективность мнений, а также значительно сократить время на заполнение суточных отчетов для буровых супервайзеров непосредственно на месторождениях. Применимость модели была оценена с помощью статистических показателей, в том числе коэффициентов корреляции Мэтью (0,88), каппа Коэна (0,88) и ROC-AUC (0,95), что демонстрирует высокую точность.

Список литературы:

1. Сведения о строительстве скважин на нефть и газ (форма N 1-ТЭК (бур)). – 2021. – URL: http://www.consultant.ru/document/cons_doc_LAW_52009/fb5ed26b139141a9951ed91e25e899042ed9c03f/
2. Automated system for drilling operations classification using statistical features / B. Esmael, A. Arnaout, R.K. Fruhwirth, G. Thonhauser // 11 Int. Conf. on Hybrid Intelligent Systems, HIS 2011, Melacca, Malaysia, Dec. 5–8. – 2011. – P. 196–199. – DOI: 10.1109/HIS.2011.6122104
3. Intelligent Real-time Drilling Operations Classification Using Trend Analysis of Drilling Rig Sensors Data / A. Arnaout, R.K. Fruhwirth, B. Esmael, G. Thonhauser // SPE Kuwait Int. Petroleum Conf. and Exhibition, Kuwait City, Kuwait, Dec. 10–12. – 2012. – DOI: 10.2118/163302-MS
4. Bengio Y., Simard P.Y., Frasconi P. Learning long-term dependencies with gradient descent is difficult // IEEE Transactions on Neural Networks. – 1994. – Vol. 5, Issue 2. – P. 157–166. – DOI: 10.1109/72.279181
5. Hochreiter J. Untersuchungen zu dynamischen neuronalen Netzen. – Munchen, 1991. – 74 p.
6. Hochreiter S., Schmidhuber J. Long Short-Term Memory // Neural Computation. – 1997. – Vol. 9, Issue 8. – P. 1735–1780. – DOI: 10.1162/neco.1997.9.8.1735
7. Olah C. Understanding LSTM Networks. – URL: https://colah.github.Io/posts/2015-08-Understanding-LSTMs
8. Embeddings: Motivation From Collaborative Filtering. – URL: https://developers.google.com/machine-learning/crash-course/embeddings/motivation-from-collaborative-filtering
9. Howard J., Gugger S. NLP Deep Dive: RNNs // Deep Learning for Coders with fastai & PyTorch / Ed. by Howard J., Gugger S. – Sebastopol, California: O'Reilly Media, Inc., 2020. – Chapter 10.
10. Matthews correlation coefficient // Scikit-learn. Machine Learning in Python. – URL: https://scikit-learn.org/stable/modules/model_evaluation.html#matthews-corrcoef
11. Cohen’s kappa score // Scikit-learn. Machine Learning in Python. – URL: https://scikit-learn.org/stable/modules/generated/sklearn.metrics.cohen_kappa_score.html#sklearn.metrics.cohen_kappa_score
12. Precision, recall and F-measures // Scikit-learn. Machine Learning in Python. – URL: https://scikit-learn.org/stable/modules/model_evaluation