Оптическое распознавание символов с применением машинного обучения в области проектирования
УДК: 004.896
DOI: -
Авторы:
АНДРЕЕВА НАТАЛЬЯ НИКОЛАЕВНА
1,
ГОНЧАРЕНКО НИКИТА АНДРЕЕВИЧ
1,
ДИАС МИХАИЛ АНДРЕЕВИЧ
1
1 РГУ нефти и газа (НИУ) имени И.М. Губкина, Москва, Россия
Ключевые слова: оптическое распознавание символов – OCR, IDP, проектирование, объекты капитального строительства, САПР, нейронные сети, машинное обучение
Аннотация:
Технологии оптического распознания символов (OCR) давно известны и широко используются в современном мире в отраслях с преимущественно текстовым документооборотом. Повсеместному распространению технологии мешает ограниченность ее работы. Технология OCR не может быть применена для идентификации иллюстраций и смешанного текста, что, соответственно, мешает ее использованию для широкого вида задач. Вместе с развитием нейросетей и технологий машинного обучения технологии OCR получают новый виток развития, который устраняет существующие недостатки и характеризуется качественно новыми возможностями. Это развитие представлено технологией Intelligent Document Processing (IDP). IDP может применяться в том числе в проектных работах, позволяя увеличить эффективность операций с печатной документацией по существующим объектам капитального строительства, в частности при проведении работ по реинжинирингу. Кроме того, на базе технологии IDP можно реализовать интеграцию чертежей и специализированного программного обеспечения. Несмотря на то, что технология IDP только начинает развиваться, на данном этапе представлен потенциальный алгоритм работы такого программного обеспечения. Кроме того, именно сейчас формируются главные игроки рынка IDP, который будет динамично развиваться в ближайшие годы.
Список литературы:
1. Андреева Н.Н., Кононов В.В. Совместная работа IT-компании и технического вуза по подготовке специалистов // Автоматизация и информатизация ТЭК. – 2023. – № 11(604). – С. 41–50. – DOI: 10.33285/2782-604X-2023-11(604)-41-50
2. Cutting G.A., Cutting-Decelle A.-F. Intelligent Document Processing – Methods and Tools in the Real World. – 2021. – URL: https://arxiv.org/ftp/arxiv/papers/2112/2112.14070.pdf (дата обращения 28.03.2024).
3. Россия без FineReader: рынок OCR за год упал на четверть. – 2023. – URL: https://www.cnews.ru/news/top/2023-07-18_rossiya_bez_finereader_rynok_ocr (дата обращения 08.11.2023).