Анализ архитектур сверточных нейронных сетей для систем технического зрения
Аннотация
Обоснование. Современные системы машинного зрения в значительной степени опираются на сверточные нейронные сети, которые демонстрируют высокую результативность при анализе изображений за счет способности извлекать иерархические представления признаков. Повышение качества распознавания достигается увеличением глубины архитектур и числа параметров, но данный подход сопровождается ростом вычислительных затрат, повышенной чувствительностью к шуму и снижением устойчивости к вариациям масштаба и освещенности. Актуализируется задача поиска архитектурных решений, обеспечивающих более эффективное извлечение признаков без существенного увеличения вычислительной сложности. Перспективным направлением является использование многомасштабных сверточных операций, позволяющих учитывать локальный и глобальный контекст изображения, а также внедрение механизмов внимания, обеспечивающих адаптивную концентрацию вычислительных ресурсов на наиболее информативных областях и признаках.
Цель – формирование архитектурного подхода к построению сверточных нейронных сетей, основанного на совмещении многомасштабной сверточной обработки и механизмов внимания, ориентированного на повышение эффективности алгоритмов машинного зрения при сохранении приемлемого уровня вычислительных затрат.
Материалы и методы. В статье рассмотрены три архитектуры сверточных нейронных сетей, включающие базовую CNN, многомасштабную CNN и расширенную модель с механизмом внимания. Проанализированы операции двумерной свертки, пакетной нормализации и нелинейной активации, а также способы агрегации признаков, полученных на различных пространственных масштабах. Выполнена аналитическая оценка вычислительной сложности архитектур с учетом числа параметров, глубины сети и объема операций прямого прохода.
Результаты. Применение многомасштабной сверточной обработки расширяет область восприятия сети и повышает устойчивость к вариациям размеров объектов за счет одновременного анализа признаков на разных уровнях детализации. Внедрение механизмов внимания обеспечивает адаптивное перераспределение весов между признаками, снижает влияние шумовых и нерелевантных компонентов и повышает селективность анализа изображений.
Информация о спонсорстве. Данная статья подготовлена в рамках выполнения научно-исследовательской работы, реализуемой за счет средств федерального бюджета (источник финансирования – Минобрнауки РФ) по теме: «Разработка программного обеспечения в интересах агропромышленного комплекса для мониторинга состояния ботвы и плодов тепличных растений с помощью машинного зрения и искусственного интеллекта» (шифр научной темы FSFM-2025-0002).
EDN: FIZCUW
Скачивания
Литература
Анисимовский, В. В., Пенкин, М. А., Дорохов, Е. А., и др. (2023). Слепое устранение размытия изображения с использованием многозадачной свёрточной нейронной сети и пространственно вариативной рекуррентной нейронной сети. В Труды Международной конференции по компьютерной графике и зрению «Графикон» (№ 33, с. 455–462). https://doi.org/10.20948/graphicon-2023-455-462. EDN: https://elibrary.ru/FFTMZE
Акулов, А. А., Омельченко, Н. А., Талдыкин, Д. С., & Ганжа, Н. М. (2025). Перспективы и эффективность применения систем машинного зрения в агропромышленном комплексе Российской Федерации. В Актуальные проблемы современного общества, науки и образования (с. 14–19). Пенза: Наука и Просвещение. EDN: https://elibrary.ru/RSFSOQ
Багаев, И. И. (2020). Анализ понятий «нейронная сеть» и «свёрточная нейронная сеть», обучение свёрточной нейросети при помощи модуля TensorFlow. Математическое и программное обеспечение систем в промышленной и социальной сферах, 8(1), 15–22. https://doi.org/10.18503/2306-2053-2020-8-1-15-22. EDN: https://elibrary.ru/IZBILN
Башилов, А. М., Королев, В. А., & Легеза, В. Н. (2019). Новые возможности цифрового видеонаблюдения при интеграции с биотехническими и информационно управляющими системами. Вестник НГИЭИ, 7(98), 39–49. EDN: https://elibrary.ru/DSNIVW
Блинов, Р. В., Бычков, К. В., Кирчева, А. С., & Мамедов, И. В. (2023). Исследование новых методов компьютерного зрения для распознавания объектов и обработки изображений. В Технические и математические науки. Студенческий научный форум (Т. 5, с. 5–10). Москва: Международный центр науки и образования. EDN: https://elibrary.ru/UXBDEI
Бобырь, М. В., Емельянов, С. Г., & Милостная, Н. А. (2023). Система технического зрения в задаче определения расстояний от видеокамеры до объекта. Известия Юго Западного государственного университета, 27(3), 34–51. https://doi.org/10.21869/2223-1560-2023-27-3-34-51. EDN: https://elibrary.ru/NCUHZQ
Газеев, Е. Д. (2024). Применение машинного зрения в сельском хозяйстве. В Автоматизированные системы управления и информационные технологии (с. 426–431). Пермь: Пермский национальный исследовательский политехнический университет. EDN: https://elibrary.ru/QQHPKR
Ивлиев, С. А. (2020). Методы и алгоритмы интеллектуального анализа данных о сложных проблемных ситуациях с использованием нейросетевого подхода (Диссертация кандидата технических наук). EDN: https://elibrary.ru/QKYWNZ
Куликов, А. А. (2024). Совершенствование топологии нейросетевой модели для сегментации объектов на цифровых снимках на основе свёрточных нейронных сетей. Computational Nanotechnology, 11(3), 57–63. https://doi.org/10.33693/2313-223X-2024-11-3-57-63. EDN: https://elibrary.ru/QGYEQJ
Немковский, Г. Б., Ашапкина, М. С., Ефимов, С. А., & Деревянко, Е. А. (2025). Анализ графической информации методами машинного обучения. Информационно экономические аспекты стандартизации и технического регулирования, 2(83), 66–74. EDN: https://elibrary.ru/KNLGMN
Обухов, А. Д., Патутин, К. И., & Назарова, А. О. (2022). Алгоритмы обработки данных в автоматических системах управления на основе компьютерного зрения. Вестник Тамбовского государственного технического университета, 28(4), 573–585. https://doi.org/10.17277/vestnik.2022.04.pp.573-585. EDN: https://elibrary.ru/FQPXII
Плаксин, И. Е., & Трифанов, А. В. (2021). Анализ систем интеллектуального управления в сельском хозяйстве. АгроЭкоИнженерия, 4(109), 82–94. https://doi.org/10.24412/2713-2641-2021-4109-82-94. EDN: https://elibrary.ru/ERQYHS
Пожидаева, Д. С., Левин, М. Ю., Нагорнов, С. А., и др. (2023). Совершенствование алгоритма машинного зрения в биотехнических системах с применением нейронных сетей. Наука в центральной России, 6(66), 102–110. https://doi.org/10.35887/2305-2538-2023-6-102-110. EDN: https://elibrary.ru/NJJKLT
Рыбаков, А. В., Выборнов, Н. А., & Рыбаков, И. А. (2022). Анализ методов компьютерного зрения, перспективных для применения в агропромышленном комплексе. Прикаспийский журнал: управление и высокие технологии, 1(57), 128–138. EDN: https://elibrary.ru/QFRGLF
Celeghin, A., Borriero, A., Orsenigo, D., Diano, M., Guerrero, C., Perotti, A., Petri, G., & Tamietto, M. (2023). Convolutional neural networks for vision neuroscience: Significance, developments, and outstanding issues. Frontiers in Computational Neuroscience, 17, Article 1153572. https://doi.org/10.3389/fncom.2023.1153572. EDN: https://elibrary.ru/SZTZEF
He, B., Fan, C., Mu, X., & Wang, R. (2024). Mobile robot tracking system based on machine vision and laser radar. Vestnik of Pacific National University, 2(73), 63–70. https://doi.org/10.38161/1996-3440-2024-2-63-70. EDN: https://elibrary.ru/BWDBSL
Khanam, R., Hussain, M., Hill, R., & Allen, P. (2024). A comprehensive review of convolutional neural networks for defect detection in industrial applications. IEEE Access, 12, 94250–94295. https://doi.org/10.1109/ACCESS.2024.3425166. EDN: https://elibrary.ru/ISBXHG
Li, Z., Liu, F., Yang, W., Peng, S., & Zhou, J. (2022). A survey of convolutional neural networks: Analysis, applications, and prospects. IEEE Transactions on Neural Networks and Learning Systems, 33, 6999–7019. https://doi.org/10.1109/TNNLS.2021.3084827. EDN: https://elibrary.ru/YYIHMA
Raj, R., & Kos, A. (2025). An extensive study of convolutional neural networks: Applications in computer vision for improved robotics perceptions. Sensors, 25, Article 1033. https://doi.org/10.3390/s25041033. EDN: https://elibrary.ru/SVWYRH
Zhao, X., Wang, L., Zhang, Y., Han, X., Deveci, M., & Parmar, M. (2024). A review of convolutional neural networks in computer vision. Artificial Intelligence Review, 57, Article 99. https://doi.org/10.1007/s10462-024-10721-6. EDN: https://elibrary.ru/SHNOJQ
References
Anisimovsky, V. V., Penkin, M. A., Dorokhov, E. A., et al. (2023). Blind image deblurring using a multi task convolutional neural network and a spatially variant recurrent neural network. In Proceedings of the International Conference on Computer Graphics and Vision “GraphiCon” (No. 33, pp. 455–462). https://doi.org/10.20948/graphicon-2023-455-462. EDN: https://elibrary.ru/FFTMZE
Akulov, A. A., Omelchenko, N. A., Taldykin, D. S., & Ganja, N. M. (2025). Prospects and effectiveness of using machine vision systems in the agro industrial complex of the Russian Federation. In Topical problems of modern society, science and education (pp. 14–19). Penza: Nauka i Prosveshchenie. EDN: https://elibrary.ru/RSFSOQ
Bagaev, I. I. (2020). Analysis of the concepts “neural network” and “convolutional neural network”, training a convolutional neural network using the TensorFlow module. Mathematical and Software Support of Systems in Industrial and Social Spheres, 8(1), 15–22. https://doi.org/10.18503/2306-2053-2020-8-1-15-22. EDN: https://elibrary.ru/IZBILN
Bashilov, A. M., Korolev, V. A., & Legeza, V. N. (2019). New possibilities of digital video surveillance when integrated with biotechnical and information controlled systems. Bulletin of NGIEI, 7(98), 39–49. EDN: https://elibrary.ru/DSNIVW
Blinov, R. V., Bychkov, K. V., Kircheva, A. S., & Mamedov, I. V. (2023). Research of new computer vision methods for object recognition and image processing. In Technical and Mathematical Sciences. Student Scientific Forum (Vol. 5, pp. 5–10). Moscow: International Center for Science and Education. EDN: https://elibrary.ru/UXBDEI
Bobyr, M. V., Emelyanov, S. G., & Milostnaya, N. A. (2023). Machine vision system in the task of determining distances from a video camera to an object. Proceedings of Southwestern State University, 27(3), 34–51. https://doi.org/10.21869/2223-1560-2023-27-3-34-51. EDN: https://elibrary.ru/NCUHZQ
Gazeev, E. D. (2024). Application of machine vision in agriculture. In Automated Control Systems and Information Technologies (pp. 426–431). Perm: Perm National Research Polytechnic University. EDN: https://elibrary.ru/QQHPKR
Ivliev, S. A. (2020). Methods and algorithms of intelligent data analysis of complex problem situations using a neural network approach (Doctoral dissertation in Engineering Sciences). EDN: https://elibrary.ru/QKYWNZ
Kulikov, A. A. (2024). Improving the topology of a neural network model for segmenting objects in digital images based on convolutional neural networks. Computational Nanotechnology, 11(3), 57–63. https://doi.org/10.33693/2313-223X-2024-11-3-57-63. EDN: https://elibrary.ru/QGYEQJ
Nemkovsky, G. B., Ashapkina, M. S., Efimov, S. A., & Derevyanko, E. A. (2025). Analysis of graphical information using machine learning methods. Information and Economic Aspects of Standardization and Technical Regulation, 2(83), 66–74. EDN: https://elibrary.ru/KNLGMN
Obukhov, A. D., Patutin, K. I., & Nazarova, A. O. (2022). Data processing algorithms in automatic control systems based on computer vision. Bulletin of Tambov State Technical University, 28(4), 573–585. https://doi.org/10.17277/vestnik.2022.04.pp.573-585. EDN: https://elibrary.ru/FQPXII
Plaksin, I. E., & Trifanov, A. V. (2021). Analysis of intelligent control systems in agriculture. AgroEcoEngineering, 4(109), 82–94. https://doi.org/10.24412/2713-2641-2021-4109-82-94. EDN: https://elibrary.ru/ERQYHS
Pozhidaeva, D. S., Levin, M. Yu., Nagornov, S. A., et al. (2023). Improving a machine vision algorithm in biotechnical systems using neural networks. Science in Central Russia, 6(66), 102–110. https://doi.org/10.35887/2305-2538-2023-6-102-110. EDN: https://elibrary.ru/NJJKLT
Rybakov, A. V., Vybornov, N. A., & Rybakov, I. A. (2022). Analysis of computer vision methods promising for application in the agro industrial complex. Caspian Journal: Management and High Technologies, 1(57), 128–138. EDN: https://elibrary.ru/QFRGLF
Celeghin, A., Borriero, A., Orsenigo, D., Diano, M., Guerrero, C., Perotti, A., Petri, G., & Tamietto, M. (2023). Convolutional neural networks for vision neuroscience: Significance, developments, and outstanding issues. Frontiers in Computational Neuroscience, 17, Article 1153572. https://doi.org/10.3389/fncom.2023.1153572. EDN: https://elibrary.ru/SZTZEF
He, B., Fan, C., Mu, X., & Wang, R. (2024). Mobile robot tracking system based on machine vision and laser radar. Vestnik of Pacific National University, 2(73), 63–70. https://doi.org/10.38161/1996-3440-2024-2-63-70. EDN: https://elibrary.ru/BWDBSL
Khanam, R., Hussain, M., Hill, R., & Allen, P. (2024). A comprehensive review of convolutional neural networks for defect detection in industrial applications. IEEE Access, 12, 94250–94295. https://doi.org/10.1109/ACCESS.2024.3425166. EDN: https://elibrary.ru/ISBXHG
Li, Z., Liu, F., Yang, W., Peng, S., & Zhou, J. (2022). A survey of convolutional neural networks: Analysis, applications, and prospects. IEEE Transactions on Neural Networks and Learning Systems, 33, 6999–7019. https://doi.org/10.1109/TNNLS.2021.3084827. EDN: https://elibrary.ru/YYIHMA
Raj, R., & Kos, A. (2025). An extensive study of convolutional neural networks: Applications in computer vision for improved robotics perceptions. Sensors, 25, Article 1033. https://doi.org/10.3390/s25041033. EDN: https://elibrary.ru/SVWYRH
Zhao, X., Wang, L., Zhang, Y., Han, X., Deveci, M., & Parmar, M. (2024). A review of convolutional neural networks in computer vision. Artificial Intelligence Review, 57, Article 99. https://doi.org/10.1007/s10462-024-10721-6. EDN: https://elibrary.ru/SHNOJQ
Copyright (c) 2025 Alexey A. Akulov, Dmitry S. Taldykin, Anna V. Grishkina, Nikita M. Ganzha

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.




































