Исследование применения сверточных нейронных сетей для решения задач семантической сегментации изображений

В. Н. Широкова; М. Ю. Ушанкова

PDF

Опубликован: июн 30, 2024

Ключевые слова:

нейронные сети, сверточные нейронные сети, сегментация изображений, семантическая сегментация, U-Net, SegNet, DeepLabV3 convolutional neural networks, neural networks, image segmentation, semantic segmentation, UNet, SegNet, DeepLabV3

В. Н. Широкова

Государственный университет «Дубна», Дубна, Московская область

М. Ю. Ушанкова

Государственный университет «Дубна», Дубна, Московская область

Аннотация

Семантическая сегментация – операция в компьютерном зрении, заключающаяся в классификации и попиксельной локализации объектов на цифровом изображении. Данная статья содержит в себе обзор существующих модификаций классической архитектуры сверточной нейронной сети, направленных на решение проблемы искажения информации с исходного изображения. Проведено сравнение эффективности рассмотренных моделей в условиях бинарной и множественной семантической сегментации. Статья может быть полезной для ML/DL-разработчиков, желающих изучить проблематику сегментации изображений в рамках своей предметной области.

Скачивания

Данные скачивания пока недоступны.

Как цитировать

[1]

Широкова, В.Н. и Ушанкова, М.Ю. 2024. Исследование применения сверточных нейронных сетей для решения задач семантической сегментации изображений. Системный анализ в науке и образовании. 2 (июн. 2024), 21–29.

Выпуск

№ 2 (2024)

Раздел

Моделирование и анализ данных

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.

Библиографические ссылки

Лукашик Д. В. Анализ современных методов сегментации изображений // Экономика и качество систем связи. – 2022. – №2. – С. 57-65.

Monteux A. Metrics for semantic segmentation // Excursions in data: [сайт]. – Angelo Monteux, 2019 – Дата публикации: 10.05.2019. – URL: https://ilmonteux.github.io/2019/05/10/segmentation-metrics.html (дата обращения: 23.05.2024).

Ronneberger O., Fischer P., Brox T. U-net: Convolutional networks for biomedical image segmentation // Medical image computing and computer-assisted intervention–MICCAI 2015: 18th international conference, Munich, Germany, October 5-9, 2015, proceedings, part III 18. – Springer International Publishing, 2015. – P. 234-241.

Badrinarayanan V., Kendall A., Cipolla R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation // IEEE transactions on pattern analysis and machine intelligence. – 2017. – Vol. 39, No. 12. – P. 2481-2495.

Rethinking atrous convolution for semantic image segmentation / L. Chen, G. Papandreou, F. Schroff, H. Adam // arXiv preprint. [2017]. – arXiv:1706.05587.

Caltech-UCSD Birds-200-2011 (CUB-200-2011) [: Dataset] / C. Wah, S. Branson, P. Welinder [et al.]; California Institute of Technology // Perona Lab. – URL: https://www.vision.caltech.edu/datasets/cub_200_2011/ (дата обращения: 23.05.2024).

Brostow G. J., Fauqueur J., Cipolla R. Semantic object classes in video: A high-definition ground truth database // Pattern recognition letters, 2009. – Vol. 30. – №. 2. – P. 88-97.

PyTorch documentation // pytorch.org. – URL: https://pytorch.org/docs/stable/index.html (дата обращения: 23.05.2024).

Боковая панель статьи

Основное содержимое статьи

Аннотация

Скачивания

Информация о статье

Библиографические ссылки

Наиболее читаемые статьи этого автора (авторов)