Исследование применения сверточных нейронных сетей для решения задач семантической сегментации изображений

Основное содержимое статьи

В. Н. Широкова
М. Ю. Ушанкова

Аннотация

Семантическая сегментация – операция в компьютерном зрении, заключающаяся в классификации и попиксельной локализации объектов на цифровом изображении. Данная статья содержит в себе обзор существующих модификаций классической архитектуры сверточной нейронной сети, направленных на решение проблемы искажения информации с исходного изображения. Проведено сравнение эффективности рассмотренных моделей в условиях бинарной и множественной семантической сегментации. Статья может быть полезной для ML/DL-разработчиков, желающих изучить проблематику сегментации изображений в рамках своей предметной области.

Скачивания

Данные скачивания пока недоступны.

Информация о статье

Как цитировать
[1]
Широкова, В.Н. и Ушанкова, М.Ю. 2024. Исследование применения сверточных нейронных сетей для решения задач семантической сегментации изображений. Системный анализ в науке и образовании. 2 (июн. 2024), 21–29.
Выпуск
Раздел
Моделирование и анализ данных

Библиографические ссылки

Лукашик Д. В. Анализ современных методов сегментации изображений // Экономика и качество систем связи. – 2022. – №2. – С. 57-65.

Monteux A. Metrics for semantic segmentation // Excursions in data: [сайт]. – Angelo Monteux, 2019 – Дата публикации: 10.05.2019. – URL: https://ilmonteux.github.io/2019/05/10/segmentation-metrics.html (дата обращения: 23.05.2024).

Ronneberger O., Fischer P., Brox T. U-net: Convolutional networks for biomedical image segmentation // Medical image computing and computer-assisted intervention–MICCAI 2015: 18th international conference, Munich, Germany, October 5-9, 2015, proceedings, part III 18. – Springer International Publishing, 2015. – P. 234-241.

Badrinarayanan V., Kendall A., Cipolla R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation // IEEE transactions on pattern analysis and machine intelligence. – 2017. – Vol. 39, No. 12. – P. 2481-2495.

Rethinking atrous convolution for semantic image segmentation / L. Chen, G. Papandreou, F. Schroff, H. Adam // arXiv preprint. [2017]. – arXiv:1706.05587.

Caltech-UCSD Birds-200-2011 (CUB-200-2011) [: Dataset] / C. Wah, S. Branson, P. Welinder [et al.]; California Institute of Technology // Perona Lab. – URL: https://www.vision.caltech.edu/datasets/cub_200_2011/ (дата обращения: 23.05.2024).

Brostow G. J., Fauqueur J., Cipolla R. Semantic object classes in video: A high-definition ground truth database // Pattern recognition letters, 2009. – Vol. 30. – №. 2. – P. 88-97.

PyTorch documentation // pytorch.org. – URL: https://pytorch.org/docs/stable/index.html (дата обращения: 23.05.2024).