Исследование применения сверточных нейронных сетей для решения задач семантической сегментации изображений
Основное содержимое статьи
Аннотация
Семантическая сегментация – операция в компьютерном зрении, заключающаяся в классификации и попиксельной локализации объектов на цифровом изображении. Данная статья содержит в себе обзор существующих модификаций классической архитектуры сверточной нейронной сети, направленных на решение проблемы искажения информации с исходного изображения. Проведено сравнение эффективности рассмотренных моделей в условиях бинарной и множественной семантической сегментации. Статья может быть полезной для ML/DL-разработчиков, желающих изучить проблематику сегментации изображений в рамках своей предметной области.
Скачивания
Информация о статье
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Библиографические ссылки
Лукашик Д. В. Анализ современных методов сегментации изображений // Экономика и качество систем связи. – 2022. – №2. – С. 57-65.
Monteux A. Metrics for semantic segmentation // Excursions in data: [сайт]. – Angelo Monteux, 2019 – Дата публикации: 10.05.2019. – URL: https://ilmonteux.github.io/2019/05/10/segmentation-metrics.html (дата обращения: 23.05.2024).
Ronneberger O., Fischer P., Brox T. U-net: Convolutional networks for biomedical image segmentation // Medical image computing and computer-assisted intervention–MICCAI 2015: 18th international conference, Munich, Germany, October 5-9, 2015, proceedings, part III 18. – Springer International Publishing, 2015. – P. 234-241.
Badrinarayanan V., Kendall A., Cipolla R. Segnet: A deep convolutional encoder-decoder architecture for image segmentation // IEEE transactions on pattern analysis and machine intelligence. – 2017. – Vol. 39, No. 12. – P. 2481-2495.
Rethinking atrous convolution for semantic image segmentation / L. Chen, G. Papandreou, F. Schroff, H. Adam // arXiv preprint. [2017]. – arXiv:1706.05587.
Caltech-UCSD Birds-200-2011 (CUB-200-2011) [: Dataset] / C. Wah, S. Branson, P. Welinder [et al.]; California Institute of Technology // Perona Lab. – URL: https://www.vision.caltech.edu/datasets/cub_200_2011/ (дата обращения: 23.05.2024).
Brostow G. J., Fauqueur J., Cipolla R. Semantic object classes in video: A high-definition ground truth database // Pattern recognition letters, 2009. – Vol. 30. – №. 2. – P. 88-97.
PyTorch documentation // pytorch.org. – URL: https://pytorch.org/docs/stable/index.html (дата обращения: 23.05.2024).