Распознавание исторических рукописных документов с применением методов глубокого машинного обучения

Т. Р. Мамедов; Н. М. Ершов

PDF

Опубликован: сен 30, 2024

Ключевые слова:

распознавание образов, глубокое обучение, рекуррентные нейронные сети, трансформеры pattern recognition, deep learning, recurrent neural networks, transformers

Т. Р. Мамедов

Московский государственный университет им. М. В. Ломоносова, Москва, Российская Федерация

Н. М. Ершов

Московский государственный университет им. М. В. Ломоносова, Москва, Российская Федерация

Аннотация

Настоящая работа посвящена разработке и анализу нейросетевых подходов и методов к решению задачи распознавания рукописных документов. Для решения данной задачи в работе предлагается использовать модели глубоких нейронных сетей. Рассматриваются вопросы конфигурации и обучения рассматриваемых моделей, также описываются и анализируются возможные их усовершенствования. Приводятся результаты численного исследования всех предложенных подходов и сравнение их эффективности в решении поставленной задачи.

Скачивания

Данные скачивания пока недоступны.

Как цитировать

[1]

Мамедов, Т.Р. и Ершов, Н.М. 2024. Распознавание исторических рукописных документов с применением методов глубокого машинного обучения . Системный анализ в науке и образовании. 3 (сен. 2024), 46–53.

Выпуск

№ 3 (2024)

Раздел

Моделирование и анализ данных

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.

Библиографические ссылки

Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks / A. Graves, S. Fernandez, F. Gomez, J. Schmidhuber //Proceedings of the 23rd interna-tional conference on Machine learning. – 2006. – С. 369-376.

Graves, A. Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks / A. Graves, J. Schmidhuber // Proceedings of the 21st International Conference on Neural Infor-mation Processing Systems (NIPS'08). – 2008. – С. 545-552.

Convolve, attend and spell: An attention-based sequence-to-sequence model for handwritten word recognition / L. Kang [et al.] //Pattern Recognition: 40th German Conference, GCPR 2018, Stuttgart, Germany, October 9-12, 2018, Proceedings 40. – Springer International Publishing, 2019. – С. 459-472.

TrOCR: Transformer-based Optical Character Recognition with Pre-trained Models / Minghao Li [et al.] // Proceedings of the AAAI Conference on Artificial Intelligence. – 2023. – Т. 37. – №. 11. – С. 13094-13102.

IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument Mining Tasks / L. Cheng et al. // Proceedings of the 60th Annual Meeting of the Association for Computational Lin-guistics. – 2022. – Vol. 1. – С. 2277–2287.

Ba J. Layer Normalization / J. Ba, J. Kiros, G. Hinton // arXive.org e-Print archive. – 2016. – DOI: 10.48550/arXiv.1607.06450.

Exploring the limits of transfer learning with a unified text-to-text transformer / C. Raffel [et al.] //Journal of machine learning research. – 2020. – Т. 21. – №. 140. – С. 1-67. – URL: http://jmlr.org/papers/v21/20-074.html.

ICFHR 2014 competition on handwritten keyword spotting (H-KWS 2014) / I. Pratikakis [et al.] // 2014 14th International Conference on Frontiers in Handwriting Recognition. – IEEE, 2014. – С. 814-819. – DOI: 10.1109/ICFHR.2014.142.

Боковая панель статьи

Основное содержимое статьи

Аннотация

Скачивания

Информация о статье

Библиографические ссылки

Наиболее читаемые статьи этого автора (авторов)