СТРУКТУРНЫЙ ПОДХОД К КЛАССИФИКАЦИИ БУКВ В ИЗОБРАЖЕНИЯХ
Аннотация и ключевые слова
Аннотация (русский):
В работе предлагается математическая модель понятия графемы, основные цели которой — сформулировать строгое определение понятия «графема» и выделить общую структуру изображений одинаковых символов. Построение графемы основано на непрерывном скелетном подходе, который подразумевает построение скелета бинарного изображения символа с последующей его регуляризацией. Также в работе производится применение построенной модели для задачи распознавания текста на цифровом изображении. Для этой цели из модели выделяются признаки, основанные на положениях вершин в модели графемы, и на этих признаках обучается классификатор. Он определяет, к какому классу относится графема, выделенная из бинарного изображения одного символа. Рассматривается также метод обработки входного изображения с текстом для более качественного выделения символов, строк и слов. Проведенные эксперименты показывают работоспособность предлагаемой модели графемы. Алгоритм классификации показывает сравнимые с современными методами распознавания текста результаты.

Ключевые слова:
оптическое распознавание символов, цифровое изображение текста, цифровой шрифт, графема, математическая модель, медиальное представление, агрегированный скелетный граф
Список литературы

1. Felix Hausdorff. Grundzüge der mengenlehre. - 1914.

2. Hochreiter, S. Lstm can solve hard long time lag problems / Sepp Hochreiter, Jürgen Schmidhuber // Advances in neural information processing systems. - 1997. - P. 473-479.

3. Ito, K. Gaussian filter for nonlinear filtering problems / Kazufumi Ito // Proceedings of the 39th IEEE Conference on Decision and Control (Cat. No. 00CH37187) / IEEE. - Vol. 2. - 2000. - P. 1218-1223.

4. Kam, H. T. Random decision forests / Ho Tin Kam // Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, QC. - 1995.

5. Kimura, F. Handwritten numerical recognition based on multiple algorithms / Fumitaka Kimura, Malayappan Shridhar // Pattern recognition. - 1991. - Vol. 24, no. 10. - P. 969-983.

6. Orieux, F. Bayesian estimation of regularization and point spread function parameters for wiener- hunt deconvolution / François Orieux, JeanFrançois Giovannelli, Thomas Rodet // JOSA A. - 2010. - Vol. 27, no. 7. - P. 1593-1607.

7. Otsu, N. A threshold selection method from graylevel histograms / N. Otsu // IEEE Trans. Sys., Man., Cyber. - 1979.

8. ParaType. Цифровые шрифты. - ParaType. - 2008.

9. Takahashi, H. A neural net ocr using geometrical and zonal pattern features / Hiroyasu Takahashi // Proc. 1st Intl. Conf. on Document Analysis and Recognition. - 1991. - P. 821-828.

10. Tesseract. - https://github.com/tesseract-ocr/tesseract.

11. A. Lipkina, L. Mestetskiy. Grapheme approach to recognizing letters based on medial representation / A. Lipkina, L. Mestetskiy. - 2019. - 01. - P. 351- 358.

12. О. В. Осетрова. СЕМИОТИКА ШРИФТА. - Вестник Воронежского государственного университета. Серия: Филология. Журналистика. - 2006.

13. Yujian, L. A normalized levenshtein distance metric / Li Yujian, Liu Bo // IEEE transactions on pattern analysis and machine intelligence. - 2007. - Vol. 29, no. 6. - P. 1091-1095.

14. Л.М. Местецкий. Непрерывная морфология бинарных изображений: фигуры, скелеты, циркуляры. - М.: ФИЗМАТЛИТ. - 2009.

Войти или Создать
* Забыли пароль?