Аннотация и ключевые слова
Аннотация (русский):
В статье кратко описана методика и предложен метод для распознавания на изображениях любых объектов, которые должны иметь эллиптическую форму. Данный метод универсален и может быть применен в любых интеллектуальных системах распознавания, например, дорожных знаков с изображений видеокамер. Преимуществом предложенного метода является высокая скорость работы и стойкость к ошибкам за счет значительного уменьшения размерности исходных данных подаваемых на нейронную сеть.

Ключевые слова:
методы анализа данных, системы распознавания изображений, поиск геометрических примитивов, искусственные нейронные сети
Текст
Текст произведения (PDF): Читать Скачать

Введение

Поиск геометрических примитивов на изображениях широко используются в интеллектуальных системах распознавания изображения как промежуточная стадия получения исходных данных для последующего анализа, либо для уточнения области дальнейшего распознавания [1]. Так, например, для распознавания дорожных знаков в видео потоке более оптимальным является распознавать только изображения, находящиеся внутри объектов, имеющих геометрические формы: круга, треугольника, квадрата и пр. Также следует отметить, что на реальных изображениях данные фигуры могут быть значительно искажены в связи с углом их съемки и проекцией. Так круг будет чрезвычайно редко представлен в данном виде и почти всегда представляется в виде эллипса, границы которого достаточно сильно размыты и имеют неправильную форму.

Применение классических методик распознавания изображений, использующих сверточные и рекуррентные нейронные сети [2], а также другие сети для классификации в задачах распознавания простых геометрических примитивов крайне неэффективны и требуют значительных вычислительных ресурсов, особенно при больших размерах изображений или поточного видео. Более правильным подходом является обработка изображения и поиск замкнутых контуров, удовлетворяющих необходимым условиям.

Поиск примитивов в изображении предлагаемым методом можно разбить на четыре основных этапа: обработка изображения и приведение его к бинарной карте, поиск контуров по бинарной карте, поиск примитивов в массиве контуров, фильтрация набора найденных примитивов.

 

1. Определение контуров

Так как анализ цветов изображений не производится, для ускорения работы и упрощения алгоритмов изображение переводится в оттенки серого. Далее используется уже ставший классическим алгоритм Джона Кенни (John Canny) [3]. Данный алгоритм сначала сглаживает изображение, чтобы устранить шум и находит градиент изображения, чтобы подсветить области с высокими пространственными производными. После чего алгоритм проходит по этим областям и подавляет все пиксели, которые не в максимуме (не максимальное подавление). После чего градиентный массив уменьшается гистерезисом, который используется, чтобы отследить оставшиеся пиксели, которые не были подавлены. Гистерезис использует два порога и если величина ниже первого порога, то она устанавливается в ноль (делается не краевой). Если величина выше высокого порога, она делается краевой. В том случае если нет пути от текущего пиксела к пикселю с градиентом выше второго порога, и если величина яркости пикселя находится между двумя порогами, то она устанавливается в ноль. В результате преобразований получаем бинарную карты изображений.

Далее осуществляется поиск контуров границ и при этом используется алгоритм Судзуки (Suzuki, S.) [4]. При анализе используется небольшая модификация оригинального алгоритма, использующая аппроксимацию линий для замыкания контуров. Далее выбирались только замкнутые контуры, имеющие более семи линий с заданной пропорцией общей площади контура по отношению ко всему изображению.

 

2. Определение эллиптических объектов

Основным этапом обработки изображения является непосредственно определение является ли замкнутый контур относительно правильным эллипсом. Для этого создается массив уникальных точек P = áX, Yñ, образующих контур. В данном массиве находятся минимальные и максимальные координаты точек по обеим осям:

Таким образом, находится прямоугольник, описывающий предполагаемый эллипс (рис. 1). Стороны прямоугольника, разделенные пополам a = (Xmax - Xmin) / 2