Перейти к содержимому
Compvision.ru
K0rG

Распознавание номерного знака, расп. текста.

Recommended Posts

Друзья, а у Вас есть какая-либо выборка состоящая из изображений авто с номерными знаками? хотяб пару сотен обучающих изображений?

я этими пользуюсь

1.rar

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Хочу попробовать распознать номер. Для примера это изображение: post-4427-0-98311000-1335012914_thumb.jp

Нашел tesseract-ocr, но возникли траблы с обучением, вернее вообще плохо понимаю как его обучить для данной задачи. Подскажите в какую сторону копать?

Или может быть другой открытый движок для распознавания?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

можно нейросети (но надо обучать, есть определенная устойчивость к шуму)

http://www.codeproject.com/Articles/16650/Neural-Network-for-Recognition-of-Handwritten-Digi

обычно вроде выделяют буквы, потом центрируют и ресайзят и подают на вход нейросети, а интересно можно ли просто пройтись скользящим окном по всему изображению? т.е. для каждого положения окна получим некую вероятностную характеристику присутствия темплейта.

можно что то типа контурного анализа(задаются только шаблоны, нет устойчивости к шуму)

http://www.codeproject.com/Articles/196168/Contour-Analysis-for-Image-Recognition-in-C

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В tesseract-ocr можно посмотреть способы реализации тех или иных частей кода, алгоритмов, но использовать как ANPR, нежелательно, так как спортировать на встраиваемую систему, например ARM не сможете, а библиотека не малая, и на системе вообще будет вешаться, библиотеку tesseract-ocr я бы использовал непосредственно для OCR-задач, например как Fine Reader.

В данной задаче нужно все делать на чистом С и С++, основной упор конечно на саму библиотеку OpenCV так-как ребята там не глупые и реализовали все что можно, и продолжают реализовывать, алгоритмы отточены до мелочей. А популярность и кроссплатформенность подталкивают на постоянный рефакторинг кода, что со временем, по выходу новых версий, дает свои положительные результаты...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Область знака лучше брать по пропорциям ГОСТ Р 50577-93.

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Проектов таких много уже неизбалованных но увы все с закрытым кодом.

Насчет того кода что выше и вообще подхода с бинаризацией, хорошего результата от него не получить(фон может быть идентичен номеру этим грешат тазы, различная освещенность и часто сливаются номера сливаются с окантовкой номера или окантовка с машиной и прямоугольника по пропорциям нужным уже нет).Но если кому то все таки хочется бинаризацию то советую смотреть в стороны метода Кристиан, он чуть медленнее Отсу и его нет в OpenCV но для номеров он намного лучше.

Еще что то было написано про сравнение гистограмм на кусках изображение. Тоже метод мало полезный, даже если номер и найдется что маловероятно из за радиаторных решеток(мерседесы например) и бамперов(с хромом), то все равно локализация номера будет плохая и уже распознать символы будет сложно. Но большинство систем что сейчас на дорогах стоят ищут именно про перепадам яркости.

Целесообразно пилить метод который бы искал номер по каким то мелким но четки признакам(найти не разорванный прямоугольник маловероятно под мало имеется ввиду 70-80%), например искать углы. Или второе направление это изобрести метод который бы в контурах полученных от FindContour искал прямоугольник но не по периметру а обходом точек. Пример такого контура в прикрепленном.

Да и распознание это безусловно нейросети само распознание задача плевая большая проблема это сегментация символов особенно наших знаков( разная высота разные положения флаг еще этот). tesseract-ocr как распознаватель не катит проверено не однократно.

Если кому нужно оттестировать свой метод пишите, есть тысячи номеров реальных машин с нашими номерами и уже распознанными номерами сами фото разумеется не дам все таки фотографии реальные с реальными машинными и у их владельцев разрешение на распространение не спрашивали.

post-5717-0-96739600-1340289418_thumb.pn

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Слабо верится, что вы проверяли не однократно...

Как раз таки tesseract-ocr - это довольная мощная штука, и нет не какого смысла использовать ее для anpr-систем, введу ее огромной реализации.

Tesseract — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0 для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0) осуществляется с помощью дополнительных модулей.

Насчет локализации, сегментации и распознания номеров, сомневаюсь что это нейросети. Нейросети это нечто большее...

И контур на картинке совсем не так находите...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

tesseract не распознает номер(кто не верит может взять базу номеров и прогнать) целиком даже если его вырезать прямо по рамке, вернее распознает что-то но не с точностью хотя бы 95%. номера у нас такие, флаги полоски символы рядом, а если еще учесть качество картинки с камер...

Под распознаванием имелось ввиду распознание уже сегментирование бинаризованных символов, тут нейрости самое то дадут вероятность за 99% на символ, и по производительности хороши.

Если знаете другие способы выделения границ и вообще номера пишите обсудим.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

tesseract не распознает номер

совершенно верно, он распознает текст

вернее распознает что-то но не с точностью хотя бы 95%

Во-первых возможно в составе нет "очертаний" этих символов

Во-вторых 95%, я не ослышался. По моему самая достоверная система ANPR дает результат чуть более 75%

тут нейрости самое то дадут вероятность за 99%

99% ?, :-0 .., если бы это было так, то по улицам бы ходили роботы...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Opensource проект распознавалки номеров: http://www.dexmac.com/index.php/software/114-plategatewayqt

http://www.youtube.com/watch?v=NUpxmWPejlo

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Opensource проект распознавалки номеров: http://www.dexmac.com/index.php/software/114-plategatewayqt

http://www.youtube.com/watch?v=NUpxmWPejlo

Улыбнула ошибка в конце ролика )))

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А зачем изобретать велосипед, если есть куча готовых решений? к тому же спрос на решение этой задачи очень небольшой

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Opensource проект распознавалки номеров: http://www.dexmac.com/index.php/software/114-plategatewayqt

http://www.youtube.com/watch?v=NUpxmWPejlo

Ну это вообще не серьезно, мало того что номер без фона без искажений и вообще в тепличных условиях, так еще и 200мс на кадр когда максимум это 30мс.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

совершенно верно, он распознает текст

Во-первых возможно в составе нет "очертаний" этих символов

Во-вторых 95%, я не ослышался. По моему самая достоверная система ANPR дает результат чуть более 75%

99% ?, :-0 .., если бы это было так, то по улицам бы ходили роботы...

95% это реально причем это среднее значение за сутки днем может быть 97, а ночью под 80. какой смысл от распознание номера в вероятностью 70%.

99% процентов вероятность успешного распознания сегментированного символа, а не всего номера. при ошибке больше 1%, а в номере символов 8-9 уже не укладываемся в 95%.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А зачем изобретать велосипед, если есть куча готовых решений? к тому же спрос на решение этой задачи очень небольшой

Существующие системы дико дорогие, цена за один канал от 50т.р. и все они заточены под массовое применение например гаишниками. А если вы хотите например у себя дома над гаражом повешать камеру которая бы увидев вашу машину сама открывала ворота, или у вас маленький магазинчик у дороги и т.п. то вы не будите платить эти 50 т.р. Ну и вообще интересно же.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

тут уже разговор вообще непонятно о чем, в начале автор вроде бы начал реализовывать свой велосипед по причине того, что нужен был облегченный алгоритм поиска номерного знака.

% распознавания зависит от множества факторов - используемые ограничения, качество картинки\условия съемки, обучение алгоритма распознавания под конкретные номера.

системы может быть готовой и нет, но не факт что собрать из готовых частей самому труднее, чем настроить что то чужое и корявое без документации.

найти прямоугольник->процессинг->побить на символы->запихнуть в OCR.

по запросу plate recognition тоже вроде достаточно информации.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

у нас 32т.р. за 8 каналов )

http://www.mallenom.ru/avtomarshal.php

Демпингуете. А можно посмотреть как оно работает на какой нибудь пробной версии(видео с камер аналоговых и IP)?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Демпингуете. А можно посмотреть как оно работает на какой нибудь пробной версии(видео с камер аналоговых и IP)?

так конечно можно ... на сайте есть координаты ... обратитесь ... вам дадут демку которая работает с видеофайлами и камерами ... есть и отдельно SDK (за 23 тыс. руб)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Проект, распознающий уравнения (напечатанные). Используются Tesseract + OpenCV.

http://ayoungprogrammer.blogspot.ru/2013/01/equation-ocr-part-1-using-contours-to.html

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

почитал я эту тему, пообедал, и решил внести свои пять копеек, в интересную на мой взгляд математическую задачу.

я новичок в компьютерном зрении просто читаю статьи...

так вот, есть в моем хозяйстве комерческий продук по распознанию номеров. сам его запускал на объекте.

и заметил я такую особенность, что жрет этот распознаватель с удовольствием и телефонные номера расклеянные на автомобилях как реклама. и метит их как белоруские.

бадался я долго с этим искуственным интелектом. но ставит эта штука порой телефону выше точность распознанию чем автомобильному номеру и все.

поэтому, поделюсь соображениями:

1. для распознания номеров, мне кажется, рамку искать не надо. по крайной мере с этого начинать.

2. надо искать цифры и буквы, дабы их не так уж и много.

3. стандарные средства типа OCR мне кажется не подойдут, они заточены на обычный текст, ариал, тайм нью роман и т.д.(имеется ввиду сама форма символов)

у нас же есть четкие шаблоны скорее всего по госту. надо использовать их.

4. потом появилась мысль использовать библиотеку для распознования лиц. могу ошибится, так как в чтении до этой главы еще не дошел, но распознание там делается на основе образов. носа, глаз, губ.

ну а что нам мешать использовать цифры и буквы?

5. поиск по контрастам, не совсем хорош, так как при свете солнца, частенько отбрасывается тень на номер как от козырька (это из моей практики), и получается что пол номера темные сверху так сказать, а пол номера светлые.

здесь же в примерах были фотки тольнко с равномерным освещением, как в фото студи ;)

6. на мой взгляд рамка нужна для исправления наклона-перспективы, ну и по ней удобно определить направление движения машины, приближается или удаляется.

7. никто не упоминал о повороте номера. по часовой или против часовой стрелке на изображении. судя по распознователю лиц, в примерах которые мне попадались, наклоненные лица распознавались. в распознователе который у нас, наклоны допускаются до 30 градусов.

вот такие мысли на суд общественности...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте учётную запись или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать учётную запись

Зарегистрируйтесь для создания учётной записи. Это просто!

Зарегистрировать учётную запись

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас


  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу

×