Fresh 0 Жалоба Опубликовано January 7, 2013 Здравствуйте. Вот судьба-злодейка заставила вернутся к старому проекту по распознаванию символов с шестерни. Ранее использовал метод нахождения максимумов/минимумов функции cvMinMaxLoc, но количество верно распознанных символов не большое. Стал искать как повысить качество и... наткнулся на нейронные сети. Почитал, показалось несложно для опытного программиста, но для меня - начинающего, сложновато. Но везде только описание, без исходных кодов. Может быть кто-нибудь поделится исходным кодом приложения (желательно на C++, но можно и на другом языке) которое может выполнять следующее: Распознавать необходимо цифры, кириллицу(весь алфавит) и латиницу(используется только 7 символов из всего алфавита) Необходимо, чтобы сеть можно было обучить. А вообще, буду признателен за любые исходные коды по данной тематике с небольшим описанием. Спасибо. Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
Smorodov 579 Жалоба Опубликовано January 7, 2013 Есть готовые продукты с открытым кодом, правда tesseract недавно привязался к библиотеке Leptonica (я так и не построил у себя бинарники tesseract под vs2010 для х64), а openocr (Cuneiform) достаточно массивная штука. http://code.google.com/p/tesseract-ocr/ http://openocr.org/ Забыл еще http://jocr.sourceforge.net/index.html Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
Nuzhny 243 Жалоба Опубликовано January 7, 2013 Вот тут можешь посмотреть. Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
iskees 32 Жалоба Опубликовано January 9, 2013 Я для распознавания цифр и букв использую FANN, библиотека предельно простая. На вход подаю бинаризованное изображение 10/15 пикселей и получаю цифру, вероятность для цифр за 99% для букв (которые с латиницей совпадают) 98-99%. Сама библиотека может и обучать нейросеть, работает очень быстро но если не хватит скорости есть версия на OpenCL. Для обучения можно использовать утилиту FannTools. Найти можно по первой ссылке в гугле. Но нейросеть нейросетью, а главное правильно сегментировать и бинаризовать. Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
kilop 7 Жалоба Опубликовано January 9, 2013 согласен с предыдущим оратором, FANN подойдет + необходима теория, например, Smorodov неплохие pdf-ки сделал, по которым удобно изучать, иногда использая гуглю - http://www.compvision.ru/forum/index.php?showtopic=864 Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах