shornikov

Пользователи

Профиль Активность

Количество публикаций
5
Зарегистрирован
March 13, 2013
Посещение
March 21, 2013

Репутация

0 Новичек

О shornikov

Звание
Новичок

Обработка сканов книг

shornikov replied to shornikov's topic in OpenCV

А как мне все похожести найти? cvMinMaxLoc, которой оперируют во всех примерах находит лучший вариант, а мне бы хотелось массив. Брать контуры нарезанные в ROI и сравнивать шаблон с каждым,игнорируя значения ниже порога или есть способ проще?
- March 21, 2013
- 12 replies
Обработка сканов книг

shornikov replied to shornikov's topic in OpenCV

Спасибо за ссылку, почитаю.
- March 21, 2013
- 12 replies
Обработка сканов книг

shornikov replied to shornikov's topic in OpenCV

В общем да. Но возможно, распознование образов окажется проще, чем распознование символов. Мне же не нужно распознование с высокой достоверностью. Улучшится качество части символов - уже проще. Попробовал распознавать через matchShapes, очень плохо, видимо мозгов у меня не зватает
- March 15, 2013
- 12 replies
Обработка сканов книг

shornikov replied to shornikov's topic in OpenCV

Мне не нужен текст. В оригинале дореволлюционый русский + формулы + еще черт знает что будет. Вполне устроит качественная картинка с востановленным рисунком символов.
- March 14, 2013
- 12 replies
Обработка сканов книг

shornikov добавил тему в OpenCV

Здравствуйте. Есть у меня такая задача, я напишу, как я хочу ее решить, а вы, если не трудно, укажите на ошибки в размышлениях и использовании инструментов. Задача. отсканировать много однообразных документов на серой бумаге и довести до ума. Если использовать фотошоп и прочее - слишком много ручной работы в виде закликивания шума и восстановления затёкших, после использования фильтров, букв. Подумалось, что можно поступить так: До какой-то степени файлы приводятся к одному тону фотошопом, потом передаются в связку Phyton+OpenCV. Планирую сделать так. 1.Для отчистки изображения найти контуры, мелкие контуры посчитать шумом и залить белым цветом. Пробелема. Часть мелких контуров отвалившиеся хвостики от букв и удалять их нельзя. Думаю, что нужно взять мелкий контур и если на определенном растоянии от него есть большой - соединить их линией. Изначально казалось что подойдет distanceTransform() + threshold(), но он действует на всё изображение, а мне нужно на конкретную точку (проще,наверное, использовать центр контура). Подскажите, как это проделать эстетично? 2. Для повышения качества рваные буквы планируется распознать путем сравнения контуров с заранее подготовленными образцами и подменить на отчищенные буквы через matchShapes(). Проблема. Как быть с буквами типа "й","i", состоящими из двух контуров. Рассматривать как независимые символы или объединять. Если объединять, то как? С распознованием, вроде, проблем не предвидится, качество распознования можно наращивать бесконечно. Как вариант рваность можно убирать через ApproxPoly(), но, кажется, это будет сложнее. Хотелось бы услышать мнение профессионалов о моих размышлениях и получить совет, как решить проблемы.
- March 13, 2013
- 12 replies

Войти

shornikov

Количество публикаций

Зарегистрирован

Посещение

Репутация

О shornikov

Обработка сканов книг

Обработка сканов книг

Обработка сканов книг

Обработка сканов книг

Обработка сканов книг

Навигация

Последняя активность