Публикации idrua - Страница 3

Чем распознать слабо отличимые линии?

idrua replied to Tlya's topic in OpenCV

Картинку не мешало бы прикрепить. А вообще оператор Собеля отлично выделяет линии.

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Еще, совершенно случайно, было обнаружено, что печатные буквы можно удалить достаточно простым способом (маской из LSD). Правда и рукописный тоже подчищается, но это мелочи (можно чистить только нужные зоны). Не идеально конечно, прямые линии ("палки" от букв) от LSD в маску не попадают, поэтому удаляются только круглые (о, ф, е, я и т.д.)

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Спасибо, посмотрю. Но там шум совсем другой: следы от стаканов, загнутые страницы и т.д. Это все гораздо проще удалить, имхо. У меня же на черном печатном пишут черным рукописным (синий тоже бывает, но с ним легче). Наверное, следует написать пару слов о промежуточных результатах на сейчас. Во первых, спасибо, Nuzhny, что помогает советами и кодом вот уже месяц. 1. Разложить по цвету мои картинки невозможно. Что только не делали: добавляли LBP, оператор Собеля, различные маски. Все мимо. Ни кластеризация, ни классификация не справляются. 2. Решили добавить принадлежность пикселя с типу текста. Ведь что-то таки известно. Можно получить контуры и отобрать только те, которые подходят по размеру печатных букв. Определяются не все, иногда ложные появляются (с этим беда). А еще можно получить рукописный из LSD (длинные линии под углом 10..80 и 100..170) будут говорить о рукописном. В результате получается такая маска(см.ниже). Результаты пока не очень, но заметно лучше, чем просто по цвету с всевозможными "играми" из LBP, Sobel и т.д. В красном и зеленом результат разложения. Это мой первый опыт работы с классификатором. Думаю, что у Nuzhny получше выйдет, но он пока занят.

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Установил C++, взял за основу код (Smorodov) с небольшими правками ( беру для обучения все не белое). Результат, не очень. По первым двум каналам (H-S) совсем плохо. Чуть лучше по другим парам (H-V или S-V или полностью H-S-V). Иногда по RGB лучше раскладывает, чем по HSV. Также не понятно, как программно контролировать устраивает результат или не устраивает. Ниже результаты. Оригинал, точки для обучения, результат разложения. На первой картинке по H-S. На второй по H-S-V.

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Продолжил... Должен сказать, что установка пакета OpenCV на С++ в корне отличается от C#. Скачал opencv-3.2.0-vc14.exe, распаковал, прописал все пути. Создал тестовый пример. Компилируется успешно. Но выяснилось, что это только для x64, а у меня x86. Насколько я понял, нужно при помощи CMAKE создавать нужные библиотеки из папки source. P.S. В opencv-2.4.13.3-vc14.exe есть папка x86. Наверное, так проще будет. Особенно для меня )))

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

1. Легко сказать, но трудно сделать. Не использовал до этого момента плюсы и Питон. Ладно, буду пробовать. Какой пакет Nuget устанавливать? Вижу два популярных от Itseez и shimat. 2. Удалил фон. Сделал его белым, чтобы удобнее отсекать.

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Вот, блин... ни одного примера на C# во всем интернете по Expectation Maximization. Могу я попросить exe'шник с dll'ками для тестов (для 86 машины)? Тем более, его ранее раздавали на форуме. Насколько я понимаю, мне нужно разложить на 3 канала (белый(фон), черный(печатный), черный (рукописный)). Не совсем понял, почему Nuzhny предлагает на 2. Или имелось 2 класса с разными черными? P.S. Смотрел свои проблемные картинки в HSV. Hue для печатного и рукописного почти не отличается (если черным рукописным по черному печатному). А вот Saturation иногда отличается и очень сильно.

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Спасибо тебе, добрый человек! Буду разбираться и проверять.

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Линии уже удалены. Я правда не гистограммой делал, а HoughLines. Принцип примерно такой же. Нейронку пока не могу. Это долго и нет нужного объема изображений. По теме чистки (очередная попытка): 1)Известна примерная зона рукописного текста. 2)Бинаризирую, провожу условно линию по высоте \ 2. 3)Ищу все точки черного цвета на условной линии. 4) Заливаю другим цветом (FloodFill) найденные точки. Получается отсеять часть букв, которые не соприкасаются с рукописным. Но все равно плохо.

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Не получается с наложением эталона. Слишком много эталонов (один и тот же текст, но разными шрифтами и размерами). Может еще идеи какие? По толщине пера? По цвету печатного текста? Фильтры? Нужно любой ценой избавиться от печатного текста. Очень часто цвет печатного и рукописного отличается. Но не могу придумать как на этом "сыграть". P.S. Могу примеры картинок прикрепить.

Очистка изображения от печатного текста

idrua replied to idrua's topic in OpenCV

Статью на хабре видел. Там фон удачно чистится по причине разных цветов фона и цифр. А у меня все черное. И рукописные цифры и печатный текст.

Войти

idrua

Количество публикаций

Зарегистрирован

Посещение

Days Won

Тип публикации

Профили

Форум

Все публикации пользователя idrua

Чем распознать слабо отличимые линии?

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Очистка изображения от печатного текста

Навигация

Последняя активность