Борода22

Пользователи

Профиль Активность

Количество публикаций
21
Зарегистрирован
July 31, 2020
Посещение
September 7, 2020

Тип публикации

Вся активность

Профили

Форум

Все публикации пользователя Борода22

Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Премного благодарен, уважаемый, получилось выровнить изображение.
- August 21, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 добавил тему в OpenCV

Приветствую, ребята. Направьте пожалуйста в нужное русло. Задача у меня такая. Распознать реквизиты на платежном документе. Есть скан платежного документа. Т.к. это унифицированная форма документа, то каждый реквизит находится на определенном месте. Подскажите пожалуйста, можно ли как-то извлечь данные по определенным координатам и распознать текст ? Использую OpenCvSharp4. В интернетах находил код (при необходимости могу выложить) и общее описание алгоритма, но совсем не понимаю что, куда и откуда. Буду признателен если кто-то проведет ликбез.
- July 31, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

@Smorodov, премного благодарен. Как я понял, параметры dy, dx - разность координат точек отрезка (линии) ?
- August 14, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Прописал вот такой код: var lines = Cv2.HoughLinesP(thresh_img, 1, Math.PI / 180, 200, 150, 30); LineSegmentPoint max_line = new LineSegmentPoint(); for (int i = 0; i < lines.Length; i++) { // получаем максимальную длинную прямую if (lines[i].Length() > max_line.Length()) { max_line = lines[i]; } Cv2.Line(original_img, lines[i].P1, lines[i].P2, new Scalar(0, 0, 250), 2); } // выводим линию максимальной длины Cv2.Line(original_img, max_line.P1, max_line.P2, new Scalar(255, 0, 0), 3); отображает вот в таком виде (синяя линия - это максимально прямая линия) Как теперь определить угол поворота по синей линии ? Это необходимо для выравнивания скана документа. Как я понял, угол можно получить с помощью HoughLines(), можно ли как-то получит угол по LineSegmentPoint ?
- August 14, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Да, спасибо, я уже понял методом "тыка" что представляют эти методы Хорошо, попробую. Просто я линии, которые нашел с помощью HoughLines(), выводил на оригинал изображения. С вашим примером обязательно попробую.
- August 14, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Все-таки видимо нужно идти другим путем. Убрать все прямые вертикальные и горизонтальные линии, т.к. они мешают для утолщения. Написал (поправил чужой код) вот такой код для поиска и отображения прямых линий: Mat original_img = new Mat(PathToImage); Mat gray_img = original_img.CvtColor(ColorConversionCodes.BGR2GRAY); Mat thresh_img = gray_img.Threshold(0, 255, ThresholdTypes.Otsu | ThresholdTypes.BinaryInv); var lines = Cv2.HoughLines(thresh_img, 200, Math.PI/180, 2); for(int x = 0; x < lines.Count(); x++) { float rho = lines[x].Rho; float theta = lines[x].Theta; double a = Math.Cos(theta); double b = Math.Sin(theta); double x0 = a * rho; double y0 = b * rho; LineSegmentPoint point = new LineSegmentPoint(); point.P1.X = (int)Math.Round(x0 + (1000 * (-b))); point.P1.Y = (int)Math.Round(y0 + (1000 * (a))); point.P2.X = (int)Math.Round(x0 - (1000 * (-b))); point.P2.Y = (int)Math.Round(y0 - (1000 * (a))); Cv2.Line(original_img, point.P1, point.P2, new Scalar(0, 200, 20)); } Но линии рисуются вообще не правильно (рисуются диагоналями, под углом), я так понимаю, что накосячил где-то в преобразовании координат ? И что это за магические числа в виде 1000 ?
- August 11, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

@Smorodov, Приветствую, уважаемый! А можно пример в виде используемых функций ? Простите уж за такое наглое пожелание
- August 10, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Вот я обработал контуры, с помощью чего можно их объединить?
- August 7, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Это просто жуть, тут не то что бутылка нужна, нужно заново родиться, и впитывать это с молоком матери
- August 7, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

За что отвечает функция GetStructuringElement() и что за параметры используются ?
- August 6, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Все-таки рано радовался. На "эталонном" документе все отрабатывает как нужно, т.к. я распознаю заранее фиксированные области Но предстоит работать со сканированными изображениями, причем, сама форма документа может отличаться от "эталонного" в визуальном плане. Поэтому работа с OpenCV, думаю, все-таки предстоит. Нужно как-то определять границы текста, далее его "вырезать" и скармливать tesseract-у. Походу возвращаюсь к сообщению. Как корректно распознать области(границы) с текстом ?
- August 6, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Да, кажется все нормально, спасибо большое!
- August 6, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Выставил в SingleBlock и все корректно распозналось
- August 5, 2020
- 30 replies
- - 1
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Я использую вот такой код: var img = Pix.LoadFromFile(pathToImage); var page = tessEngine.Process(img); string result = page.GetText(); page.Dispose(); Для этого нужно использовать метод Scale() ? Как я понял, нужно для page segmentation mode установить режим single char. Как это сделать ? Установил свойство DefaultPageSegMode = PageSegMode.SingleChar, теперь распознает, но не корректно распознает строки
- August 5, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

И вот столкнулся с проблемой. Не хочет распознавать одиночные символы. Например, вот как на скрине. Что можно попытаться предпринять ? Увеличить изображение ? Причем, если "дописать" цифру слева или справа, то распознает корректно.
- August 5, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Использовал tesseract, результаты вполне пригодны.
- August 4, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

@Smorodov Спасибо большое за ссылочку, хорошее чтиво.
- August 4, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Разобрался. Все было проще. Устанавливается все из ну-гета, подключается к проекту папка tessdata, в свойствах выставляем - копировать всегда. Теперь склоняюсь ко второму варианту - фиксированные области скармливать tesseract-у. Как по мне - проще и надежнее, чем определять эти области с помощью OpenCV
- August 3, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

Установил из Nu-get`а библиотеку Tesseract 4.1. А дальше что ? Как я понял, в проект еще необходимо добавить какие-то библиотеки ?
- August 3, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

@Smorodov Спасибо большое. Я уже пробовал использовать tesseract sdk, распознает кириллицу, но как я понял, распознавание идет "потоком". Т.е. распознает все, но в одну строку. Полагаю что разбор такой строки будет еще тот геморрой. Либо я подключал не ту библиотеку, либо что-то не так настроил, но tesseract дает распознать картинку максимальным разрешением в 500 px. Как я понимаю, у меня два пути - поиск областей с данными с помощью OpenCVSharp и потом скармливать эти области tesseract-у, либо определиться с координатами фиксированных областей, и потом опять же, скармливать их tesseract-у для распознавания. Кто что может подсказать ?
- August 3, 2020
- 30 replies
Распознавание реквизитов платежного документа

Борода22 replied to Борода22's topic in OpenCV

У меня есть такой код на шарпе: public void RunTextRecog() { List<Rect> boundRect = new List<Rect>(); using (Mat img = new Mat(PathToImage)) using (Mat img_gray = new Mat()) using (Mat img_sobel = new Mat()) using (Mat img_threshold = new Mat()) { Cv2.CvtColor(img, img_gray, ColorConversionCodes.BGR2GRAY); Cv2.Sobel(img_gray, img_sobel, MatType.CV_8U, 1, 0, 3, 1, 0, BorderTypes.Default); //Cv2.AdaptiveThreshold(img_sobel, img_threshold, 250, AdaptiveThresholdTypes.GaussianC, ThresholdTypes.Binary, 3, 1); Cv2.Threshold(img_sobel, img_threshold, 0, 255, ThresholdTypes.Otsu | ThresholdTypes.Binary); using (Mat element = Cv2.GetStructuringElement(MorphShapes.Rect, new Size(20, 20))) { Cv2.MorphologyEx(img_threshold, img_threshold, MorphTypes.Close, element); Point[][] edgesArray = img_threshold.Clone().FindContoursAsArray(RetrievalModes.External, ContourApproximationModes.ApproxNone); foreach (Point[] edges in edgesArray) { Point[] normalizedEdges = Cv2.ApproxPolyDP(edges, 17, true); Rect appRect = Cv2.BoundingRect(normalizedEdges); boundRect.Add(appRect); } } for (int ind = 0; ind < boundRect.Count; ind++) { Cv2.Rectangle(img, new Point(boundRect[ind].X, boundRect[ind].Y), new Point(boundRect[ind].X + boundRect[ind].Width, boundRect[ind].Y + boundRect[ind].Height), new Scalar(100, 200, 0), 3); } Mat resize_img = new Mat(); Cv2.ImShow("Результат", img); Cv2.ImShow("Собель", img_sobel); Cv2.ImShow("Threshold", img_threshold); Cv2.ImShow("Grey", img_gray); Cv2.ImWrite("segmented.jpg", img); } } Результаты на скриншотах. Как я понял опытным путем (изменяя параметры), выделение объектов происходит с помощью GetStructuringElement(). У меня тут еще идея возникла. Тупо вырезать определенные области на сканере, и скармливать их tesseract-у
- July 31, 2020
- 30 replies

Войти

Борода22

Количество публикаций

Зарегистрирован

Посещение

Тип публикации

Профили

Форум

Все публикации пользователя Борода22

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Распознавание реквизитов платежного документа

Навигация

Последняя активность