Nuzhny

January 30, 2019

Напиши на github в issues. Разработчики откликаются, исправляют/добавляют.

January 30, 2019

Это для всех сетей. Мы для кастомной LSTM так делали - заработало.

January 29, 2019

Попробуй принудительно изменить backend у capture: CAP_FFMPEG, CAP_DSHOW или CAP_VFW. Они выбираются по очереди, какой первый подойдёт. Возможно, что у тебя первый в списке как раз не аппаратный.

January 25, 2019

Сейчас же в OpenVINO есть предобученная сетка для поиска номера (там можно ещё тип и цвет машины распознавать). На процессоре работает намного быстрее.

January 23, 2019

Можно более формально описать задачу и оставить один работающий способ. При вызове того же matchTemplate указывается метрика, по которой сравнение происходит. Запусти его на всех твоих возможных данных и посмотри итоговые значения, при которых всё находится правильно. Ещё можно посмотреть на результаты в малой окрестности. Так можно определиться с минимальнылм порогом и понять, что это именно он.

Далее уже самому написать цикл, в котором пробегаться по всей картинке и сравнивать. Причём можно сравнивать не весь кусочек целиком, а делать быстрый выход, если мы превысим порог по метрике на первых пикселях. То есть решать именно твою задачу.

January 23, 2019

Хоть как-то на распознавании (inference) или хоть как-то на обучении (train)? Для обучения лучше 8 Гб памяти и больше.

January 22, 2019

Ммм, он и правда быстрый, просто у тебя задача по-другому формулируется.

Мне, например, интересно, что значит "первое нахождение заданного шаблона". Там же куча метрик, совпадение пиксель-в-пиксель в реальных приложениях явно не возможно. В смысле, чтобы значение каждого пикселя совпало и метрика стала нулевой. Также понятно, что минимум врядли будет находиться в одной точке. Скорее всего, будет что-то похожее на параболоид - если визуализировать результат работы сравнения в 3D. И тут вопрос, насколько он пологий. Если сильно пологий, то не исключено, что результат ложный. То есть мало получить значение метрики ниже какого-то порога, надо ещё и проанализировать окрестность, чтобы убедиться в том, что минимум настоящий. У меня был опыт в нахождении таких штук: надо было определиться куда сместились блоки по 16х16 пикселей. Такие блоки на границах объектов, на чистом небе, на регулярных структурах (окна дома вдалеке) давали совершенно неожиданные результаты. Приходилось выдумывать сложные метрики и анализ.

January 21, 2019

Понятно. Тогда MatchTemplate просто делает не то, что требуется: ищет не первое вхождение (видимо, по какому-то порогу), а карту всех вхождений. Отсюда и низкая скорость.

Честно говоря, я не уверен, что подходящая функция в OpenCV есть. Но и реализация не должна быть сложно, разве нет?

January 18, 2019

Мне кажется, что надо начать с элементарного, MatchTemplate. Там никакого распознавания не происходит, работает быстро. Пусть это будет точка, от которой можно отталкиваться по скорости работы.

January 18, 2019

Курсы помогут в самом начале, чтобы можно было ориентироваться в том, что есть. Ну и не дадут упустить важную тему. Кажется, что при достаточном опыте, они уже не нужны.

December 15, 2018

Только что скачал свежую версию, скомпилировал с WITH_OPENMP и твой пример отработал без ошибок. Возможно, оно проявляется только у тебя или нужна именно твоя картинка.

December 14, 2018

Хорошо, спасибо.

December 14, 2018

Хм. Это не так просто повторить. можешь подсказать с каким-нибудь стандартным примером из поставки? Какие параметра подавать в тот же example_aruco_detect_markers, например. Я как раз засылал им один PR по поводу openmp для 4.0. Если баг в parallel_for, то хотелось бы его убрать, чтобы в других местах не проявилось. Всё таки я использую OpenCV в критических приложениях.

December 14, 2018

1 hour ago, fotomer said:

Не в курсе, про 4.0 написано Our parallel_for can now use the pool of std::threads as the backend. Я собрал традиционно с флагом WITH_OPENMP, как и на предыдущих 3.х. И далее с 4.0 распознавалка Aruco падает где-то внутри либы на потоках. Если собрать без этого флага, то все работает нормально.

А пример можешь выслать? Я тоже использую openmp, но она в Windows не развивается (поддерживает стандарт 2.0 при существующем 5.0). Поэтому разработчики OpenCV традиционно делают упор на TBB.

December 13, 2018

Попробуй запустить cmake-gui, там это найти наглядней.

December 13, 2018

OPENCV_EXTRA_MODULES_PATH правильно указан?

December 1, 2018

В CMake OPENCV_EXTRA_MODULES_PATH=что-то-там/opencv_contrib/modules

November 25, 2018

Если с OpenCV, то все байты уже у вас, уложены по строкам в IplImage в поле imageData: https://docs.opencv.org/3.4/d6/d5b/structIplImage.html

November 25, 2018

Откуда взялся String?!! Изображение где лежит, в каком виде ты его получаешь, по сети, с диска, rgb, jpeg - где начало цепочки? Изображение - это явно не строка. В этом форуме чаще всего используют библиотеку OpenCV, которая как раз и переводит изображение из какого-то своего формата (например, jpeg на диске) в удобный для обработки порядок байт.

November 25, 2018

Изображение - это и есть байты. Мне кажется, что вопрос надо конкретизировать.

November 20, 2018

В Линуксе nvidia-smi. Наверное в Windows тоже что-то подобное должно быть. И nvtop тоже: https://github.com/Syllo/nvtop

November 14, 2018

10 hours ago, mrgloom said:

В таком случае можно брать и лицевые точки, но тогда мы возвращаемся к проблеме, что они дрожат.

Дрожат - не страшно, потому что ты всё равно сглаживать будешь. В ссылке из первого поста используют moving average, но можно и экспоненциальное сглаживание, и Кальмана прикрутить. Дрожь это всё будет убирать.

10 hours ago, mrgloom said:

Вот кстати похоже показана проблема движущихся объектов и слабовыраженного фона на 24 секунде.

Да, это известная проблема. Поэтому надо либо сегментировать сразу, либо кластеризовать уже вектора и строить несколько "траекторий" для каждого кластера. Если один кластер станет больше того, по которому строится текущая траектория, то сразу на него не переключаться.

10 hours ago, mrgloom said:

А вот этот эффект я не понял почему возникает

Всё просто: в кадре два больших плана: передний и задний, которые движутся неравномерно. Видимо, строится гомография между кадрами, поэтому всё так глючит. Если бы строили только сдвиг или сдвиг и ресайз, то всё было бы нормально. В стабилизации произвольного видео надо уметь вовремя прекратить стабилизацию или понизить число степеней свободы - перейти на более простую модель: с гомографии или аффинного к сдвигу, например. Лучше совсем не стабилизировать, чем портить видео.

November 13, 2018

Нет, стабилизировать по векторам движения, как обычно (блоки, оптический поток - пофиг). Но брать эти вектора только из правильных областей. Если у тебя это лицо, то на лице. Или ты используешь глобальные методы вычисления движения? Типа фазовой коррреляции или глобального Лукаса-Канаде ( https://github.com/Nuzhny007/image-align )?

November 11, 2018

GPU у меня Intel UHD 630, что в составе i7-8750H, Windows 10. Есть ноут с Убунтой, но там Sandy Bridge, даже нет смысла проверять.

Всё равно здорово работает.

November 10, 2018

У них алгоритм будет реагировать неправильно. Чтобы было правильно, надо делать сегментацию и искать движение не в целом по кадру, а по сегментам. В твоём случае всё намного проще: детектор лица, можно добавить детекцию кожи внутри найденного лица и всё.

В OpenCV он всё больше не для реального времени, а для постобработки.

Войти

Nuzhny

Количество публикаций

Зарегистрирован

Посещение

Days Won

Тип публикации

Профили

Форум

Сообщения, опубликованные пользователем Nuzhny

DNN на CPU из C++

не удается загрузить модель в dnn

VideoCapture аппаратное декодирование

Распознавание номерного знака, расп. текста.

Минимальный проект поиска по шаблону

Ошибка ResourceExhaustedError

Минимальный проект поиска по шаблону

Минимальный проект поиска по шаблону

Минимальный проект поиска по шаблону

Сколько времени нужно на освоение Нейронных сетей для обработки изображений?

Ошибка при сборке

Ошибка при сборке

Ошибка при сборке

Ошибка при сборке

Ошибка при сборке

Ошибка при сборке

Как собрать OpenCV framework для IOS?

Конвертировать изображение в байты и обратно

Конвертировать изображение в байты и обратно

Конвертировать изображение в байты и обратно

Потерял память

Стабилизация видео при движущихся объектах

Стабилизация видео при движущихся объектах

Intel OpenVINO

Стабилизация видео при движущихся объектах

Навигация

Последняя активность