Перейти к содержимому
Compvision.ru

Smorodov

Главные администраторы
  • Количество публикаций

    3 873
  • Зарегистрирован

  • Посещение

  • Days Won

    346

Все публикации пользователя Smorodov

  1. Честно говоря, думал что если caffe собран с включенной cudnn, то он ее будет по умолчанию использовать. А так да, cudnn сильно ускоряет процесс и экономит память.
  2. Довольно удобный краткий справочник с картинками: http://www.asimovinstitute.org/neural-network-zoo/
  3. обнаружение объекта на видео

    Эммм. Видео на ютуб загрузите, и здесь ссылку дайте.
  4. А родители скорости обучения равные нулям , это так и задумано?
  5. Может просто значения маленькие, попробуйте привести в диапазон, который будет видно.
  6. OpenCV содержит в себе много примеров программ, и обучающих примеров. см. поддиректорию samples. Ну и в документации примеров много разобрано: http://docs.opencv.org/master/
  7. Убрать этот шум будет довольно проблематично, но сверточная нейронка способна работать с таким шумом и распознать цифры. Задача похожа на распознавание капчи, посмотрите здесь: https://habrahabr.ru/post/116222/ , может будет полезно.
  8. Ну, можно для негров отдельный эллипс организовать Распределения можно взять здесь: https://www.cs.rutgers.edu/~elgammal/pub/skin.pdf
  9. Собственно есть изящный метод как раз с эллипсом: cv::Mat Src = imread("image.jpg", 1); cv::Mat mask = Mat::zeros(Src.size(), CV_8UC1); Mat crcb; skinCrCbHist = Mat::zeros(Size(256, 256), CV_8UC1); cvtColor(Src, crcb, CV_BGR2YCrCb); ellipse(skinCrCbHist, Point(113, 155.6), Size(23.4, 15.2), 43.0, 0.0, 360.0, Scalar(255, 255, 255), -1); double t = (double)getTickCount(); for (size_t i = 0; i < Src.rows; i++) { for (size_t j = 0; j < Src.cols; j++) { Scalar v; v = crcb.at<Vec3b>(i, j); int s=skinCrCbHist.at<uchar>(v[1], v[2]); // проверяем попали ли в эллипс, если да, то кожа if (s > 0) { mask.at<uchar>(i, j) = 255; } } } и довольно неплохо работает.
  10. Так есть же SEGNET на том же Keras, можно там посмотреть: https://github.com/imlab-uiip/keras-segnet
  11. А гауссианы жестко сидят на каналах, или они просто собирают все максимумы подряд и затем сортируется кто куда идет ?
  12. Можно просто в переменную среды PATH добавить путь к папке с DLL-ками.
  13. В qt может быть расширение .a , но они должны создаваться при компиляции Opencv, пройдите поиском. При создании динамических библиотек обычно создается пара файлов dll и lib (или .a) . В проекте подключают lib а при запуске программа должна иметь возможность найти соответствующий dll файл.
  14. Так lib надо подключать, а не dll.
  15. Да я пока в других краях работаю, больше по нейронкам. А ее как поставишь учиться, ничего больше делать невозможно, все жутко тормозит.
  16. Ковыряю DLIB, наткнулся на оптимизатор параметров венгерского алгоритма в DLIB : examples/assignment_learning_ex.cpp, насколько я понимаю изучается метрика расстояний между объектами для лучшего трекинга. Есть еще learning_to_track_ex.cpp . Плюс к тому оптимизатор кроссвалидацией: model_selection_ex.cpp
  17. Что хорошо реализуется, а что плохо, можно прикинуть изучив основные паттерны, например здесь: http://my-it-notes.com/2013/06/gpu-processing-intro-cuda-opencl/ на каждый из них, при желании, всегда можно найти примеры реализации.
  18. Глянь еще эту штуку: https://github.com/Tencent/ncnn
  19. Посмотрел патент, там по моему слишком конкретная формула патентуемого метода, если измените один два пункта, это уже не будет подпадать под патент. По поводу аналогов, поищите по запросу "Driver Drowsiness Detection System".
  20. ASM/AAM в OpenCV

    Поситайте еще про FACS, здесь https://ru.wikipedia.org/wiki/Система_кодирования_лицевых_движений и у главного эксперта по ним http://www.paulekman.com/product-category/facs/ .
  21. В качестве оптимизатора думается можно взять любой нелинейный понравившийся из многих доступных в сети. Наример http://ab-initio.mit.edu/wiki/index.php/NLopt , https://software.sandia.gov/opt++/ или встроенный в DLIB http://dlib.net/optimization.html .
  22. Мне видится, что нужно настраивать параметры системы блоками. Например: детектор отдельно фильтр Кальмана отдельно. Для детектора можно использовать статические картинки и тут вроде все понятно. Есть вполне очевидная целевая функция, есть вектор параметров. Засовываем в оптимизатор, получаем результат. Весовые коэффициенты, например "время детекта"/"точность детекта", задавать пользователем. Для трекера, брать рандомный кусок, считать время до срыва трека. Далее применять целевую функцию на этом куске, понятно, что тут без весовых коэффициентов задаваемых пользователем тоже не обойтись. И засовывать в оптимизатор. Каждую итерацию брать новый рандомный кусок до срыва трека. Получится что с улучшением качества, будет расти набор данных для подстройки, что позволит недать более точные оптимизации.
  23. Сравнение изображений

    Здесь интересное применение GAN, может пригодится: https://github.com/hiwonjoon/cycle-gan-tf
  24. А, например, этот смотрели ? https://www.jpjodoin.com/urbantracker/ Ну и наш с Nuzhny проект: https://github.com/Smorodov/Multitarget-tracker
×