Перейти к содержимому
Compvision.ru

mrgloom

Пользователи
  • Количество публикаций

    2 302
  • Зарегистрирован

  • Посещение

  • Days Won

    142

Все публикации пользователя mrgloom

  1. А есть ли возможность поставить на серверное оборудоавние GTX 980Ti или GTX Titan? Какой должен быть формфактор и поддержка какого слота (PCI-E 3.0?) и поддержка чего если несколько карт?
  2. Помогите с распознаванием лиц

    А размеченные данные есть? Можно было бы попробовать для интереса прогнать на этих данных 1 алгоритм.
  3. Как не странно BruteForce может быть быстрее.
  4. Там же есть из коробки codeblocks-16.01mingw-setup.exe http://www.codeblocks.org/downloads/26 Я точно не уверен, но x32 должно хватить, т.к. есть кросскомпиляция же. Потом по идее вам надо собрать OpenCV используя MinGW. http://kevinhughes.ca/tutorials/opencv-install-on-windows-with-codeblocks-and-mingw/ http://stackoverflow.com/questions/10860352/getting-started-with-opencv-2-4-and-mingw-on-windows-7
  5. Видимо можно пофильтровать по какому либо критерию найденные особые точки до вычисления дескрипторов и матчинга.
  6. Нет необходимости явно вызывать .Release у Mat Какая точно ошибка?
  7. Доступ к 2D матрице H.at<double>(y,x)
  8. Помогите с распознаванием лиц

    По всей видимости вам надо создавать свой набор точек и учить заново детектор. Насчёт методов можете посмотреть https://github.com/mrgloom/Face-landmarks-detection-benchmark
  9. На всякий случай сделайте проверку CV_Assert(m.type() == 64FC1);
  10. Так может надо OpenCV под MinGW собирать?
  11. http://math.stackexchange.com/questions/78137/decomposition-of-a-nonsquare-affine-matrix
  12. Компилятор в Code::Blocks от Visual Studio ?
  13. cvMatchTemplate

    А есть какой то критерий качества (например для phaseCorrleate ) более интеллектуальный, чем просто максимальное значение пика на карте отклика? Имеется ввиду что когда мы имеет карту отклика примерно такую Т.е. например что то типа пик один, он острый, превышает всё вокруг на 80%.
  14. Parametric image registration

    В opencv_contrib появились алгоритмы image registration, без использования FFT. Работают только при использовании пирамиды. https://github.com/Itseez/opencv_contrib/tree/master/modules/reg Документ описывающий http://research.microsoft.com/pubs/75695/Szeliski-FnT06.pdf
  15. Я в этом не до конца разбираюсь, но видимо имеется ввиду epipolar rectification http://docs.opencv.org/2.4/modules/calib3d/doc/camera_calibration_and_3d_reconstruction.html#stereocalibrate http://docs.opencv.org/2.4/modules/calib3d/doc/camera_calibration_and_3d_reconstruction.html#stereorectify http://ece631web.groups.et.byu.net/Lectures/ECEn631 14 - Calibration and Rectification.pdf
  16. http://docs.opencv.org/2.4/modules/stitching/doc/blenders.html https://github.com/Itseez/opencv/blob/2f4e38c8313ff313de7c41141d56d945d91f47cf/samples/cpp/stitching_detailed.cpp
  17. Вопрос немного не по теме, но как обстоят дела с opensource 3d reconstruction(т.е. всё ли уже есть и готово к использованию из коробки?) На чём заканчивается SFM pipeline? на создании sparse point cloud? Есть ли возможность потом сделать dense point cloud, digital elevation model? Кто то пробовал эти проекты с использованием opencv? https://github.com/Itseez/opencv_contrib/tree/master/modules/sfm https://github.com/royshil/SfM-Toy-Library
  18. Parametric image registration

    Не знаю точно как описать их класс, там вроде есть разные модели. Думаю что самый простой вариант это piecewise affine warp. Или что то типа такого. http://bigwww.epfl.ch/thevenaz/UnwarpJ/
  19. Parametric image registration

    Да, у Szeliski как раз overview методов. А можно этот подход расширить до non-rigid случая? Типо того что делают в области Medical Image Registration.
  20. Пытаюсь понять как работает и почему работает трюк который описан тут, т.е. когда из "обычной" CNN полносвязные слои переделывают в свёрточные. Почему только после того как мы натренировали сеть мы меняем слои, можем ли мы учить сразу со свёрточными (вроде как это меньше параметров)? Или тогда нам нужно на выходе иметь попиксельную разметку и другой loss? Как я понимаю этот подход может сэмулировать sliding window detector ? т.е. он лучше чем просто побить изображения на окошки и для каждого окошка вызывать CNN чтобы запредиктить класс. Вот тут например еще об этом (слайд 3) Тут похожий трюк (слайд 8-9), только слои как то утолщаются и используются deconvolution\upsampling layer. Так же тут используют что то похожее. А так же тут говорят о чем то похожем (слайд 166 - 167) Еще оптимизация http://arxiv.org/pdf/1302.1700v1.pdf
  21. Так всё таки когда мы таскаем с собой mean image, то вычитается именно mean image целиком или всё равно оно превращается в 3 числа - средний цвет пикселя по каждому каналу? Например https://github.com/DeepScale/SqueezeNet/blob/master/SqueezeNet_v1.0/train_val.prototxt transform_param { crop_size: 227 mean_value: 104 mean_value: 117 mean_value: 123 }
  22. Тут вот довольно понятно написано. http://cs231n.github.io/convolutional-networks/ Как я понял, всё таки они оперируют фильтрами\кернелами WxHx3, только непонятно почему 1 фильтр по трём каналам учит примерно одно и тоже(в следствии чего получается фильтр аля gabor filter), и получаются не различные веса(например как у разных фильтров)? Хотя может так кажется ? т.к. там где цветные блобы, блобы разного цвета находятся не в одном и том же месте. И мне кажется неправильно называть это 3D convolution, а более корректно Multi-channel convolution.
  23. Как посчитать погрешность восстановленного облака точек? Допустим на входе у нас фото разрешения W,H и дана GPS позиция камеры (которая допустим имеет некую погрешность sigma). Надо в реконструированном облаке точек для любой точки посчитать X,Y,Z погрешность. По идее погрешность будет разная для разных точек?
  24. Наверно там вот эти матрицы http://docs.opencv.org/2.4/modules/calib3d/doc/camera_calibration_and_3d_reconstruction.html Может там используется модель 9.1.3 Rotational panoramas http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf
  25. По ходу там 2 вида блендинга http://docs.opencv.org/2.4/modules/stitching/doc/blenders.html FEATHER, MULTI_BAND FEATHER - Simple blender which mixes images at its borders. MULTI_BAND - http://persci.mit.edu/pub_pdfs/spline83.pdf http://graphics.cs.cmu.edu/courses/15-463/2010_spring/Lectures/blending.pdf https://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&cad=rja&uact=8&ved=0ahUKEwjz89v2jazNAhXC3SwKHUg0DakQFggjMAE&url=https%3A%2F%2Fcourses.cs.washington.edu%2Fcourses%2Fcse455%2F13au%2Fslides%2F9_ImageStitching2.pptx&usg=AFQjCNEAJybNhxaPaSJe_cyfs6n4FT103g&sig2=QZt5jcXjbcGPXzVfJGYmUA&bvm=bv.124272578,d.bGg
×