mrgloom
-
Количество публикаций
2 302 -
Зарегистрирован
-
Посещение
-
Days Won
142
Сообщения, опубликованные пользователем mrgloom
-
-
У каждой точки есть дескриптор и точки сравниваются по дескрипторам, обычно L2 norm.
Положение точки хранится в KeyPoint, а вот получить 'окрестность' точки, на сколько я понимаю, не тривиально, хотя это наверно зависит от метода подсчёта дескриптора.
Например в FAST окрестность вроде фиксированная, но все равно наверно ищется на нескольких скейлах.
-
-
Если что в opencv есть
http://docs.opencv.org/2.4/modules/stitching/doc/introduction.html
Вам нужны части exposure compensation и blending.
- 1
-
А какая точность достижима?
Тут вот например пишут про погрешность при определении центра фотографирования, но не пишут про то как эта погрешность потом будет влиять на привязку ортофотоплана сгенерированного Photoscan'ом.
-
Задача не ясна. Пары изображений заданы заранее?
p.s. Есть такая штука
- 1
-
Самый простой вариант просто по threshold'y
Если вопрос про несколько пиков.
http://stackoverflow.com/questions/3684484/peak-detection-in-a-2d-array
А мой вопрос был про то, как найти центр жирного пика, т.к. теоретически глобальный максимум на карте откликов может быть просто 1 пикселем шумом.
Есть еще такая штука как уточнение пика
-
можете попробовать YOLO, если не брезгуете завязываться на
darknet(или поискать реимплементацию), там есть секция
Real-Time Detection on a Webcamhttps://pjreddie.com/darknet/yolo/
-
-
-
По сжатию: accuracy тоже падает?
вот кстати такая штука от NVIDIA наверно тоже сжимает\квантизирует.
- 1
-
На любой чих вам придётся писать свой loss или свой layer и надо подумать на чем вы это сможете сделать.
Тут есть неплохое сравнение
http://cs231n.stanford.edu/slides/2016/winter1516_lecture12.pdf
Caffe не нравится тем ,что python api без нормальной документации. Куча библиотек-зависимостей не весело деплоить и интегрировать в С++ проект. Не удобно править prototxt (6к строк для ResNet), можно дефайнить сеть в питоне только через дурацкие трюки.
Так же говорят что в Caffe свертка не оптимальна по памяти.
https://github.com/Yangqing/caffe/wiki/Convolution-in-Caffe:-a-memo
Кто то сравнивал какой нибудь AlexNet на Caffe/Tensorflow по скорости?
Тут не очень понятно т.к. есть только Caffe(native)
https://github.com/soumith/convnet-benchmarks
Мои результаты:
https://github.com/mrgloom/kaggle-dogs-vs-cats-solution
P.s. можете порыться тут
https://github.com/mrgloom/Semantic-Segmentation-Evaluation
- 1
-
http://simd.sourceforge.net/help/group__simd__overview.html
Можете сравнить свой asm код с этой simd реализацией.
По sobel:
http://simd.sourceforge.net/help/group__sobel__filter.html
- 1
-
Так в итоге у нас всё равно скользящее окно? или мы ищем локальные максимумы типа http://stackoverflow.com/questions/3684484/peak-detection-in-a-2d-array
Только у нас в 3D.
- 1
-
Мы хотим мерить не их похожесть, а то что один юзер лайкнет другого user1-user2->{0|1} (кстати не обязательно user2->user1 будет тоже самое).
-
Ну например какой нибудь dating service где у нас связь user-user надо предсказать like\dislike.
Хотя может быть можно свести эту задачу к задаче классификации (или как задачу регрессии - предсказывать 'силу' лайка) типа concatenate(feature_vector1,feature_vector2)->{0,1}, но в таком случае проблема, что так придётся прогнать всё пары user-user.
-
Допустим есть некий стандартный pipeline HOG+LinearSVM, там мы ищем на нескольких скейлах и потом мерджим ректы через non-maxima supression.
Но если посмотреть на это с другой стороны то на каждом уровне мы имеем некую карту откликов - назовем её heatmap, можно ли как то замерджить эти heatmap'ы? Т.е. на выходе у нас по идее будет 1 heatmap и на его базе мы уже построим ректы.
-
Есть стандартные рекомендательные системы типа Netflix, где мы имеем user-movie и надо предсказать rating который user поставит movie, получается такая sparse matrix отсюда много методов пляшет.
А что если у нас есть например user-item, где user описывается feature vector 1, а item через feature vector 2 и надо предсказать бинарное событие да-нет, как такой тип рекомендательной системы называется?
-
Как узнать какая дальность для восстановления depth map у этой камеры? зависит ли от расстояния между камерами?
-
>А что за информация в skin_no_skin.txt?
https://github.com/mrgloom/Simple-skin-detection/blob/master/tree/tree.py#L10
Data in format [B G R Label]
Тут пишут про размер входных изображений 600×800 http://xiaoyongshen.me/webpage_portrait/index.html
Matting как я понял не обязателен, он дополнительно даёт 'мягкие' границы на пушистых объектах типа волос и т.д.
p.s. векторизация и оверсегментация это другая задача.
-
https://github.com/alexgkendall/caffe-segnet/issues/37
f(class) = frequency(class) / (image_count(class) * 480*360)
weight(class) = median of f(class)) / f(class) -
Вопрос в том на сколько изменяется бэкграунд и насколько он совпадает с одеждой, а так да это очень простой подход.
Имеется ввиду делить на 2 класса background/foreground, а не skin/non-skin.
-
Можно тупо попиксельную классификацию попробовать.
Репа несколько не доделанная:
https://github.com/mrgloom/Simple-skin-detection
Датасет есть?
-
Секция floodfill
ЦитатаС помощью FloodFill (заливка или метод «наводнения») можно выделить однородные по цвету регионы. Для этого нужно выбрать начальный пиксель и задать интервал изменения цвета соседних пикселей относительно исходного
https://habrahabr.ru/company/intel/blog/266347/
т.е. в floodfill используется просто < max pixel difference или попадание в range который видимо строится на базе изначального seed'a.
А вам надо в каждом окошке свой порог?
Какая изначальная задача уточнить границу?
-
Хм, мне тут сказали, что forward pass блокирует GPU (где найти подтверждение или опровержение?), т.е. второй поток будет ждать пока первый поток не сделает forward pass, но даже в таком случае выгода по идее есть, т.к. мы пока 1 поток работает загрузили батч со второго на GPU.
А вот кстати по теме:
- 1
Kaggle: compute vision challenge list
в Обсуждение общих вопросов
Опубликовано · Report reply
Есть ли какой то способ отфильтровать только computer vision related соревнования?