Перейти к содержимому
Compvision.ru

mrgloom

Пользователи
  • Количество публикаций

    2 302
  • Зарегистрирован

  • Посещение

  • Days Won

    142

Сообщения, опубликованные пользователем mrgloom


  1. У каждой точки есть дескриптор и точки сравниваются по дескрипторам, обычно L2 norm.

    Положение точки хранится в KeyPoint, а вот получить 'окрестность' точки, на сколько я понимаю, не тривиально, хотя это наверно зависит от метода подсчёта дескриптора.

    Например в FAST окрестность вроде фиксированная, но все равно наверно ищется на нескольких скейлах.

    fast1.png?w=640&h=320


  2. А какая точность достижима?

    Тут вот например пишут про погрешность при определении центра фотографирования, но не пишут про то как эта погрешность потом будет влиять на привязку ортофотоплана сгенерированного Photoscan'ом.

    http://gisinfo.ru/techno/photoscan.htm


  3. Самый простой вариант просто по threshold'y

    Если вопрос про несколько пиков.

    http://stackoverflow.com/questions/3684484/peak-detection-in-a-2d-array

     

    А мой вопрос был про то, как найти центр жирного пика, т.к. теоретически глобальный максимум на карте откликов может быть просто 1 пикселем шумом.

     

    Есть еще такая штука как уточнение пика

    https://github.com/opencv/opencv/blob/0e4dde1781d6439eb5377e22208a0eb6f6cd404e/modules/imgproc/src/phasecorr.cpp#L562


  4. На любой чих вам придётся писать свой loss или свой layer и надо подумать на чем вы это сможете сделать.

     

    Тут  есть неплохое сравнение

    http://cs231n.stanford.edu/slides/2016/winter1516_lecture12.pdf

    Caffe не нравится тем ,что python api без нормальной документации. Куча библиотек-зависимостей не весело деплоить и интегрировать в С++ проект. Не удобно править prototxt (6к строк для ResNet), можно дефайнить сеть в питоне только через дурацкие трюки.

    Так же говорят что в Caffe свертка не оптимальна по памяти.

    https://github.com/Yangqing/caffe/wiki/Convolution-in-Caffe:-a-memo

     

    Кто то сравнивал какой нибудь AlexNet на Caffe/Tensorflow по скорости?

    Тут не очень понятно т.к. есть только Caffe(native)

    https://github.com/soumith/convnet-benchmarks

    Мои результаты:

    https://github.com/mrgloom/kaggle-dogs-vs-cats-solution

     

    P.s. можете порыться тут

    https://github.com/mrgloom/Semantic-Segmentation-Evaluation

     

     

     

    • Like 1

  5. Ну например какой нибудь dating service где у нас связь user-user надо предсказать like\dislike.

    Хотя может быть можно свести эту задачу к задаче классификации (или как задачу регрессии - предсказывать 'силу' лайка) типа concatenate(feature_vector1,feature_vector2)->{0,1}, но в таком случае проблема, что так придётся прогнать всё пары user-user.


  6. Допустим есть некий стандартный pipeline HOG+LinearSVM, там мы ищем на нескольких скейлах и потом мерджим ректы через non-maxima supression.

    Но если посмотреть на это с другой стороны то на каждом уровне мы имеем некую карту откликов - назовем её heatmap, можно ли как то замерджить эти heatmap'ы? Т.е. на выходе у нас по идее будет 1 heatmap и на его базе мы уже построим ректы.


  7. Есть стандартные рекомендательные системы типа Netflix, где мы имеем user-movie и надо предсказать rating который user поставит movie, получается такая sparse matrix отсюда много методов пляшет.

     

    А что если у нас есть например user-item, где user описывается feature vector 1, а item через feature vector 2 и надо предсказать бинарное событие да-нет, как такой тип рекомендательной системы называется?


  8. >А что за информация в skin_no_skin.txt?

    https://github.com/mrgloom/Simple-skin-detection/blob/master/tree/tree.py#L10

    Data in format [B G R Label]

     

     

    Тут пишут про размер входных изображений 600×800 http://xiaoyongshen.me/webpage_portrait/index.html

     

    Matting как я понял не обязателен, он дополнительно даёт 'мягкие' границы на пушистых объектах типа волос и т.д.

     

     

    p.s. векторизация и оверсегментация это другая задача.


  9. Вопрос в том на сколько изменяется бэкграунд и насколько он совпадает с одеждой, а так да это очень простой подход.

    Имеется ввиду делить на 2 класса background/foreground, а не skin/non-skin.


  10. Секция floodfill

    Цитата

    С помощью FloodFill (заливка или метод «наводнения») можно выделить однородные по цвету регионы. Для этого нужно выбрать начальный пиксель и задать интервал изменения цвета соседних пикселей относительно исходного

    https://habrahabr.ru/company/intel/blog/266347/

     

    т.е. в floodfill используется просто < max pixel difference или попадание в range который видимо строится на базе изначального seed'a.

     

    А вам надо в каждом окошке свой порог?

     

    Какая изначальная задача уточнить границу?


  11. Хм, мне тут сказали, что forward pass блокирует GPU (где найти подтверждение или опровержение?), т.е. второй поток будет ждать пока первый поток не сделает forward pass, но даже в таком случае выгода по идее есть, т.к. мы пока 1 поток работает загрузили батч со второго на GPU.

     

    А вот кстати по теме:

    https://habrahabr.ru/post/307140/

    • Like 1
×