mrgloom

Пользователи
  • Количество публикаций

    2 168
  • Зарегистрирован

  • Посещение

  • Days Won

    125

mrgloom last won the day on March 22

mrgloom had the most liked content!

Репутация

229 Эксперт

О mrgloom

  • Звание
    Эксперт

Contact Methods

  • ICQ
    0
  1. в caffe нету early stopping из коробки, если речь об этом. https://deeplearning4j.org/earlystopping
  2. По сжатию: accuracy тоже падает? вот кстати такая штука от NVIDIA наверно тоже сжимает\квантизирует. https://developer.nvidia.com/tensorrt
  3. На любой чих вам придётся писать свой loss или свой layer и надо подумать на чем вы это сможете сделать. Тут есть неплохое сравнение http://cs231n.stanford.edu/slides/2016/winter1516_lecture12.pdf Caffe не нравится тем ,что python api без нормальной документации. Куча библиотек-зависимостей не весело деплоить и интегрировать в С++ проект. Не удобно править prototxt (6к строк для ResNet), можно дефайнить сеть в питоне только через дурацкие трюки. Так же говорят что в Caffe свертка не оптимальна по памяти. https://github.com/Yangqing/caffe/wiki/Convolution-in-Caffe:-a-memo Кто то сравнивал какой нибудь AlexNet на Caffe/Tensorflow по скорости? Тут не очень понятно т.к. есть только Caffe(native) https://github.com/soumith/convnet-benchmarks Мои результаты: https://github.com/mrgloom/kaggle-dogs-vs-cats-solution P.s. можете порыться тут https://github.com/mrgloom/Semantic-Segmentation-Evaluation
  4. Так в итоге у нас всё равно скользящее окно? или мы ищем локальные максимумы типа http://stackoverflow.com/questions/3684484/peak-detection-in-a-2d-array Только у нас в 3D.
  5. Мы хотим мерить не их похожесть, а то что один юзер лайкнет другого user1-user2->{0|1} (кстати не обязательно user2->user1 будет тоже самое).
  6. Ну например какой нибудь dating service где у нас связь user-user надо предсказать like\dislike. Хотя может быть можно свести эту задачу к задаче классификации (или как задачу регрессии - предсказывать 'силу' лайка) типа concatenate(feature_vector1,feature_vector2)->{0,1}, но в таком случае проблема, что так придётся прогнать всё пары user-user.
  7. Допустим есть некий стандартный pipeline HOG+LinearSVM, там мы ищем на нескольких скейлах и потом мерджим ректы через non-maxima supression. Но если посмотреть на это с другой стороны то на каждом уровне мы имеем некую карту откликов - назовем её heatmap, можно ли как то замерджить эти heatmap'ы? Т.е. на выходе у нас по идее будет 1 heatmap и на его базе мы уже построим ректы.
  8. Есть стандартные рекомендательные системы типа Netflix, где мы имеем user-movie и надо предсказать rating который user поставит movie, получается такая sparse matrix отсюда много методов пляшет. А что если у нас есть например user-item, где user описывается feature vector 1, а item через feature vector 2 и надо предсказать бинарное событие да-нет, как такой тип рекомендательной системы называется?
  9. https://www.stereolabs.com/ Как узнать какая дальность для восстановления depth map у этой камеры? зависит ли от расстояния между камерами?
  10. >А что за информация в skin_no_skin.txt? https://github.com/mrgloom/Simple-skin-detection/blob/master/tree/tree.py#L10 Data in format [B G R Label] Тут пишут про размер входных изображений 600×800 http://xiaoyongshen.me/webpage_portrait/index.html Matting как я понял не обязателен, он дополнительно даёт 'мягкие' границы на пушистых объектах типа волос и т.д. p.s. векторизация и оверсегментация это другая задача.
  11. https://github.com/alexgkendall/caffe-segnet/issues/37 f(class) = frequency(class) / (image_count(class) * 480*360) weight(class) = median of f(class)) / f(class)
  12. Вопрос в том на сколько изменяется бэкграунд и насколько он совпадает с одеждой, а так да это очень простой подход. Имеется ввиду делить на 2 класса background/foreground, а не skin/non-skin.
  13. Можно тупо попиксельную классификацию попробовать. Репа несколько не доделанная: https://github.com/mrgloom/Simple-skin-detection Датасет есть?
  14. Секция floodfill https://habrahabr.ru/company/intel/blog/266347/ т.е. в floodfill используется просто < max pixel difference или попадание в range который видимо строится на базе изначального seed'a. А вам надо в каждом окошке свой порог? Какая изначальная задача уточнить границу?