Перейти к содержимому
Compvision.ru

mrgloom

Пользователи
  • Количество публикаций

    2 302
  • Зарегистрирован

  • Посещение

  • Days Won

    142

Все публикации пользователя mrgloom

  1. Если я ставлю export OPENBLAS_NUM_THREADS=4 Потом захожу в top и нажимаю 'H', то сначала вроде появляется больше одного вхождения программы, но потом остаётся только 1 с загрузкой 100%. top -H -p <PID> показывает 12 строчек как и ps -T -p <PID> если использовать export OPENBLAS_NUM_THREADS=1 , то 9 строчек. Треды создаются, но не используются?
  2. http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/histogram_comparison/histogram_comparison.html
  3. Что за экзотическое задание? Скорее всего отличаются цвета - самое простое можно попробовать сравнивать по гистограмме. А так же скорее всего в мультфильмах мало высоких частот.
  4. >У нас свертки 3D Можно сделать 1 3D свертку вместо k 2D ? Или имеется ввиду что то другое? >Не совсем так: у нас есть сверточный слой с, например, 5 нейронами, где каждый нейрон генерирует один из выходных каналов не понял что тут имеется ввиду под 5 нейронами. Вот тут допустим на стр 7 Fig. 2 http://yann.lecun.com/exdb/publis/pdf/lecun-01a.pdf Изначально у нас одноканальная картинка 32x32 после первого conv слоя у нас 6 feature maps с размером 28x28, это значит что мы применили 6 кернелов? Если бы у нас была картинка 3-х канальная, то на втором слое мы бы получили ту же размерность 6@28x28? Почему если у нас картинка 3-х канальная кернелы не 3-х канальные? И как тогда визуализация кернелов получается цветная?
  5. Выбор камеры

    Да несколько изображений с камеры при разном освещении.
  6. Я не имел ввиду что всего 1 ядро или 1 тип ядра, просто привёл пример для применения 1 ядра. Как я понимаю на входе у нас изображение W x H x C (ширина, высота, кол-во каналов) далее у нас K ядер, а на выходе мы получаем блоб W1 x H1 x K (новая ширина, новая высота, кол-во ядер) Просто мне показалось странным что результаты суммируются, единственный ли это возможный вариант? И если еще абстрактнее посмотреть, почему у нас свёртки 2D ? расширяется ли это до ND?
  7. http://stackoverflow.com/questions/27728531/convolutional-neural-networks-multiple-channels То что результаты свёртки с одним ядром для всех каналов просто складываются это какой то хак или в этом есть какой то глубокий смысл? А так же что если у нас будет RGB + depth, depth канал нужно будет как то нормировать \ "приводить к общему знаменателю" с остальными RGB каналами или так же ничего не меняется?
  8. SegNet

    Почему не хотите просто сделать ресайз? из-за появления зубчатой границы? С такими большими изображениями скорее всего никакой памяти не хватит на GPU то точно. https://github.com/alexgkendall/caffe-segnet/issues/35 Неплохо было бы вывести формулу по которой рассчитывается кол-во памяти нужное для тренировки сети в зависимости от размера изображения, но я пока до конца не понимаю как в caffe юзается память. По поводу изменения размера изображения, просто так не получится надо будет менять upsample_h, upsample_w в .prototxt модели. Пример где я переделал под размер 240 x 180 вроде. https://gist.github.com/mrgloom/f0972272938adfc44163 Пример для 1 слоя https://github.com/mrgloom/Caffe-snippets/blob/master/segnet_simple_train.prototxt
  9. Выбор камеры

    У меня где то такая же валяется Может это http://electronics.stackexchange.com/questions/69882/disabling-the-camera-auto-white-balance p.s. неплохо было бы фото приложить.
  10. Можно посмотреть чем блокируется файл. http://superuser.com/questions/117902/find-out-which-process-is-locking-a-file-or-folder-in-windows
  11. Можно ли собрать caffe на mingw? По идее есть cmake проекты для сборки и им должно быть всё равно какой компилятор. тут https://github.com/willyd/caffe-builder если использовать то ругается на некий cl который видимо часть VS, видимо как то скрипты заточены под VS? тут http://caffe.berkeleyvision.org/installation.html#cmake-build зависимости не собираются сами, возможно ли написать cmake скрипт чтобы он скачивал так же сорцы и cmake скрипты для зависимостей проекта и собирал всё сразу?
  12. https://ru.wikipedia.org/wiki/MinGW а на википедии написано компилятор ) это Cygwin за собой что то тащит типа "среды" которая в cygwin1.dll
  13. Реализация SVM в OpenCV

    Как TermCriteria влияет на скорость обучения SVM? Так же всегда ли чем больше параметр C у линейного SVM тем быстрее учится? По всей видимости OpenCV использует не просто wrapper вокруг libsvm, а имеет свой solver CvSVMSolver::solve_generic ? https://github.com/Itseez/opencv/blob/2.4/modules/ml/src/svm.cpp
  14. А почему не поддерживает? т.к. cuda .dll собраны для VS? Вообщем caffe-builder из коробки не поддерживает MinGW https://github.com/willyd/caffe-builder/issues/28
  15. Там детектирование точек лица, а не просто рамка, такие алгоритмы уже были, причем наложение лиц поверх тоже уже было. Ссылку на видео сейчас не смог найти, кстати Smorodov выкладывал что то похожее на форуме.
  16. Потому что low level features для всех классов одинаковые и на большой разнообразной выборке они получаются хорошие\репрезентативные.
  17. Метод опорных векторов

    Я это понимаю так, что задаётся некая ф-ия минимизации ( convex optimization problem ), а потом она уже специальными методами решается. Даже для Linear SVM бывают разные подвиды с регуляризацией L1, L2, Lasso и т.д. https://www.csie.ntu.edu.tw/~cjlin/liblinear/ И да веса линейной модели(W,b) можно получить не только через Linear SVM. SVM это так называемый maximum margin classifier. https://habrahabr.ru/post/278513/ Заодно и регрессия https://habrahabr.ru/post/279117/
  18. SegNet

    Check failed: error == cudaSuccess (8 vs. 23) Может быть нехватка gpu памяти, поставьте там cpu mode.
  19. Не пробовал, но вот что выдаёт гугл https://gist.github.com/senbon/70adf5410950c0dc882b
  20. Смотря куда подавать Можно попробовать вот это (в итоге у меня получилось запустить сеть в 1 decoder-encoder слой) там надо подавать одноканальную .png картинку с лейблами (0,1,2, ....n) и сам .protobuf поменять под кол-во классов.
  21. Есть какие либо бесплатные инструменты для дорисовки Depth Map? типа такого http://3dstereophoto.blogspot.ru/2014_02_01_archive.html
  22. что такое PBTT ? я правда по RNN только это читал http://karpathy.github.io/2015/05/21/rnn-effectiveness/ она там дает пример на 100 строк https://gist.github.com/karpathy/d4dee566867f8291f086 не знаю правда насколько кардинально это отличается от этого https://github.com/karpathy/char-rnn
×