Перейти к содержимому
Compvision.ru

mrgloom

Пользователи
  • Количество публикаций

    2 302
  • Зарегистрирован

  • Посещение

  • Days Won

    142

Все публикации пользователя mrgloom

  1. Undersampling, oversampling, добавить веса к апдейту градиента обратно пропорционально кол-ву сэмплов.
  2. секция pedestrian detection http://rodrigob.github.io/are_we_there_yet/build/
  3. Надо узнать какой формат передаваемых данных BGR, RGB, RGBA или какой то другой или может быть там не так упаковано как ожидает OpenCV.
  4. А, чёрт, там все равно через регистрацию, раньше ссылок просто не было вообще. Да, тут скорее только через официальное письмо от института. И тем более я так понимаю там лейблов нету. Можно еще граббер для VK/FB написать.
  5. Или так http://megaface.cs.washington.edu/
  6. caffe cpu

    Эпохи задаются только через DIGITS? или это вы примерно посчитали n_iter*batch_size/train_size
  7. caffe cpu

    это что значит эпох? там вроде в терминах итераций задается. типа # The maximum number of iterations max_iter: 20000
  8. caffe cpu

    Я подразумеваю те настройки которые в protobuf. https://drive.google.com/file/d/0B88eZEyituf8YUlROE5oZWpXSkE/ Они вроде как отличаются немного от тех что лежат у стандартного caffe https://github.com/BVLC/caffe/tree/master/examples/mnist
  9. caffe cpu

    ну меня всё равно порадовало, что на моем железе GPU даёт прирост в ~x15. да и на хабре использовали ноутбучную видеокарту NVIDIA GeForce GT 540M. Сколько же занимает прогон MNIST на современных видеокартах, может кто то попробовать? (можно даже и не под виндой, а взять protobuf и данные из вышеобозначенного архива) Попробую собрать полноценно через https://github.com/willyd/caffe-builder
  10. caffe cpu

    Протестировал виндовую сборку отсюда https://github.com/niuzhiheng/caffe на MNIST https://dl.dropboxusercontent.com/u/3466743/caffe-vs2012/standalone.7z Тут только то что нужно для MNIST бенчмарка https://drive.google.com/file/d/0B88eZEyituf8YUlROE5oZWpXSkE/ У меня получилось на GPU(GeForce GTX 460) 10 мин, на CPU(Core 2 Duo E8500) 2.5 часа. Что расходится с тем, что писали тут http://habrahabr.ru/company/itseez/blog/254747/ Интересно посмотреть что выдадут видеокарты получше. 1. Не очень понятно что такое train_net.exe, т.к. обычно запуск происходит типа caffe train -solver examples/mnist/lenet_solver.prototxt т.е. я пока не проверил полноценный ли это caffe бинарник или что то вшито внутри. 2. В CPU моде задействовано только 1 ядро и не факт что там самый быстрый BLAS залинкован. 3. Данные хранятся в виде папок mnist-train-leveldb и mnist-test-leveldb что за формат я так и не понял, это и есть leveldb? 4. В системе находятся несколько версий cublas*.dll и т.д. нормально ли это? (рядом с данной сборкой лежит cublas64_55.dll, рядом с матлабом R2012a cublas64_40_17.dll, рядом с свежеустановленным CUDA Toolkit 7.5 cublas64_75.dll) Конечно встаёт резонный вопрос, а нужно ли насиловать труп, но такая сборка бинарником могла бы пригодится для дистрибьюции на windows машины хотя бы для бенчмарка разных видеокарт, коих в обилии на игровых windows машинах.
  11. Еще есть слабая идея - сделать простой детектор кожи типа такого и потом обвести блоб головы ректом и подать в grabcut, но это только для лица \ головы. А так да семантическая сегментация https://github.com/mrgloom/Semantic-Segmentation-Evaluation Можно начать с чего то типа textonboost, там в C# коде нету CRF, и я не прикидывал что там будет по памяти при использовании большого датасета, но запускается он довольно легко без какой либо установки. http://jamie.shotton.org/work/code.html http://www.slideshare.net/LiloSEA/ss-3591886 По поводу большого файла можно .torrent файл создать и раздать и вроде как не обязательно через трекер.
  12. https://github.com/MasteringOpenCV/code/tree/master/Chapter8_FaceRecognition По всей видимости тут используются классически PCA и LDA и они не предусматривают пересчета базиса. По сути вы можете добавлять и удалять новые ID пользователей и искать их в "старом базисе", возможно старый базис будет достаточно хорош это надо проверить. Есть методы которые позволяют делать апдейт базиса типа incremental / online pca, но насколько это будет лучше надо тестировать, т.к. базис выученный этими методами по идее "сходится" к базису выученному на полной выборке.
  13. не увидел у WIDERFace разметку точками в описании. у CACD разметка получена через intraface (раньше его можно было скачать вроде как ) и непонятно они проверяли потом разметку вручную или в слепую просто прогнали алгоритм.
  14. Давно появилась идея бенчмарка, если есть что то еще по датасетам, подходам\либам, метриках \ правильных методах тестирвоания можете прокоментить тут \ там на гитхабе. https://github.com/mrgloom/Face-landmarks-detection-benchmark
  15. Интересная особенность, есть какое то официальное описание этой проблемы? Кстати tesla карточки имеют ECC memory, но вроде как эти проверки обычно отключают чтобы получить еще немного производительности.
  16. Различие между OpenCV 2.4.11 и OpenCV 2.4.3

    http://code.opencv.org/projects/opencv/wiki/ChangeLog есть ли что то более детальное?
  17. https://github.com/zer0n/deepframeworks#modeling-capability субьективное сравнение
  18. Вышла OpenCV 3.1

    а расшифровка есть? например что входит в “Improved Deformable Part-based Models” ?
  19. Калибровка цветов на экране

    есть специальные приборы google-> monitor calibration device
  20. Где то на форуме уже обсуждались инструменты для разметки: https://cvhci.anthropomatik.kit.edu/~baeuml/projects/a-universal-labeling-tool-for-computer-vision-sloth/
  21. Тут сложнее получается с совместимостью, т.к. это же просто лоудер надо для весов, а еще заимплементить все типы слоёв, да и еще чтобы они работали одинаково в итоге. шутка на тему того что так много библиотек https://github.com/culurciello/kixAzzML
  22. Классификация контуров

    куча данных по теме, правда без разметки https://www.kaggle.com/c/diabetic-retinopathy-detection haartraining, он же adaboost можно прикрутить, беря пиксель и вокруг него патч-окрестность, но насколько это будет работать это вопрос. Какое то есть готовое решение для этих задач на CNN? Хотелось бы еще посмотреть на разметку, т.е. как это человек разметит.
  23. Переставляем лица на фотках.

    Тут в конце темы я писал про seamlessClone а так же про то что он использует solve для dense матриц, что не оптимально. Например библиотека Eigen может работать с sparse матрицами и будет работать быстрее, другое дело что вышеобозначенное решение позиционируется полностью на питоне( кроме stasm_util, но по идее можно было бы использовать PyStasm, но он походу кривой) и вообще говоря странно, что специализированное решение pyamg медленей (видимо потому что там только питоновский код). можете им зарепортить, что Opencv версия быстрее. https://github.com/alyssaq/face_morpher/issues п.с. левый результат лучше выглядит, т.к. правый глаз залит меньше рыжим краевым условием от волос.
  24. неплохая реализация Adaboost на матлабе тут, там еще разные версии Real AdaBoost, Gentle AdaBoost, Modest AdaBoost и т.д. http://graphics.cs.msu.ru/ru/science/research/machinelearning/adaboosttoolbox последнюю версию можно скачать отсюда: http://groups.inf.ed.ac.uk/calvin/hp_avezhnev/#code а еще есть xgboost, но это не совсем то, а gradient boosting. https://github.com/dmlc/xgboost
  25. Это называется fine tuning http://caffe.berkeleyvision.org/gathered/examples/finetune_flickr_style.html Но проще всего взять выход 4096 как фичи и использовать его как вход для любого классификатора для регрессии или классификации. https://github.com/coreylynch/vgg-19-feature-extractor попытаюсь в ближайшее время сделать такой пример, хочу попробовать на для cifar или для классификации текстур.
×