mrgloom
Пользователи-
Количество публикаций
2 302 -
Зарегистрирован
-
Посещение
-
Days Won
142
Все публикации пользователя mrgloom
-
Тренировка сетей на разбалансированных базах
mrgloom replied to BeS's topic in Вопросы по нейросетям и ИИ
Undersampling, oversampling, добавить веса к апдейту градиента обратно пропорционально кол-ву сэмплов. -
Поиск объектов с помощью нейросети
mrgloom replied to APXANGEL's topic in Вопросы по нейросетям и ИИ
секция pedestrian detection http://rodrigob.github.io/are_we_there_yet/build/ -
Надо узнать какой формат передаваемых данных BGR, RGB, RGBA или какой то другой или может быть там не так упаковано как ожидает OpenCV.
-
А, чёрт, там все равно через регистрацию, раньше ссылок просто не было вообще. Да, тут скорее только через официальное письмо от института. И тем более я так понимаю там лейблов нету. Можно еще граббер для VK/FB написать.
-
Или так http://megaface.cs.washington.edu/
-
Эпохи задаются только через DIGITS? или это вы примерно посчитали n_iter*batch_size/train_size
-
это что значит эпох? там вроде в терминах итераций задается. типа # The maximum number of iterations max_iter: 20000
-
Я подразумеваю те настройки которые в protobuf. https://drive.google.com/file/d/0B88eZEyituf8YUlROE5oZWpXSkE/ Они вроде как отличаются немного от тех что лежат у стандартного caffe https://github.com/BVLC/caffe/tree/master/examples/mnist
-
ну меня всё равно порадовало, что на моем железе GPU даёт прирост в ~x15. да и на хабре использовали ноутбучную видеокарту NVIDIA GeForce GT 540M. Сколько же занимает прогон MNIST на современных видеокартах, может кто то попробовать? (можно даже и не под виндой, а взять protobuf и данные из вышеобозначенного архива) Попробую собрать полноценно через https://github.com/willyd/caffe-builder
-
Протестировал виндовую сборку отсюда https://github.com/niuzhiheng/caffe на MNIST https://dl.dropboxusercontent.com/u/3466743/caffe-vs2012/standalone.7z Тут только то что нужно для MNIST бенчмарка https://drive.google.com/file/d/0B88eZEyituf8YUlROE5oZWpXSkE/ У меня получилось на GPU(GeForce GTX 460) 10 мин, на CPU(Core 2 Duo E8500) 2.5 часа. Что расходится с тем, что писали тут http://habrahabr.ru/company/itseez/blog/254747/ Интересно посмотреть что выдадут видеокарты получше. 1. Не очень понятно что такое train_net.exe, т.к. обычно запуск происходит типа caffe train -solver examples/mnist/lenet_solver.prototxt т.е. я пока не проверил полноценный ли это caffe бинарник или что то вшито внутри. 2. В CPU моде задействовано только 1 ядро и не факт что там самый быстрый BLAS залинкован. 3. Данные хранятся в виде папок mnist-train-leveldb и mnist-test-leveldb что за формат я так и не понял, это и есть leveldb? 4. В системе находятся несколько версий cublas*.dll и т.д. нормально ли это? (рядом с данной сборкой лежит cublas64_55.dll, рядом с матлабом R2012a cublas64_40_17.dll, рядом с свежеустановленным CUDA Toolkit 7.5 cublas64_75.dll) Конечно встаёт резонный вопрос, а нужно ли насиловать труп, но такая сборка бинарником могла бы пригодится для дистрибьюции на windows машины хотя бы для бенчмарка разных видеокарт, коих в обилии на игровых windows машинах.
-
Еще есть слабая идея - сделать простой детектор кожи типа такого и потом обвести блоб головы ректом и подать в grabcut, но это только для лица \ головы. А так да семантическая сегментация https://github.com/mrgloom/Semantic-Segmentation-Evaluation Можно начать с чего то типа textonboost, там в C# коде нету CRF, и я не прикидывал что там будет по памяти при использовании большого датасета, но запускается он довольно легко без какой либо установки. http://jamie.shotton.org/work/code.html http://www.slideshare.net/LiloSEA/ss-3591886 По поводу большого файла можно .torrent файл создать и раздать и вроде как не обязательно через трекер.
-
https://github.com/MasteringOpenCV/code/tree/master/Chapter8_FaceRecognition По всей видимости тут используются классически PCA и LDA и они не предусматривают пересчета базиса. По сути вы можете добавлять и удалять новые ID пользователей и искать их в "старом базисе", возможно старый базис будет достаточно хорош это надо проверить. Есть методы которые позволяют делать апдейт базиса типа incremental / online pca, но насколько это будет лучше надо тестировать, т.к. базис выученный этими методами по идее "сходится" к базису выученному на полной выборке.
-
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
mrgloom replied to Smorodov's topic in Обсуждение общих вопросов
не увидел у WIDERFace разметку точками в описании. у CACD разметка получена через intraface (раньше его можно было скачать вроде как ) и непонятно они проверяли потом разметку вручную или в слепую просто прогнали алгоритм. -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
mrgloom replied to Smorodov's topic in Обсуждение общих вопросов
Давно появилась идея бенчмарка, если есть что то еще по датасетам, подходам\либам, метриках \ правильных методах тестирвоания можете прокоментить тут \ там на гитхабе. https://github.com/mrgloom/Face-landmarks-detection-benchmark -
энергозатраты при обучении глубоких моделей
mrgloom replied to BeS's topic in Вопросы по нейросетям и ИИ
Интересная особенность, есть какое то официальное описание этой проблемы? Кстати tesla карточки имеют ECC memory, но вроде как эти проверки обычно отключают чтобы получить еще немного производительности.- 17 replies
-
- нейронные сети
- deep learning
-
(и ещё %d)
Теги:
-
http://code.opencv.org/projects/opencv/wiki/ChangeLog есть ли что то более детальное?
-
Computational Network Toolkit (CNTK)
mrgloom replied to Smorodov's topic in Вопросы по нейросетям и ИИ
https://github.com/zer0n/deepframeworks#modeling-capability субьективное сравнение- 8 replies
-
- 1
-
- deep learning
- neural networks
-
(и ещё %d)
Теги:
-
а расшифровка есть? например что входит в “Improved Deformable Part-based Models” ?
-
есть специальные приборы google-> monitor calibration device
-
Где то на форуме уже обсуждались инструменты для разметки: https://cvhci.anthropomatik.kit.edu/~baeuml/projects/a-universal-labeling-tool-for-computer-vision-sloth/
- 1 reply
-
- 1
-
Computational Network Toolkit (CNTK)
mrgloom replied to Smorodov's topic in Вопросы по нейросетям и ИИ
Тут сложнее получается с совместимостью, т.к. это же просто лоудер надо для весов, а еще заимплементить все типы слоёв, да и еще чтобы они работали одинаково в итоге. шутка на тему того что так много библиотек https://github.com/culurciello/kixAzzML- 8 replies
-
- deep learning
- neural networks
-
(и ещё %d)
Теги:
-
куча данных по теме, правда без разметки https://www.kaggle.com/c/diabetic-retinopathy-detection haartraining, он же adaboost можно прикрутить, беря пиксель и вокруг него патч-окрестность, но насколько это будет работать это вопрос. Какое то есть готовое решение для этих задач на CNN? Хотелось бы еще посмотреть на разметку, т.е. как это человек разметит.
-
Тут в конце темы я писал про seamlessClone а так же про то что он использует solve для dense матриц, что не оптимально. Например библиотека Eigen может работать с sparse матрицами и будет работать быстрее, другое дело что вышеобозначенное решение позиционируется полностью на питоне( кроме stasm_util, но по идее можно было бы использовать PyStasm, но он походу кривой) и вообще говоря странно, что специализированное решение pyamg медленей (видимо потому что там только питоновский код). можете им зарепортить, что Opencv версия быстрее. https://github.com/alyssaq/face_morpher/issues п.с. левый результат лучше выглядит, т.к. правый глаз залит меньше рыжим краевым условием от волос.
-
неплохая реализация Adaboost на матлабе тут, там еще разные версии Real AdaBoost, Gentle AdaBoost, Modest AdaBoost и т.д. http://graphics.cs.msu.ru/ru/science/research/machinelearning/adaboosttoolbox последнюю версию можно скачать отсюда: http://groups.inf.ed.ac.uk/calvin/hp_avezhnev/#code а еще есть xgboost, но это не совсем то, а gradient boosting. https://github.com/dmlc/xgboost
-
Это называется fine tuning http://caffe.berkeleyvision.org/gathered/examples/finetune_flickr_style.html Но проще всего взять выход 4096 как фичи и использовать его как вход для любого классификатора для регрессии или классификации. https://github.com/coreylynch/vgg-19-feature-extractor попытаюсь в ближайшее время сделать такой пример, хочу попробовать на для cifar или для классификации текстур.