Smorodov

Главные администраторы
  • Количество публикаций

    3 537
  • Зарегистрирован

  • Посещение

  • Days Won

    285

Smorodov last won the day on March 24

Smorodov had the most liked content!

Репутация

501 Эксперт

4 подписчика

О Smorodov

  • Звание
    Администратор
  • День рождения 04.02.1978

Profile Information

  • Пол
    Мужской
  • Расположение
    Ленинградская область, п. Вырица.

Посетители профиля

7 299 просмотров профиля
  1. Начните с этого примера: https://github.com/BVLC/caffe/blob/master/examples/cpp_classification/classification.cpp там тоже изображения, но можно ведь просто подавать изображения с видео и классифицировать.
  2. Ну, я так полагаю что все что угодно, лишь бы в 3D массив ложилось. Там же датумы кладутся в базу, а каждый датум знает свои размеры (W,H,C). Другое дело как нейронке скармливать данные одного сета с разными размерами. Еще помнится там какая-то ерунда с выделением памяти была, что надо заранее готовить огромный кусок, (в LMDB есть константа по этому поводу) у меня база около 2GB была все поместилось. Но это уже только формирования LMDB ручками касается.
  3. Нет, там координаты. На входе картинки, на выходе координаты. Там просто две LMDB-хи в одной изображения, в дркгой координаты ландмарков, я задал блобы с плавающей точкой, поэтому можно пихать что угодно.
  4. Делал детектор ландмарков глаз, для Keras, выглядело как то так: EyeLandmarksKeras.py, я делал базу данных кофейно-совместимой, поэтому там caffe включен, думается что должно и без него работать.
  5. Каждые N итераций, прогоняется тестовая выборка. Да вроде задается в solver.prototxt, но точно не скажу, давно не запускал caffe из командной строки. Обучал с основном через DIGITS.
  6. Обычно, когда точность на тестовой выборке идет вниз, а точность на обучающей вверх, тогда пора остановиться, ну или или когда точность на тестовой выборке перестала расти.
  7. Можно на хабре, например: https://habrahabr.ru/company/recognitor/blog/277781/ Ну и поиск в гугле по "habrahabr сверточная сеть", выдаст много материала на русском.
  8. Еще одна сетка из последних (Mask R-CNN): https://arxiv.org/pdf/1703.06870.pdf Из поста google группы: "Facebook can do image segmentation which is essentially the ground truth now, using Mask R-CNN. And they can do it at 5 fps with code not optimised for speed. " Without tricks, Mask R-CNN outperforms all existing, single-model entries on every (COCO) task, including the COCO 2016 challenge winners."" Обещают исходники выложить.
  9. Датасет можно взять здесь: http://www.robots.ox.ac.uk/~vgg/data/hands/ вроде неплохой. По поводу сети, здесь не все так тривиально, придется поизучать фреймворки (caffe, tensorflow, keras, ... ), лучше всего они сопряжены с питоном. Но у TF и caffe есть примеры сопряжения с CPP. И нужно отделить обучение сети от ее реализации в программе.
  10. Можно еще Keras рассмотреть как упрощение к TF. Google вроде его хочет встроить в TF : http://www.fast.ai/2017/01/03/keras/
  11. Нашел хорошую либу (CPU) (headers only), здесь пишут что быстрее NPP-шной реализации. Взять можно здесь: http://www.gridcut.com/downloads.php . Бесплатна для некоммерческого использования. Проверил, примеры собираются без танцев, есть мультилейбл:
  12. А гороскоп с магнетометром чем плохи ?
  13. Из CUDA 8 убрали grab cut, на седьмую возвращаться не хочется, кто нибудь встречал вменяемую реализацию ?
  14. Вот эта штука умеет искать по штрих коду в google: https://play.google.com/store/apps/details?id=com.google.zxing.client.android&hl=ru и вот эта (правда она использует внешний детектор кодов, например тот что выше) и умеет искать по внешнему виду упаковки тоже: https://play.google.com/store/apps/details?id=com.google.android.apps.unveil&hl=ru Плюс встречал сканеры акцизных марок, и винных этикеток с отзывами о винах.
  15. Если бы все было так просто, то не было бы огрмной кучи алгоритмов вычитания фона: https://www.behance.net/gallery/3943089/BGS-Library-A-Background-Subtraction-Library , а они есть, ибо снег, дождь, туман, тени, листья, трава, пыль, солнечный свет, который постоянно меняется, шум в сеноре камеры, ветер качающий камеру.... не дают делать простые алгоримы.