Smorodov 579 Жалоба Опубликовано June 23, 2016 Вышла четвертая версия DIGITS с возможностью учить детекторы: https://github.com/NVIDIA/DIGITS/tree/master/examples/object-detection#preparing-the-data Только что за формат KITTI там не очень ясно написано. Понятно что отсюда: http://www.cvlibs.net/datasets/kitti/ но что то я там не нашел описания форматов. Возможно этот пойдет, но он вроде для видео: https://motchallenge.net/instructions/ UPD: Нашел ссылки на датасеты: http://www.cvlibs.net/datasets/kitti/raw_data.php Похоже аннотация у них называется tracklets, и идет в xml формате. Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
BeS 53 Жалоба Опубликовано June 23, 2016 А что за сетки у них для детекшена используются? SSD, или что-то RCNN-подобное? Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
Smorodov 579 Жалоба Опубликовано June 23, 2016 Там по ссылке на github есть схема, что то монструозное используется. https://github.com/NVIDIA/DIGITS/blob/master/examples/object-detection/detectnet.jpg Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
BeS 53 Жалоба Опубликовано June 24, 2016 Развесистая сетка в начале - это GoogLeNet, а на выходе очень похоже на Single Shot Multibox Detector...прикольно, раньше народ SSD только с VGG16 тренировал...если с GoogLeNet'ом оно нормально тренируется, то по идее должно раз в 10 быстрее работать чем статейная имплементация Быстро однако RCNN устарели) Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах
mrgloom 242 Жалоба Опубликовано August 31, 2016 Тут подробнее расписано GoogleLeNet FCN https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/ Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах