Smorodov 576 Report post Posted June 23, 2016 Вышла четвертая версия DIGITS с возможностью учить детекторы: https://github.com/NVIDIA/DIGITS/tree/master/examples/object-detection#preparing-the-data Только что за формат KITTI там не очень ясно написано. Понятно что отсюда: http://www.cvlibs.net/datasets/kitti/ но что то я там не нашел описания форматов. Возможно этот пойдет, но он вроде для видео: https://motchallenge.net/instructions/ UPD: Нашел ссылки на датасеты: http://www.cvlibs.net/datasets/kitti/raw_data.php Похоже аннотация у них называется tracklets, и идет в xml формате. Share this post Link to post Share on other sites
BeS 53 Report post Posted June 23, 2016 А что за сетки у них для детекшена используются? SSD, или что-то RCNN-подобное? Share this post Link to post Share on other sites
Smorodov 576 Report post Posted June 23, 2016 Там по ссылке на github есть схема, что то монструозное используется. https://github.com/NVIDIA/DIGITS/blob/master/examples/object-detection/detectnet.jpg Share this post Link to post Share on other sites
BeS 53 Report post Posted June 24, 2016 Развесистая сетка в начале - это GoogLeNet, а на выходе очень похоже на Single Shot Multibox Detector...прикольно, раньше народ SSD только с VGG16 тренировал...если с GoogLeNet'ом оно нормально тренируется, то по идее должно раз в 10 быстрее работать чем статейная имплементация Быстро однако RCNN устарели) Share this post Link to post Share on other sites
mrgloom 242 Report post Posted August 31, 2016 Тут подробнее расписано GoogleLeNet FCN https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/ Share this post Link to post Share on other sites