Ищу в потоке машин пластины номеров. нахожу обученным каскадом Хаара.
использую detectMultiScale. Каскад обучен на примерно 1000 положительных примеров и 5000 отрицательных.
Прототипировал на python2. При этом искал пластины сначала на всем кадре 2560х2048 точек, потом пробовал выделять зоны в которых есть движущиеся автомобили, и искать только в них.
Обнаружил, что вариант с поиском по всему кадру в итоге быстрее, чем вариант с предварительным поиском зон движения. длительность цикла программы на питоне около 250 мс, что неприемлемо по быстродействию.
Перешел на С++/VS2013. С родным компилятором MSVS. Удивительно то, что программа в Debug версии имеет цикл больше секунды, а в Release - 300 - 350 мс, что больше, чем у питона!. Все 4 ядра Core I5 и в питоне, и в С++ при работе release версии грузятся примерно на 90%. Утечек памяти не наблюдаю.
Почему С++ не дает выигрыша по скорости, хотя должен?
Где я не прав? Что подправить в настройках в Visual Studio 2013?
и главное, что дальше делать?
Спасибо.