В общем насколько я понимаю в алгоритме Виолы-Джонса эти признаки накладываются на сканирующее окно что бы определить есть ли определенные черты лица в данном окне. Но мне не понятно как это работает.
Насколько я знаю признаки Хаара это набор прямоугольных картинок которые накладываются на исходное изображение, но как? Предполагаю что нужно конвертировать исходное изображение в матричный вид где в каждой ячейке матрицы будет значение каждого пикселя, и в такой же формат перевести картинки признаков. Если я прав, то подскажите пожалуйста что нужно прочитать что бы правильно сделать подобную конвертацию?
Так же не понятно следующее: читал что после того как признак наложен на исходное изображение нужно отнять сумму пикселей белой стороны от черной стороны признака, но что это дает? Ну отнял, получилось допустим 500. И что дальше?
Читал на эту тему, и насколько я понял по этому числу можно определить насколько светлым или темным является исследуемый признаком участок и далее исходить из понятий типа глаза темнее чем нос, и если например есть совпадение вроде такого: темная область, светлая область и снова темная, значит это глаза-нос-глаза. Но насколько темная? Как сканировать темнокожие лица в таком случае? А если встретится на картинке другой объект который тоже подходит под описание темный-светлый-темный, то как его НЕ спутать с глаз-нос-глаз?
Очень надеюсь на вашу помощь