iskees
Пользователи-
Количество публикаций
202 -
Зарегистрирован
-
Посещение
-
Days Won
19
Все публикации пользователя iskees
-
поиск идет скользящим окном, размер этого окна начинается с min_size у вас это 16, после прохода этим окном размер умножается scale_factor и проход повторяется пока размер окна не достигнит max_size. чем меньше scale_factor тем точнее поиск, но и медленнее соответственно.
- 37 replies
-
- распознавание
- каскад
-
(и ещё %d)
Теги:
-
Имеется в виду scale_factor. Про фильтрацию: взять любой дескриптор (hog тот же или просто значения яркости) и прогнать их через нейронную сеть или svm. Если у вас есть цвет, то можно использовать не яркость, а компоненту цвета или насыщенности или их комбинацию (знак синий а фон серо зеленый).
- 37 replies
-
- 1
-
- распознавание
- каскад
-
(и ещё %d)
Теги:
-
Можно попробовать сделать детектор на треугольный знак(все треугольные знаки в положительные образцы), а уже потом отфильтровывать нужный вам. Это если нет ошибок в параметрах детекции(минимальное окно, коэффициент и прочее)
- 37 replies
-
- распознавание
- каскад
-
(и ещё %d)
Теги:
-
Формат файлов нейросетей libcudann и FANN
iskees replied to svoyak's topic in Вопросы по нейросетям и ИИ
нашли способ прикрутить Libcudann к .net? -
Была похожая задача но для камер который стоят над дорогой (которые штрафы выписывают за превышение) и ракурс там всегда примерно один, Там вполне справляются нейросети.
-
Для начала выложите пример фото с этим цилиндром.
-
Думаю всем уже известно, что в новом айфоне добавили режим размытия заднего плана. Причем говорится, что это работает только на двухкамерной версии и используются глубокое обучение. Я никак не могу понять как там может быть использована вторая камера, у них же разное фокусное расстояние и стереозрение использовать не получится(разная перспектива, расстояние между камерами минимальное, вторая камера покрывает 50% кадра первой). Может кто просветит в этом вопросе.
-
Столкнулся с проблему при сохранении обученной модели SVM(ядро полином), при сохранении и последующей загрузке резко падает процент распознавания, в сети наткнулся на информацию что opencv сохраняет не все данные при не линейном ядре. Пробовал и 3.0 и 3.1 результат один и тот-же. Собственно есть несколько вопросов к знатокам: 1. есть ли способ нормального сохранения средствами OpenCV 2. есть ли способ сохранить модель из scikit-learn в формате который бы просчитала OpenCVая реализация, при обычном сохранении там сохраняется бинарный файл а opencv хочет xml 3. может есть более удобный фреймворк на подобии scikit-learn который бы без заморочек позволил это сделать
-
Другие методы не связанные с каскадами+скользящее окно. Ни одна из продуктов на рынке такой метод не использует из-за недостаточной производительности, в России например большая часть комплексов оснащены одноядерными(редко 2) селеронами с частотой 2ггц, ни о каких мощных видеокартах даже речи нет. Если вам для эксперимента то можно просто контура(у номеров есть окантовка) искать.
-
OpenCV написан на плюсах, версия для питона это просто оболочка над с++, выигрыша никакого и не должно быть. Разница может быть в оптимизации использовании всяких ipp tbb и прочее. А хаар на cpu, да на таком разрешение в риалтайм никак не уложится, можно кончено на gpu но это так чисто в исследовательских целях.
-
Отличия кадра мультфильма и нормального фильма
iskees replied to svoyak's topic in Обсуждение общих вопросов
отсев по чертам лица это как дополнительный фильтр, у всяких анимешек например огромные глаза которых у людей не бывает. По насыщенности и цвету, можно перевести изображение в формат (цвет, насыщенность, яркость) и посмотреть гистограммы по первым двум компонентам По частотам я бы пробовал следующие варианты: 1. Сглаживаем->вычитаем(absdiff) из оригинала сглаженное-> суммируем и флиртуем по порогам с двух сторон 2. Фурье 3. Высокочастотный слой)или как там это назывется) из методов главных компанент -
Отличия кадра мультфильма и нормального фильма
iskees replied to svoyak's topic in Обсуждение общих вопросов
1. найти точки на лице при помощи активных моделей, взять расстояния между ним(или каике-то другие отношения) и загнать все это дело в какой-то классификатор. Так должны уйти всякие мультяшки с не правильными чертами "лица". 2 Проверка на высокие и низкие частоты, у рисованных лиц возможен завал на частотах которые у людей отвечают за морщины и прочие изъяны -
Не могу открыть xml файлы после обучения классификатора Хаара
iskees replied to Artem_guy's topic in OpenCV
В dotnet врапере было два класса для каскадов, один также выдавал ошибки на некоторые типы файлов а другой (название было какое-то более общее типа CascadeClassifier) вот он работал корректно со всеми файлами -
у самой функции detectmultiscale(как то так) есть параметры: 1. минимальный размер окна 2. масштабирование 3. порог с ними поиграйтесь и должно помочь
- 5 replies
-
- pedestrian
- detector
-
(и ещё %d)
Теги:
-
Если вы имеете ввиду, что пример opencv (детекция пешехода) на вашем видео не всех находит, то даже если вы будите работать с "детектором движения" как описали вам все равно придется обучать какой-то классификатор(а скорее всего точно такой-же) для отсеивания шумов. Кроме того, если группа людей будет идти вместе, "детектор движения" выдаст одну область движения на всю группу и в лучшем случае вы их распознаете как одного человека, но скорее всего классификатор скажет что это совсем не люди.
- 5 replies
-
- pedestrian
- detector
-
(и ещё %d)
Теги:
-
1. считайте фон за час, не будет же человек час стоять, и можно принять что последнее место где был обнаружен человек в течении например секунды считается "в движении". 2. Есть хорошо работающий метод для поиска человека hog+SVM есть в примерах opencv
- 5 replies
-
- pedestrian
- detector
-
(и ещё %d)
Теги:
-
Если расширение базы не поможет то можно пробовать svm или простенькую нейросеть
-
Каскады тут явно излишне, ошибки в сегментации символов или в их распознавании?
-
ну 700 примеров это совсем не серьезно, десяток тысяч хотя бы
-
The functions sum calculate and return the sum of array elements, independently for each channel. Эта функция выдает скаляр состоящий из сумм для каждого канала, у вас изображение одноканальное и вам нужно использовать только первое знание, и делите на 255 уже его а не весь скаляр.
-
1. есть Sum называется. 2 Умножите (на скаляр) изображение на 1/255 и получите нужные вам 0 и 1, правда проще сумму разделить на 255, результат будет один. Чисто "черного или белого" формата в opencv нет.
-
1 просто все суммируете, у черных знание и так будет 0 2 Тут уж на вше усмотрение, главное или все приводить к размеру в базе или все к размеру распознаваемого символа, но удобнее будет к размеру базы. Ну, а вообще не факт что с бинаризвацией результат будет лучше чем без нее, стоит попробовать и так и так и выбрать. Или вообще сделать две базы, два сравнение и вбирать каждый раз с лучшим результатом (или суммировать как то)
-
Тестировал оба С# врапера и явоский(но его давно), на одном железе и разница в сравнении с с++ была минимальная. Разумеется если вы используете функции opencv, а не начинаете работать напрямую с пикселями. А плюс в том что с# на порядок проще плюсов со всеми этими его хедерами, линковками .... Качаете дллки, копируете в папку проекта, подключаете пару из них к проекту и все работает без компиляций и прочих танцев с бубном.
-
Все прелести плюсов. Может вам C# попробовать или яву, проивзодительность +- та же, все функции называются примерно также как в с++ , но для не знатоков плюсов все намного проще.