Перейти к содержимому
Compvision.ru

iskees

Пользователи
  • Количество публикаций

    202
  • Зарегистрирован

  • Посещение

  • Days Won

    19

Все публикации пользователя iskees

  1. поиск идет скользящим окном, размер этого окна начинается с min_size у вас это 16, после прохода этим окном размер умножается scale_factor и проход повторяется пока размер окна не достигнит max_size. чем меньше scale_factor тем точнее поиск, но и медленнее соответственно.
  2. Имеется в виду scale_factor. Про фильтрацию: взять любой дескриптор (hog тот же или просто значения яркости) и прогнать их через нейронную сеть или svm. Если у вас есть цвет, то можно использовать не яркость, а компоненту цвета или насыщенности или их комбинацию (знак синий а фон серо зеленый).
  3. Можно попробовать сделать детектор на треугольный знак(все треугольные знаки в положительные образцы), а уже потом отфильтровывать нужный вам. Это если нет ошибок в параметрах детекции(минимальное окно, коэффициент и прочее)
  4. Нахождение грузовиков на видео

    Была похожая задача но для камер который стоят над дорогой (которые штрафы выписывают за превышение) и ракурс там всегда примерно один, Там вполне справляются нейросети.
  5. Для начала выложите пример фото с этим цилиндром.
  6. Думаю всем уже известно, что в новом айфоне добавили режим размытия заднего плана. Причем говорится, что это работает только на двухкамерной версии и используются глубокое обучение. Я никак не могу понять как там может быть использована вторая камера, у них же разное фокусное расстояние и стереозрение использовать не получится(разная перспектива, расстояние между камерами минимальное, вторая камера покрывает 50% кадра первой). Может кто просветит в этом вопросе.
  7. Сохранение модели SVM

    Столкнулся с проблему при сохранении обученной модели SVM(ядро полином), при сохранении и последующей загрузке резко падает процент распознавания, в сети наткнулся на информацию что opencv сохраняет не все данные при не линейном ядре. Пробовал и 3.0 и 3.1 результат один и тот-же. Собственно есть несколько вопросов к знатокам: 1. есть ли способ нормального сохранения средствами OpenCV 2. есть ли способ сохранить модель из scikit-learn в формате который бы просчитала OpenCVая реализация, при обычном сохранении там сохраняется бинарный файл а opencv хочет xml 3. может есть более удобный фреймворк на подобии scikit-learn который бы без заморочек позволил это сделать
  8. Тормозит Release версия С++ каскада Хаара

    Другие методы не связанные с каскадами+скользящее окно. Ни одна из продуктов на рынке такой метод не использует из-за недостаточной производительности, в России например большая часть комплексов оснащены одноядерными(редко 2) селеронами с частотой 2ггц, ни о каких мощных видеокартах даже речи нет. Если вам для эксперимента то можно просто контура(у номеров есть окантовка) искать.
  9. Тормозит Release версия С++ каскада Хаара

    OpenCV написан на плюсах, версия для питона это просто оболочка над с++, выигрыша никакого и не должно быть. Разница может быть в оптимизации использовании всяких ipp tbb и прочее. А хаар на cpu, да на таком разрешение в риалтайм никак не уложится, можно кончено на gpu но это так чисто в исследовательских целях.
  10. ERFilter

    Кто то видел инструкцию по созданию своего ERFilter( этот который в Scene Text Detection) cо своим набором символов, или уже готовые каскады отличные от тех что с opencv идут?
  11. отсев по чертам лица это как дополнительный фильтр, у всяких анимешек например огромные глаза которых у людей не бывает. По насыщенности и цвету, можно перевести изображение в формат (цвет, насыщенность, яркость) и посмотреть гистограммы по первым двум компонентам По частотам я бы пробовал следующие варианты: 1. Сглаживаем->вычитаем(absdiff) из оригинала сглаженное-> суммируем и флиртуем по порогам с двух сторон 2. Фурье 3. Высокочастотный слой)или как там это назывется) из методов главных компанент
  12. 1. найти точки на лице при помощи активных моделей, взять расстояния между ним(или каике-то другие отношения) и загнать все это дело в какой-то классификатор. Так должны уйти всякие мультяшки с не правильными чертами "лица". 2 Проверка на высокие и низкие частоты, у рисованных лиц возможен завал на частотах которые у людей отвечают за морщины и прочие изъяны
  13. В dotnet врапере было два класса для каскадов, один также выдавал ошибки на некоторые типы файлов а другой (название было какое-то более общее типа CascadeClassifier) вот он работал корректно со всеми файлами
  14. у самой функции detectmultiscale(как то так) есть параметры: 1. минимальный размер окна 2. масштабирование 3. порог с ними поиграйтесь и должно помочь
  15. Если вы имеете ввиду, что пример opencv (детекция пешехода) на вашем видео не всех находит, то даже если вы будите работать с "детектором движения" как описали вам все равно придется обучать какой-то классификатор(а скорее всего точно такой-же) для отсеивания шумов. Кроме того, если группа людей будет идти вместе, "детектор движения" выдаст одну область движения на всю группу и в лучшем случае вы их распознаете как одного человека, но скорее всего классификатор скажет что это совсем не люди.
  16. 1. считайте фон за час, не будет же человек час стоять, и можно принять что последнее место где был обнаружен человек в течении например секунды считается "в движении". 2. Есть хорошо работающий метод для поиска человека hog+SVM есть в примерах opencv
  17. Если расширение базы не поможет то можно пробовать svm или простенькую нейросеть
  18. Каскады тут явно излишне, ошибки в сегментации символов или в их распознавании?
  19. Обучение каскада Хаара

    ну 700 примеров это совсем не серьезно, десяток тысяч хотя бы
  20. The functions sum calculate and return the sum of array elements, independently for each channel. Эта функция выдает скаляр состоящий из сумм для каждого канала, у вас изображение одноканальное и вам нужно использовать только первое знание, и делите на 255 уже его а не весь скаляр.
  21. 1. есть Sum называется. 2 Умножите (на скаляр) изображение на 1/255 и получите нужные вам 0 и 1, правда проще сумму разделить на 255, результат будет один. Чисто "черного или белого" формата в opencv нет.
  22. 1 просто все суммируете, у черных знание и так будет 0 2 Тут уж на вше усмотрение, главное или все приводить к размеру в базе или все к размеру распознаваемого символа, но удобнее будет к размеру базы. Ну, а вообще не факт что с бинаризвацией результат будет лучше чем без нее, стоит попробовать и так и так и выбрать. Или вообще сделать две базы, два сравнение и вбирать каждый раз с лучшим результатом (или суммировать как то)
  23. Тестировал оба С# врапера и явоский(но его давно), на одном железе и разница в сравнении с с++ была минимальная. Разумеется если вы используете функции opencv, а не начинаете работать напрямую с пикселями. А плюс в том что с# на порядок проще плюсов со всеми этими его хедерами, линковками .... Качаете дллки, копируете в папку проекта, подключаете пару из них к проекту и все работает без компиляций и прочих танцев с бубном.
  24. Все прелести плюсов. Может вам C# попробовать или яву, проивзодительность +- та же, все функции называются примерно также как в с++ , но для не знатоков плюсов все намного проще.
×