iskees

Пользователи
  • Количество публикаций

    153
  • Зарегистрирован

  • Посещение

  • Days Won

    10

iskees last won the day on February 11

iskees had the most liked content!

Репутация

23 Эксперт

О iskees

  • Звание
    Эксперт
  1. Это происходит 1 раз на 10 000 кадров в среднем, рывок сложно будет заметить.
  2. В opencv декодируется видео с ip камеры силами самой opencv (3.1, ffmepg), через некоторое время число кадров выданное opencv и пришедших с камеры (перехват udp пакетов) начинает отличатся. Opencv пропускает кадры, собственно вопрос куда деваются кадры: 1. При нехватки ресурсов кадр который пришел в момент когда еще не обработан предыдущий просто отбрасывается 2. или они кэшируются и последовательность кадров не нарушается но возникает задержка
  3. minNeighbors. Число минимальных объектов найденных в данной области. Т.Е. на один знак(область изображения) может откликнутся сразу несколько окон (+- несколько пикселей в сторону, разный масштаб), если этих откликов меньше чем minNeighbors то область отбрасывается. При значении 0 будут возращены все варианты (на один знак может быть несколько пересекающихся областей). Грубо говоря чем больше это значение, тем более параноидальным будет поиск и тем чаще он будет пропускать объекты, считая, что это ложное срабатывание.
  4. поиск идет скользящим окном, размер этого окна начинается с min_size у вас это 16, после прохода этим окном размер умножается scale_factor и проход повторяется пока размер окна не достигнит max_size. чем меньше scale_factor тем точнее поиск, но и медленнее соответственно.
  5. Имеется в виду scale_factor. Про фильтрацию: взять любой дескриптор (hog тот же или просто значения яркости) и прогнать их через нейронную сеть или svm. Если у вас есть цвет, то можно использовать не яркость, а компоненту цвета или насыщенности или их комбинацию (знак синий а фон серо зеленый).
  6. Можно попробовать сделать детектор на треугольный знак(все треугольные знаки в положительные образцы), а уже потом отфильтровывать нужный вам. Это если нет ошибок в параметрах детекции(минимальное окно, коэффициент и прочее)
  7. Была похожая задача но для камер который стоят над дорогой (которые штрафы выписывают за превышение) и ракурс там всегда примерно один, Там вполне справляются нейросети.
  8. Для начала выложите пример фото с этим цилиндром.
  9. Думаю всем уже известно, что в новом айфоне добавили режим размытия заднего плана. Причем говорится, что это работает только на двухкамерной версии и используются глубокое обучение. Я никак не могу понять как там может быть использована вторая камера, у них же разное фокусное расстояние и стереозрение использовать не получится(разная перспектива, расстояние между камерами минимальное, вторая камера покрывает 50% кадра первой). Может кто просветит в этом вопросе.
  10. Столкнулся с проблему при сохранении обученной модели SVM(ядро полином), при сохранении и последующей загрузке резко падает процент распознавания, в сети наткнулся на информацию что opencv сохраняет не все данные при не линейном ядре. Пробовал и 3.0 и 3.1 результат один и тот-же. Собственно есть несколько вопросов к знатокам: 1. есть ли способ нормального сохранения средствами OpenCV 2. есть ли способ сохранить модель из scikit-learn в формате который бы просчитала OpenCVая реализация, при обычном сохранении там сохраняется бинарный файл а opencv хочет xml 3. может есть более удобный фреймворк на подобии scikit-learn который бы без заморочек позволил это сделать
  11. Другие методы не связанные с каскадами+скользящее окно. Ни одна из продуктов на рынке такой метод не использует из-за недостаточной производительности, в России например большая часть комплексов оснащены одноядерными(редко 2) селеронами с частотой 2ггц, ни о каких мощных видеокартах даже речи нет. Если вам для эксперимента то можно просто контура(у номеров есть окантовка) искать.
  12. OpenCV написан на плюсах, версия для питона это просто оболочка над с++, выигрыша никакого и не должно быть. Разница может быть в оптимизации использовании всяких ipp tbb и прочее. А хаар на cpu, да на таком разрешение в риалтайм никак не уложится, можно кончено на gpu но это так чисто в исследовательских целях.
  13. Кто то видел инструкцию по созданию своего ERFilter( этот который в Scene Text Detection) cо своим набором символов, или уже готовые каскады отличные от тех что с opencv идут?
  14. отсев по чертам лица это как дополнительный фильтр, у всяких анимешек например огромные глаза которых у людей не бывает. По насыщенности и цвету, можно перевести изображение в формат (цвет, насыщенность, яркость) и посмотреть гистограммы по первым двум компонентам По частотам я бы пробовал следующие варианты: 1. Сглаживаем->вычитаем(absdiff) из оригинала сглаженное-> суммируем и флиртуем по порогам с двух сторон 2. Фурье 3. Высокочастотный слой)или как там это назывется) из методов главных компанент