andrew smirnov
Пользователи-
Количество публикаций
46 -
Зарегистрирован
-
Посещение
Все публикации пользователя andrew smirnov
-
Всем привет! Есть желание (и необходимость, наверное) по использованию новой версии библиотеки OpenCV 2.2. Реализация ряда функций библиотеки с использованием классов не позволяет использовать ее в Делфи. Как вариант, можно переписать реализацию методов классов в виде экспортируемых функций. Есть желающие поучаствовать?
-
И как насчет предыдущего варианта заголовочных файлов - 70 раз скачали, а комментариев немного... Да и примеры можно было бы в ветке выложить - у кого что получается интересного.
-
http://theseus.blog.ru/91016531.html
-
да, там еще на каждой стадии ошибки первого и второго рода выводятся - вот они тебе и скажут, насколько хорошо обучена модель
-
если не ошибаюсь, просто запускаешь еще раз с теми параметрами, промежуточные файлы обучения должны остаться на своих местах - обучалка сама подцепит последний результат (стадию) и продолжит с этого места. вроде так, хотя давно это было. по-поводу размера - каскады, которые лежат в открытом доступе, кажется, имеют минимальный размер изображения 24х24. по поводу чувствительности - можно попробовать поиграть с параметрами, которые передаются в процедуру детектирования - возможно, это поможет отсеять мусор. Позитивный образец - просто копировал 1000 раз или видоизменял?
-
кстати, как генерировали позитивные образцы?
-
обучение может идти несколько дней и даже недель . там, кстати, есть возможность прервать процесс с последующим возобновлением обучения с прерванной стадии.
-
а вот и пример файлы грузим в формате bmp CompVisionForum.rar
-
Вот, если попробовать только http://xpidea.com/Products/tabid/53/Produc...10/Default.aspx а так google в помощь - попадались реализации
-
tesseract неплох, это правда. еще понравились реализации подобных проблем с использованием нейронных сетей. обучается, правда, долго, но результат - как раз под описание проблемы
-
а еще очень не плох tesseract от HP, кажется. сейчас выложен GOOGLE: http://code.google.com/p/tesseract-ocr/ правда, есть нюансы с русским языком
-
видели. он сильно не полный. хотя и вроде под версию 2.0 адаптирован. я автору того проекта где-то полгода назад давал ссылку на эту тему - видимо проект заброшен...
-
Если не жалко, то посмотрел бы...
-
Не реализована. Если есть желание - можете дополнить и обновить заголовочные файлы. Самому пока некогда.
-
Фон - чем больше вариантов, тем лучше для обучения - меньше ложных детектов будет. Главное, чтобы негативные изображения точно не содержали искомый объект. А что ищещь, если не секрет? Плюс еще можно поиграться с параметрами процедуры поиска объектов: алгоритм поиска, порог принятия решения. Я процент ложных срабатываний убирал так: cvHaarDetectObjects( PCvArr(SrcImage), Cascade, Storage, 1.1, 4, CV_HAAR_DO_CANNY_PRUNING , ImSize ); 1.1 - параметр, который определяет шаг приращения масштаба при поиске объектов (10%, как я понял); 4 - порог срабатывания - чем ниже, тем больше детектов, но выше процент ложных срабатываний; я для поиска лиц у себя использовал это значение; CV_HAAR_DO_CANNY_PRUNING - алгоритм, который используется в процессе выделения признаков - почему выбрал не помню, но вроде с ним получились наилучшие результаты.
-
маловато будет, наверное. на хабре (www.habrahabr.ru - тема про поиск НЛО - http://habrahabr.ru/blogs/artificial_intelligence/67937/) есть пример, где тренируют на одном положительном сэмпле, а вот негативных должно быть все равно много. негативные при этом выступают, если я не ошибаюсь, в качестве фона, куда помещаются положительные сэмплы.
-
Вот-вот! И я про то же! Я где-то сотни три для положительных сэмплов использовал - что-то похожее получается. А негативные сэмплы - просто чтобы не содержали искомый образец. Так потом эта программулина, которая обучает каскад, еще очень долго работает, чтобы достичь нужного порога распознавания. Причем не всегда получается. Короче, долго и нудно. Лучше всего это делают китайцы ... З.Ы. Кроме того, как показывает опыт использования, каскад плохо отрабатывает поворот изображения - мне пришлось делать это вручную: детект - нет результата - поворот - детект - и т.д.
-
а если так: file1 := PChar('haarcascade_frontalface_alt.xml'); cascade_f := cvLoad(file1,0,0,0);
-
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
Пробовал натренировать для распознавания произвольных строк текста (навроде надписей на рекламных щитах) - что-то получается, а сам подход где-то в англоязычных источниках откопал. А вот с номерами не пробовал - задачи такой не было пока. Если у кого получится, отпишите. -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
HTK - Hidden Markov Model Toolkit - Speech Recognition toolkit. Сам пока не пробовал - руки не доходят. http://htk.eng.cam.ac.uk/ -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
можно попробовать через детектирование номера (можно и Хааром, вроде - в сети где-то встречалось что-то похожее). здесь ранее рассматривался этот вопрос. но вот как быть с изменением сцены? картинка-то динамическая будет. здесь, на мой взгляд, сначала детектор движения - изменения в определенной области кадра уже будет сигнализировать о въезде-выезде. дальше можно попробовать найти номер (прямоугольник). что-то в этом роде, наверное. -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
уточняю - машина на фотогорафии как расположена? если просто факт присутствия, независимо от пространственного расположения - то это, наверное, уже ближе к нейронным сетям. даже хорошо обученный классификатор для лица не во всех случаях находит на фотографии лицо (только примерно 70-80%). -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
я пробовал - результат тоже не очень. проблема ясна: не смотря на большое разнообразие человеческих особей, на любом лице можно выделить характерные признаки (глаза, брови, нос, рот, контур лица). взаимное расположение этих признаковых элементов при этом не сильно меняется. с машинами сложнее... а какая конкретно задача? -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
сделать самому при помощи вышеупомянутых утилит