Перейти к содержимому
Compvision.ru

niello

Пользователи
  • Количество публикаций

    3
  • Зарегистрирован

  • Посещение

Репутация

0 Новичек

О niello

  • Звание
    Новичок
  1. Надеюсь, здесь разрешено постить ссылки. Нашел почти что 1 в 1 то, что мне нужно. Для тех, у кого сходные задачи, вдруг поможет: http://nashruddin.com/searching-icons-in-a-screenshot-using-template-matching.html Плюс на том же сайте несколько хороших статеек про сопутствующие вещи.
  2. ) Стоило уйти читать про преобразование Фурье, как тут ещё ответили. Уточнил задачу. Слова заранее неизвестны. Известно, что это либо числа в десятичной системе, иногда с запятой через 3 разряда, либо недлинные строки из произвольных символов алфавита. (русские и английские буквы, цифры, запятая). Плюс достаточно крупные картинки, которые от эталонов если вообще отличаются, то на несколько пикселей. К сожалению, не могу исключить масштабирование, но для начала и без него отлично пойдет. Если что, буду масштабировать элементы до размера эталона, если соотношение сторон совпадает. Шрифт везде один и тот же, размер шрифта тоже, но есть полужирные символы. Фоны либо очень монотонные, либо вообще одноцветные, хорошо контрастируют с объектами, никаких намеренных шумов и искажений, скорее даже наоборот. Вспомнил, что в ещё университете мы распознавали буквы и цифры с помощью нейросети. Но там был какой-то готовый пакет, возможно, самописный. Мне же нужно создать DLL, работающую без дополнительных внешних зависимостей (.NET не в счет). Имеет ли смысл смотреть нейросети? cvTemplateMatch, судя по названию, мог бы быть полезен, почитаю про него подробнее. Спасибо всем за советы. Думаю, такими темпами скоро разберусь.
  3. Доброго дня всем. Я новичок в компьютерном зрении. Встала задача - распознать на статическом изображении определенные объекты. Объекты всегда выглядят одинаково или меняются достаточно незначительно, но их точная позиция неизвестна. Могут представлять собой текстово-числовые строки или заданные образцами битмэпы на достаточно однородном (надеюсь, но не могу гарантировать) фоне. Всего порядка 60-70 разных битмэпов плюс символы 1-2 шрифтов (заглавные и строчные буквы, цифры, пробелы(?)). Прошу подсказки, каким вообще методом и какими алгоритмами решать такую задачу? Пока из похожего нашел только классификаторы Хаара, но предпочитаю сначала убедиться, они ли мне нужны. Если кто-то сможет поделиться полезными ссылками, статьями, примерами кода или даже собственным опытом, буду очень благодарен. Как дополнительная информация - реализовать придется на C#, думаю использовать EmguCV, или на крайний случай присоединю к C# интерфейсу С++ DLL с алгоритмом.
×