andrew smirnov
Пользователи-
Количество публикаций
46 -
Зарегистрирован
-
Посещение
Все публикации пользователя andrew smirnov
-
Насчет отключить - не уверен. А вот закрыть их так, чтобы пользователь их не увидел - можно: просто постоянно мониторить наличие такого окошка и при его появлении тут же закрывать. Не самое красивое решение, но как вариант...
-
Пробные заголовки для OpenCV на паскале. Библиотека VCopenCV.dll, используемая в хедерах, выдрана из VisionLab Mitov Software (одна dll вместо нескольких - кому неудобно, может исправить имя библиотеки в соответсвующих юнитах на исходные имена dll). Багов уйма, но кто хочет попробовать - вперед. Комментариии, замечания и исправления приветствуются. Код максимально старался перенести, но не все процедуры и функции экспортируются, поэтому примеры использования в Делфи и СиБилдере будут немного отличаться. Там, где в исходных хедерах использовался двойной указатель - в паскале оставил одинарный. Пробовал компилить - пришлось использовать все-таки двойной (передавать адрес указателя вместо самого указателя). Лучше варианта пока нет (либо пишем на VC++, C++). delphi_header.zip
-
Если мы говорим о технологии распознавания речи, то тогда нужен Loquendo ASR. TTS (Text To Speech) – это движок только для синтеза речи.
-
Там только TTS...
-
Интересно, как с русским работает? Поддержка заявлена. Кто-нибудь знаком с этой штукой?
-
Тут нужно смотреть, в каких задачах использовать собираетесь. Если отдельные слова (команды) - то может вейвлет и подойдет. Если непрерывную речь, то тут для начала нужно разбить на слова, слова на фонемы, для фонем составить эталонную базу. Для анализа последовательности фонем как раз вроде и используют скрытые марковские модели. Для английского, ряда европейский есть движок www.nuance.com/naturallyspeaking/. Для русского хороших разработок не попадалось. Есть у японцев вроде свои разработки. Вообще, специалисты по распознаванию речи, которые занимаются русским, говорят, что он один из самых сложных для распознавания.
-
Доброго времени суток, господа. Как использовать алгоритм Вороного для сегментации изображения на текст и графику?
-
Вот, кстати, еще одна ссылка по теме: http://www.comp.nus.edu.sg/~tancl/Papers/D...DASGrouping.pdf
-
Как это сделать с использованием OpenCV? Там есть пример - вроде используют алгоритм выделения ячеек Вороного. Но там изображение сентезируют из случайных точек. А здесь как быть?
-
Про сегментацию страниц на текст/изображение с использованием алгоритма Вороного можно почитать, например, здесь: "On the Application of Voronoi Diagrams to Page Segmentation" (у меня есть файлик, но сервак его залить не дает. могу скинуть на мыло, если интересно. или просто погуглить).
-
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
Доброго времени суток, господа. Все-таки скачал AnnotattorAnnotator (на тот момент он не был доступен для скачивания). Использует он Виола-Джонса. Значит, надежда на этот подход все-таки есть! З.Ы.: Хедеры OpenCV в процессе - сейчас в отпуске, надеюсь доделать. -
Спасибо за подсказку. Точно, анонсировали в июне-июле новый релиз. Но начать, нужно, наверное, сейчас. Наврядли базовый код сильно изменится - дополнений много будет. Надеюсь, что из этого получится что-нибудь полезное.
-
Именно так. Дамаете, что идея бредовая? Facedetect я переписал на делфи. Сейчас пробую переписать заголовочные файлы полностью - надеюсь, что терпения хватит. Могу потом выложить, что получится.
-
Здравствуйте! У меня следующий вопрос: можно ли обойтись без использования класса VECTOR в примере Find_obj? P.S. Зачем это надо - нужен простейший пример для переноса на Делфи.
-
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
Кстати, можно поподробнее про SVM (и скрытые марковские модели) в opencv? Что-то в хелпе их вроде не видел... -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
Это я самые сливки показал! Проблема в том, чтобы уменьшить вероятности ошибок первого и второго рода при классификации, что достигается хорошим обучением каскада. Вот над алгоритмом получения "хорошого" каскада и бъюсь. И не совсем понятно, как быть с инвариантностью вейвлета к вращению (в мануале написано, что такой механизм есть). Может, кто знает? -
Если кому интересно. Долго искал в инете пример использования OpenCV в Делфи - все отправляют учить C. Есть ресурс Набор библиотек компонентов для Delphi, C++ Builder. Смотрите VisionLab. Для некоммерческого использования бесплатна. Исходники компонентов закрыты (можно купить правда).
-
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
Начинать нужно было с простейшей задачи - выявить на изображениии лицо. Насколько я понимаю, SURF (SIFT) позволяет найти эталон на изображении. А если все объекты относятся к одному классу (например, самолет) и имеют сходные внешние контуры (хвост, фюзеляж, крылья), но ключевые точки для каждого будут разными (или я не прав), то эти методы не сработают (не делать же для каждой модели самолета свой эталон). А алгоритм Виола-Джонса, если я правильно понимаю, позволяет получить именно некий нечеткий эталон для определенного класса объектов. Поэтому продолжил копать в этом направлении. Или я не прав? Тема для меня новая абсолютно Вот что у меня примерно получается (пока еще не конечный результат): -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
Вышеуказаные документы читал (насколько позволяет знание языка) - на практике реализовать проблемно. Думал, может кто пробовал под свои задачи обучать, какие тонкости при этом -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
Хочется классифицировать объекты, находящиеся на неподвижной картинке - человек, автомобиль, автомат, человек рядом с автомобилем, человек с автоматом. человек на автомобиле с автоматом и т.д. Т.е. получить текстовый дескриптор для изображения. Думал, что построив необходимые каскады, смогу (время обработки в данном случае не учитываем) получить такой дескриптор. -
Находим в кадре лица, человеческие фигуры, и т.д. и т.п
andrew smirnov replied to Smorodov's topic in Обсуждение общих вопросов
Здравствуйте! У меня следующий вопрос: Как обучить каскад Хаара находить сложные предметы (например, автомат, вертолет и т.п.)? Пробовал, как написано в мануале - не получается. Кто-нибудь пробовал сам обучать каскады?