Перейти к содержимому
Compvision.ru

andrew smirnov

Пользователи
  • Количество публикаций

    46
  • Зарегистрирован

  • Посещение

Все публикации пользователя andrew smirnov

  1. Отключить вывод ошибок

    Насчет отключить - не уверен. А вот закрыть их так, чтобы пользователь их не увидел - можно: просто постоянно мониторить наличие такого окошка и при его появлении тут же закрывать. Не самое красивое решение, но как вариант...
  2. Как прикрутить OpenCV к билдеру?

    Пробные заголовки для OpenCV на паскале. Библиотека VCopenCV.dll, используемая в хедерах, выдрана из VisionLab Mitov Software (одна dll вместо нескольких - кому неудобно, может исправить имя библиотеки в соответсвующих юнитах на исходные имена dll). Багов уйма, но кто хочет попробовать - вперед. Комментариии, замечания и исправления приветствуются. Код максимально старался перенести, но не все процедуры и функции экспортируются, поэтому примеры использования в Делфи и СиБилдере будут немного отличаться. Там, где в исходных хедерах использовался двойной указатель - в паскале оставил одинарный. Пробовал компилить - пришлось использовать все-таки двойной (передавать адрес указателя вместо самого указателя). Лучше варианта пока нет (либо пишем на VC++, C++). delphi_header.zip
  3. Если мы говорим о технологии распознавания речи, то тогда нужен Loquendo ASR. TTS (Text To Speech) – это движок только для синтеза речи.
  4. Интересно, как с русским работает? Поддержка заявлена. Кто-нибудь знаком с этой штукой?
  5. Тут нужно смотреть, в каких задачах использовать собираетесь. Если отдельные слова (команды) - то может вейвлет и подойдет. Если непрерывную речь, то тут для начала нужно разбить на слова, слова на фонемы, для фонем составить эталонную базу. Для анализа последовательности фонем как раз вроде и используют скрытые марковские модели. Для английского, ряда европейский есть движок www.nuance.com/naturallyspeaking/. Для русского хороших разработок не попадалось. Есть у японцев вроде свои разработки. Вообще, специалисты по распознаванию речи, которые занимаются русским, говорят, что он один из самых сложных для распознавания.
  6. Алгоритм Вороного

    Доброго времени суток, господа. Как использовать алгоритм Вороного для сегментации изображения на текст и графику?
  7. Алгоритм Вороного

    Вот, кстати, еще одна ссылка по теме: http://www.comp.nus.edu.sg/~tancl/Papers/D...DASGrouping.pdf
  8. Алгоритм Вороного

    Как это сделать с использованием OpenCV? Там есть пример - вроде используют алгоритм выделения ячеек Вороного. Но там изображение сентезируют из случайных точек. А здесь как быть?
  9. Алгоритм Вороного

    Про сегментацию страниц на текст/изображение с использованием алгоритма Вороного можно почитать, например, здесь: "On the Application of Voronoi Diagrams to Page Segmentation" (у меня есть файлик, но сервак его залить не дает. могу скинуть на мыло, если интересно. или просто погуглить).
  10. Доброго времени суток, господа. Все-таки скачал AnnotattorAnnotator (на тот момент он не был доступен для скачивания). Использует он Виола-Джонса. Значит, надежда на этот подход все-таки есть! З.Ы.: Хедеры OpenCV в процессе - сейчас в отпуске, надеюсь доделать.
  11. Как прикрутить OpenCV к билдеру?

    Спасибо за подсказку. Точно, анонсировали в июне-июле новый релиз. Но начать, нужно, наверное, сейчас. Наврядли базовый код сильно изменится - дополнений много будет. Надеюсь, что из этого получится что-нибудь полезное.
  12. Как прикрутить OpenCV к билдеру?

    Именно так. Дамаете, что идея бредовая? Facedetect я переписал на делфи. Сейчас пробую переписать заголовочные файлы полностью - надеюсь, что терпения хватит. Могу потом выложить, что получится.
  13. Как прикрутить OpenCV к билдеру?

    Здравствуйте! У меня следующий вопрос: можно ли обойтись без использования класса VECTOR в примере Find_obj? P.S. Зачем это надо - нужен простейший пример для переноса на Делфи.
  14. Кстати, можно поподробнее про SVM (и скрытые марковские модели) в opencv? Что-то в хелпе их вроде не видел...
  15. Это я самые сливки показал! Проблема в том, чтобы уменьшить вероятности ошибок первого и второго рода при классификации, что достигается хорошим обучением каскада. Вот над алгоритмом получения "хорошого" каскада и бъюсь. И не совсем понятно, как быть с инвариантностью вейвлета к вращению (в мануале написано, что такой механизм есть). Может, кто знает?
  16. Как прикрутить OpenCV к билдеру?

    Если кому интересно. Долго искал в инете пример использования OpenCV в Делфи - все отправляют учить C. Есть ресурс Набор библиотек компонентов для Delphi, C++ Builder. Смотрите VisionLab. Для некоммерческого использования бесплатна. Исходники компонентов закрыты (можно купить правда).
  17. Начинать нужно было с простейшей задачи - выявить на изображениии лицо. Насколько я понимаю, SURF (SIFT) позволяет найти эталон на изображении. А если все объекты относятся к одному классу (например, самолет) и имеют сходные внешние контуры (хвост, фюзеляж, крылья), но ключевые точки для каждого будут разными (или я не прав), то эти методы не сработают (не делать же для каждой модели самолета свой эталон). А алгоритм Виола-Джонса, если я правильно понимаю, позволяет получить именно некий нечеткий эталон для определенного класса объектов. Поэтому продолжил копать в этом направлении. Или я не прав? Тема для меня новая абсолютно Вот что у меня примерно получается (пока еще не конечный результат):
  18. Вышеуказаные документы читал (насколько позволяет знание языка) - на практике реализовать проблемно. Думал, может кто пробовал под свои задачи обучать, какие тонкости при этом
  19. Хочется классифицировать объекты, находящиеся на неподвижной картинке - человек, автомобиль, автомат, человек рядом с автомобилем, человек с автоматом. человек на автомобиле с автоматом и т.д. Т.е. получить текстовый дескриптор для изображения. Думал, что построив необходимые каскады, смогу (время обработки в данном случае не учитываем) получить такой дескриптор.
  20. Здравствуйте! У меня следующий вопрос: Как обучить каскад Хаара находить сложные предметы (например, автомат, вертолет и т.п.)? Пробовал, как написано в мануале - не получается. Кто-нибудь пробовал сам обучать каскады?
×