Перейти к содержимому
Compvision.ru

Lexibender

Пользователи
  • Количество публикаций

    9
  • Зарегистрирован

  • Посещение

Сообщения, опубликованные пользователем Lexibender


  1. Добрый день!
    Как известно, для работы напрямую с изображением (а не с его представлением в виде признаков) естественным образом подходит сверточная архитектура сетей (CNN). В интернете чаще всего пишут про задачу классификации изображений: обычно после нескольких чередующихся слоев свертки и пулинга лежит "обычный" полносвязный слой нейронов, который  по признакам, каким-то образом полученным предыдущими сверточными слоями, относит изображение к одному из заданных классов.

    Но что делать, если на выходе мы желаем иметь не номер класса, а целое изображение? (Не знаю, как называется такой класс задач) Например, как в приложении Prisma – юзер загружает фото, а программа меняет его стилистику. 

    Вопрос: в какую сторону копать, чтобы познакомиться с сетями, сопоставляющим изображению измененное изображение.
    prisma-1-1.jpg


  2. Товарищи, есть приличные приложения на обычные смартфоны (крепящиеся к лобовому стеклу авто), которые умеют будить засыпающего за рулем водителя? (Работают с изображением лица, глаз)
    Возможно, кто-то слышал о программах более общего назначения, распознающих засыпание

    PS. Видел такой патент http://www.findpatent.ru/patent/241/2413632.html Что с юридической точки зрения для практикующего разработчика может означать его существование? Честно говоря, вообще не понимаю, что тут патентовать (очевидные вещи)


  3. 8 часов назад, Smorodov сказал:

    Поситайте еще про FACS, здесь https://ru.wikipedia.org/wiki/Система_кодирования_лицевых_движений и у главного эксперта по ним http://www.paulekman.com/product-category/facs/ .

    Спасибо!
    Вики (и не только), конечно, читал. А предложенный сайт - да, посмотрю
    Еще мне понравилась прилагающаяся статья от авторов движка OpenFace


  4. Добрый день, форумчане!

    Занимаюсь в рамках магистерской задачей распознавания эмоций, использую движок рекомендованный мне в другой теме https://github.com/TadasBaltrusaitis/OpenFace
    Данный движок работает с такими базами данных как UNBC, SEMAINE, FERA2011, DISFA, BP4D. Эти базы данных предоставляют наборы лиц с размеченными AU.

    Я заходил на сайты указанных БД: чтобы их получить нужно составить запрос к правообладателям. Я отправил соответствующие письма, но на них долго не отвечают.
    Может быть у кого есть эти (или подобные) базы в скачанном виде? Очень поможете, если поделитесь.

    Спасибо!


  5. 21 час назад, Nuzhny сказал:

    Хорошего вычислителя пульса по видео ещё нет. Проекты есть, но все с очень ограниченными внешними условиями и вычислительно тяжелы.

    Чтобы понять о чем речь, ознакомился с топиком на хабре https://habrahabr.ru/post/145135/
    Спасибо за наводку, принял тему к сведению.

    Форумчане, что ещё можете посоветовать? 


  6. Добрый день!

    Нахожусь в процессе написания магистерской работы, формулировка темы: "Нечеткий поиск графического паттерна в наборе 2D изображений". Изначально говорили с куратором о распознавании эмоций, но я выяснил, не без помощи участников форума, что есть опен сорс проекты, решающие данную задачу.

    Я понимаю, что тема анализа лиц востребованная, поэтому многие задачи уже решены. Но я все равно надеюсь, что  кто-то сможет подсказать направление, в котором мало готовых результатов, по крайней мере с открытым кодом?


  7. Добрый день!

    Хочу написать программу, распознающую основные эмоции человека по видеопотоку вебки, используя opencv. Насколько я понимаю, наиболее подходящими для меня будут алгоритмы aam/asm, позволяющие выделить основные морфологические точки лица, по взаимному расположению которых я и определю эмоцию. Вопрос - эти алгоритмы реализованы в opencv? Если да - есть ли демки/примеры, как называются классы?

    В ходе непродолжительного гуглинга актуальный ответ найти не удалось.

×