Jump to content
Compvision.ru
APXANGEL

Поиск объектов с помощью нейросети

Recommended Posts

2 minutes ago, Smorodov said:

Так и есть, по 2М сэмплов каждого класса. 

Каждого - это в вашем случае Лица + Фон, или вы еще внутриклассовую вариативность понижаете и бьете лица на несколько подклассов? 

Share this post


Link to post
Share on other sites

 

2 часа назад, BeS said:

Каждого - это в вашем случае Лица + Фон, или вы еще внутриклассовую вариативность понижаете и бьете лица на несколько подклассов? 

Не, 2М лиц и столько же фона.

Share this post


Link to post
Share on other sites
3 hours ago, Smorodov said:

 

Не, 2М лиц и столько же фона.

а еще дурацкий вопрос, как в формализуете обучение на нечеткой базе? У DeepLeab все боле-мене понятно, там по известной разметке корректируются отклики. А вот что у вас на выходе получается и как вы корректируете веса, не совсем понятно.

з.ы. и еще более глупый вопрос: а такую сетку как у вас можно стандартными средствами caffe соорудить, или вы дописывали кастомные слои?

Share this post


Link to post
Share on other sites

Ну база довольно таки четкая, :) см. аттач.

CAFFE тоже не менял, слои не дописывал, учу как обычно в DIGITS.

Пост-обработка результатов свертки, статистическими методами присутствует, можно с натяжкой назвать ее слоем но она в обучении никак не участвует.

Вообще идею взял здесь: http://sachinfarfade.tumblr.com/deep-dense-face-detector

и попробовал заимплементить как я это вижу.

 

Screenshot from 2016-02-13 22:41:12.png

Share this post


Link to post
Share on other sites

Спасибо, теперь понятно как это работает. Возникла еще мысль, а что если использовать подобную сеть для распознавания лиц. На входе она получает фото лица, на выходе вектор. А примерами для обучения и настройки могут служить наборы лиц, если на  одинаковые лица вектора близкие то положительно подкрепление  если далекие  то отрицательные, ну и на разные лица все наоборот. 

Share this post


Link to post
Share on other sites

OpenFace примерно так и делает.

Share this post


Link to post
Share on other sites

OpenFace построена на FaceNet которая использует triple loss (надо 3 примера), а еще есть siamese network там достаточно 2 примера, но эта сеть отвечает похоже или нет для двух входных изображений, а не выдаёт вектор-признак.

FaceNet тренируется чтобы лучше отличать лица, а не фон от лица, хотя кто знает может быть если подавать 3 примера как лицо,лицо,фон и потом составлять 2 пары лицо,лицо лицо,фон то может быть она и выучится.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now


  • Recently Browsing   0 members

    No registered users viewing this page.

×