Jump to content
Compvision.ru
Sign in to follow this  
Smorodov

Трактовка кривых обучения.

Recommended Posts

Есть такой график обучения сети, см. приложенную картинку.

По нему видно, что тестовая выборка имеет меньшее значение функции потерь чем обучающая выборка.

Обычно в литературе встречается обратная ситуация. 

Тестовая выборка честная, то есть никак не связана с обучающей.

Меня несколько озадачило взаимное расположение кривых функции потерь.

Как бы Вы трактовали такой график?

Screenshot from 2016-03-05 22:15:55.png

Share this post


Link to post
Share on other sites

Если в валидационную выборку попали объекты одного класса, а алгоритм больше ошибается на объектах другого класса, то возможна такая картина...

Грубо говоря: позитивы он обрабатывает корректно всегда, но при этом фолсит на негативах...тогда на баче содержащем в равной степени и негативы и позитивы функция потерь будет иметь значение больше, чем на валидационной выборке, где одни позитивы.

Но это пример "из разряда фантастики"

  • Like 1

Share this post


Link to post
Share on other sites

Выборки сбалансированы всех классов строго одинаковое количество.

Классов 6 это распознавалка эмоций.

В валидационной выборке лица людей, отсутствующих в обучающей.

Я кажется начинаю понимать :) 

Я обучаю итерациями, добавляя на следующем круге семплы на которых классификатор ошибается. Еще и с двукратным бустом.

То есть, я добавляю сложные примеры для обучающей выборки, смещая её, в то время как тестовая выборка всегда одинаковая.

Таким образом обучающая выборка становится сложнее тестовой.

Видимо я перемудрил :)

Share this post


Link to post
Share on other sites

Кстати, по поводу извращенных методов тренировки. А не пробовал к задаче мультиклассовой классификации применть loss-функцию типа каких-нибудь triplet loss function?  

  • Like 1

Share this post


Link to post
Share on other sites

Спасибо за наводку, попробую.

Сейчас точность в 82-84% упирается, думается это потолок инфы в датасете.

 

Share this post


Link to post
Share on other sites
1 hour ago, Smorodov said:

Спасибо за наводку, попробую.

Сейчас точность в 82-84% упирается, думается это потолок инфы в датасете.

 

82-84% - это на той базе лиц, где ~2M сэмплов?

Share this post


Link to post
Share on other sites

Не, на 100 персонах, +15 в тестовой выборке.

Семплов порядка 200к.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

Sign in to follow this  

  • Recently Browsing   0 members

    No registered users viewing this page.

×