Перейти к содержимому
Compvision.ru
mrgloom

некоторые вопросы по SVM

Recommended Posts

прочитал курс по SVM Andrew Ng.

Но остались некоторые вопросы.

1. Есть ли какие то еще способы(кроме использования ядер) привести начальные данные к линейной разделимости?(т.е. какая либо предобработка безотносительно SVM)

2. Как я понял варьируя параметр C можно бороться с аутлайерами, если же данные линейно не разделимы, то какое C не поставить всё равно будут аутлайеры?(т.е. по идее можно ставить очень маленькое C и таким образом проверять данные на линейную разделимость? т.е. обучаем на тренировочной выборке на ней же прогоняем и смотрим сколько неправильно классифицировалось, только такой метод?(т.е. сама SVM такой информации не сообщает?))

3. Есть мы используем гауссово ядро, то при правильном подборе параметров гарантировано можем разделить любые данные?

4. Как я понял даже у линейной модели есть 1 параметр, т.е. есть оптимизационная задача, т.е. можно запустить N раз и выбрать лучший вариант?(но это получается как то долго по времени и не понятно за сколько шагов сойдется к минимуму)

(в библиотеках вроде как берется подвыборка из общих данных).

и опять же вроде это как бы подгонка под данные, т.е. оверфитинг.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

1)Суть применения kernel trick - повышение размерности задачи, как альтернативу ему, можно пробовать понижать размерность за счет фильтрации шумов при помощи например МГК или RF, правда для линейно неразделимых и разумно подобранных фич этот трюк прокатит навряд ли.

3)Kernel Trick вообще никаких гарантий не дает, есть лишь предположение о том, что при отображении данных в пространство большей размерности множества окажутся линейно разделимыми.

4)Насколько я помню, для случая линейно разделимости только 1 гиперплоскость является оптимальной и много гиперплоскостей могут быть допустимыми.Причем и опорные вектора и гиперплоскость вроде находятся в этом случае однозначно.

  • Like 1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

http://stackoverflow.com/questions/9480605/what-is-the-relation-between-the-number-of-support-vectors-and-training-data-and

вот Hard Margin Linear SVM вроде как без параметра

а Soft-Margin Linear SVM (nu-SVM) как раз с параметром С.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте учётную запись или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать учётную запись

Зарегистрируйтесь для создания учётной записи. Это просто!

Зарегистрировать учётную запись

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас


  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу

×