Все знают наглядную интерпретацию работы PCA (метод главных компонент): каждая из компонент максимизирует дисперсию данных.
Например, у нас есть набор точек на плоскости. Тогда первая компонента будет являться прямой, вдоль которой "вытянуты" точки. Уравнение линейной регрессии даст то же самое. Центр облака точек будет содержаться в переменной mean.
Допустим, у нас точки не равнозначны, а имеют некоторый вес, который показывает, насколько значимой является данная точка. Хочется построить такую же прямую, как и из примера выше, но с учётом веса каждого элемента. То есть точки с маленьким весом должны меньше влиять на результат.
Можно ли как-нибудь использовать PCA для решением этой задачи?