رایج ترین کاربرد PCA سرعت بخشیدن به یادگیری با نظارت است.
تصور کنید مجموعه آموزشی با تعداد زیادی ویژگی داریم $x ^ {(1)}, … , x ^ {(m)} \in \mathbb{R ^ {10000} } $
ما میتوانیم از PCA برای کاهش تعداد ویژگی ها در هر نمونه از مجموعه آموزش استفاده کنیم $z ^ {(1)}, … , z ^ {(m)} \in \mathbb{R ^ {1000} } $.
توجه داشته باشید که ما باید PCA را صورت کاهشی از $x ^ {(1)}$ به $z ^ {(1)}$ تعریف کنیم، فقط در مجموعه آموزش و نه در مجموعه cross-validation یا تست. میتوانید پس از تعریف در مجموعه آموزشی، نگاشت z (i) را برای مجموعه cross-validation و آزمون خود اعمال کنید.
کاربرد ها:
استفاده نادرست از PCA:
تلاش برای جلوگیری از overfitting. ممکن است فکر کنیم که کاهش ویژگی ها توسط PCA روشی موثر بر overfitting است. این ممکن است مفید باشد، اما توصیه نمیشود زیرا مقادیر نتایج ما یعنی y را در نظر نمی گیرد. استفاده از منظم سازی حداقل به همان اندازه موثر خواهد بود.
تصور نکنید که باید PCA را انجام دهید، ابتدا الگوریتم کامل یادگیری ماشین خود را بدون PCA امتحان کنید، سپس اگر متوجه شدید که به آن نیاز دارید استفاده کنید.