دوره یادگیری ماشین دانشگاه استنفورد به فارسی > هفته نهم > انگیزه مسئله

انگیزه مسئله

1 دقیقه　|　 2020/10/24

مانند دیگر مسائل یادگیری، مجموعه داده $x^{(1)}, x^{(2)},…, x^{(m)}$ در اختیار ما قرار دارد.

سپس یک نمونه جدید به اسم $x_{test}$ خواهیم داشت و قصد داریم بفهمیم که این نمونه غیر‌عادی/ ناهنجار است یا خیر.

یک “مدل” $p(x)$ تعریف می‌کنیم که به ما احتمال ناهنجار نبودن نمونه را می‌گوید. همچنین از یک آستانه $\epsilon$(اپسیلون) به عنوان یک خط جداکننده استفاده می‌کنیم که تعیین می‌کند کدام نمونه‌ها ناهنجار هستند و کدام نمونه‌ها ناهنجار نیستند.

یکی از کاربردهای رایج تشخیص ناهنجاری، شناسایی کلاه‌برداری است:

$x^{(i)}$ = ویژگی‌های فعالیت کاربر iام.
مدل $p(x)$ از داده.
شناسایی کاربران غیرعادی با تطبیق دادن مواردی که $p(x) < \epsilon $.

در صورتی که تعداد بسیار زیادی نمونه ناهنجار شناسایی شود، باید آستانه $\epsilon$ را کاهش دهیم.