مانند دیگر مسائل یادگیری، مجموعه داده $x^{(1)}, x^{(2)},…, x^{(m)}$ در اختیار ما قرار دارد.
سپس یک نمونه جدید به اسم $x_{test}$ خواهیم داشت و قصد داریم بفهمیم که این نمونه غیرعادی/ ناهنجار است یا خیر.
یک “مدل” $p(x)$ تعریف میکنیم که به ما احتمال ناهنجار نبودن نمونه را میگوید. همچنین از یک آستانه $\epsilon$(اپسیلون) به عنوان یک خط جداکننده استفاده میکنیم که تعیین میکند کدام نمونهها ناهنجار هستند و کدام نمونهها ناهنجار نیستند.
یکی از کاربردهای رایج تشخیص ناهنجاری، شناسایی کلاهبرداری است:
در صورتی که تعداد بسیار زیادی نمونه ناهنجار شناسایی شود، باید آستانه $\epsilon$ را کاهش دهیم.