با توجه به نمونههای مجموعه آموزشی {${x^{(1)}, … , x^{(m)}}$} که هر نمونه یک بردار است، $x \in \mathbb{R}^{n}$.
$$p(x) = p(x_{1};\mu_{1},\sigma_{1}^{2})p(x_{2};\mu_{2},\sigma_{2}^{2})…p(x_{n};\mu _{n},\sigma _{n}^{2})$$
این مسئله در آمار “فرض استقلال” بر روی مقدایر ویژگیهای داخل یک نمونه آموزشی x نامیده میشود.
به صورت خلاصهتر، اصطلاح بالا به صورت زیر نیز بیان میشود:
$$=\prod_{j=1}^{n}p(x_{j};\mu_{j},\sigma ^{2})$$
الگوریتم
ویژگیهای $x_{i}$ را انتخاب کنید که فکر میکنید میتواند نشانگری برای نمونههای ناهنجار باشد.
پارامترهای $\mu_{1},…,\mu_{n},\sigma_{1}^{2},…,\sigma_{n}^{2}$ را متناسب کنید.
$\mu_{j} = \frac{1}{m} \sum_{i=1}^{m} x_{j}^{(i)}$ را محاسبه کنید.
$\sigma_{j} ^{2} = \frac{1}{m} \sum_{i=1}^{m} (x_{j}^{(i)} - \mu_{j} )^{2}$ را محاسبه کنید.
برای یک نمونه جدید x، مقدار p(x) را محاسبه کنید:
$$p(x) = \prod_{j=1}^{n}p(x_{j};\mu_{j},\sigma ^{2}) = \prod_{j=1}^{n}\frac{1}{\sqrt{2\pi} \sigma_{j}}exp(-\frac{(x_{j}-\mu_{j})^{2}}{2\sigma_{j}^{2}})$$
در صورتی که $p(x) < \varepsilon $، ناهنجاری وجود دارد.
نسخه بُرداری شده محاسبات برای $\mu$ به صورت $\mu = \frac{1}{m} \sum_{i=1}^{m} x^{(i)}$ خواهد بود. مقدار $\sigma^{2}$ هم به روش مشابهی بُرداری میشود.