الگوریتم

1 دقیقه |  2020/10/28

با توجه به نمونه‌های مجموعه آموزشی {${x^{(1)}, … , x^{(m)}}$} که هر نمونه یک بردار است، $x \in \mathbb{R}^{n}$.

$$p(x) = p(x_{1};\mu_{1},\sigma_{1}^{2})p(x_{2};\mu_{2},\sigma_{2}^{2})…p(x_{n};\mu _{n},\sigma _{n}^{2})$$

این مسئله در آمار “فرض استقلال” بر روی مقدایر ویژگی‌های داخل یک نمونه آموزشی x نامیده می‌شود.

به صورت خلاصه‌تر، اصطلاح بالا به صورت زیر نیز بیان می‌شود:

$$=\prod_{j=1}^{n}p(x_{j};\mu_{j},\sigma ^{2})$$

الگوریتم

ویژگی‌های $x_{i}$ را انتخاب کنید که فکر می‌کنید می‌تواند نشانگری برای نمونه‌های ناهنجار باشد.

پارامترهای $\mu_{1},…,\mu_{n},\sigma_{1}^{2},…,\sigma_{n}^{2}$ را متناسب کنید.

$\mu_{j} = \frac{1}{m} \sum_{i=1}^{m} x_{j}^{(i)}$ را محاسبه کنید.

$\sigma_{j} ^{2} = \frac{1}{m} \sum_{i=1}^{m} (x_{j}^{(i)} - \mu_{j} )^{2}$ را محاسبه کنید.

برای یک نمونه جدید x، مقدار p(x) را محاسبه کنید:

$$p(x) = \prod_{j=1}^{n}p(x_{j};\mu_{j},\sigma ^{2}) = \prod_{j=1}^{n}\frac{1}{\sqrt{2\pi} \sigma_{j}}exp(-\frac{(x_{j}-\mu_{j})^{2}}{2\sigma_{j}^{2}})$$

در صورتی که $p(x) < \varepsilon $، ناهنجاری وجود دارد.

نسخه بُرداری شده محاسبات برای $\mu$ به صورت $\mu = \frac{1}{m} \sum_{i=1}^{m} x^{(i)}$ خواهد بود. مقدار $\sigma^{2}$ هم به روش مشابهی بُرداری می‌شود.