دوره یادگیری ماشین دانشگاه استنفورد به فارسی > هفته ششم > متوازن کردن Precision و Recall

متوازن کردن Precision و Recall

2 دقیقه　|　 2020/10/19

ممکن است ما نیاز به یک پیش بینی مطمئن از دو کلاس به وسیله رگرسیون لجستیک داشته باشیم. یک راه این است که آستانه را افزایش دهیم:

بدین ترتیب تنها درصورتی که بیمار 70% شانس بیماری داشته باشد، سرطان را پیش بینی می‌کنیم.

اکنون ما precision زیادتر و recall کمتر خواهیم داشت(با توجه به تعاریف در بخش قبل).

در یک مثال متفاوت، میتوان آستانه را کمتر کرد:

که با این روش، پیش بینی مطمئن‌تری خواهیم داشت. که منجر به recall زیادتر و precision کمتر خواهد شد.

هرچه آستانه زیادتر باشد، precision زیادتر و recall کمتر خواهد بود.

هرچه آستانه کمتر باشد، recall زیادتر و precision کمتر خواهد بود.

برای تبدیل این دو استاندارد به یک عدد واحد می‌توانیم از مقدار F استفاده کنیم.

یک راه استفاده از میانگین است: $\frac{P + R }{2}$

اما این راه حل مناسبی نیست. اگر تمامی مقادیر y را با 0 پیش بینی کنیم(y = 0) با وجود recall = 0، میانگین بالا خواهد رفت.

اگر تمامی نمونه‌ها را با y=1 پیش بینی کنیم، recall بسیار بالا با وجود precision = 0، میانگین را بالا خواهد برد.

راه حل بهتر محاسبه F Score خواهد بود(یا F1 Score):

$$ F Score = 2\frac{PR}{P + R} $$

برای زیاد بودن مقدار F، هردو مقدار precision و recall باید زیاد باشند.

ما می‌خواهیم Precision و Recall را روی مجموعه Cross validaion آموزش دهیم تا مجموعه آزمون دچار بایاس نشود.