مثلا در داده ی خانه ها نماد ها به این صورت هستند:
نماد | |
---|---|
$m$ | تعداد کل ردیف های جدول داده آموزش |
$x$ | متغیر های ورودی |
$y$ | متغیر های خروجی یا هدف |
برای آدرس دهی در جدول به این شکل عمل میکنیم:
$$(x_i, y_i) \Rightarrow x_1= 2104, y_1 = 460$$
اینجا منظور از $i$ اندیس داده در جدول است.
همانطور که میبینید هدف ما اینکه با دادن مجموعه آموزشی به الگوریتم، تابعی را به وجود بیاوریم که با گرفتن متغیر ورودی $x$ متغیر خروجی یعنی $y$ را پیش بینی کند! که به تابع $h$ ، فرضیه میگوییم.
تابع $h$ را به این شکل نمایش میدهیم: $$ h_\theta(x) = \theta_0 + \theta_1x $$
که این در واقع رگرسیون خطی تک متغیره است، $x$ همان تک متغیر مدل است، $ \theta_0, \theta_1 $ نیز پارامتر های مدل هستند.
خط قرمز همان تابع $h$ است که برای پیش بینی قیمت خانه با متغیر $x$ به دست آمده