來(lái)自于Simple Learning Pro的系列
相關(guān)性
為了描述兩個(gè)變量之間的相關(guān)關(guān)系,我們一般可以采用散點(diǎn)圖用于描述。
這兩個(gè)變量,我們把其中一個(gè)稱為解釋變量,也是自變量;一般放于X軸;另一個(gè)稱為自變量,一般放于Y軸
描述相關(guān)性(r)時(shí)有兩個(gè)要素:
相關(guān)性的方向:正相關(guān) or 負(fù)相關(guān)
相關(guān)性的強(qiáng)弱:越接近于1/-1表示相關(guān)性越強(qiáng)

相關(guān)性
回歸方程和R-squared
為了對(duì)兩個(gè)變量之間的相關(guān)關(guān)系做更好的描述,我們可以引入回歸方程;
Y=b0+b1*X;其中b0為截距,b1為相關(guān)系數(shù)
同時(shí)我們引入R-squared(上文中r的平方)來(lái)反映回歸方程整體的擬合度,表達(dá)因變量與所有自變量之間的總體關(guān)系。R2等于回歸平方和在總平方和中所占的比率,即回歸方程所能解釋的因變量變異性的百分比。

回歸方程
殘差
殘差:觀測(cè)值與擬合值的偏離,殘差大小可以衡量預(yù)測(cè)的準(zhǔn)確性;
在回歸中也要注意異常值點(diǎn)
