logistic回歸

logistic 回歸:用于二元分類的算法,舉例:當(dāng)你輸入一張照片時(shí),需要判斷當(dāng)前的照片是否為貓,希望的輸出為如果是貓,輸出為1,否則輸出為0,這就是一個(gè)簡單的二元分類。首先我們必須明確在電腦照片如何存儲的,一張彩色的照片通常被存儲為紅、綠、藍(lán)三個(gè)顏色通道,如果該照片是64*64 的像素的,則在計(jì)算機(jī)中存儲3個(gè)64*64的矩陣,分別表示亮度,此時(shí)得到我們的輸入特征向量x的維數(shù)為64*64*3=12288,在二元分類中,我們希望訓(xùn)練一個(gè)分類器,它以圖片的特征向量X作為輸入,然后得到一個(gè)數(shù)據(jù)Y,如果有貓的話,輸出為1,否則輸出為0.

神經(jīng)網(wǎng)絡(luò)中通用的一些表示方法,(x,y)中x表示n=12288的n行1列的矩陣,y表示訓(xùn)練模型的輸出結(jié)果,值為0或者1,(x,y)表示一個(gè)樣本,一共有m個(gè)樣本。

傳統(tǒng)的線性回歸算法通??梢员硎緸閥=wx+b,然而它不符合上述將圖片作為輸入時(shí),得到一個(gè)y值輸出,y的值只能為0或者1。此時(shí)sigmoid 函數(shù)的作用就顯而易見了,引用簡書中一位作者多sigmoid函數(shù)的介紹,http://m.itdecent.cn/p/fcbc6983cc9a,sigmoid 函數(shù)滿足在(0.0.5)的中心對稱,該函數(shù)的值域?yàn)椋?,1)的光滑函數(shù),用于估計(jì)某種事件的可能性。當(dāng)自變量非常大的時(shí)候,sigmoid函數(shù)的值趨近于1,如果自變量是一個(gè)很小的值,此時(shí)sigmoid函數(shù)的值無限趨近于0,通常的時(shí)候,我們將w和b的值就行預(yù)測,使得預(yù)測值無限接近于正確值。在完成編程的過程中,我們分別對w和b進(jìn)行預(yù)測,b對應(yīng)攔截器。在明確上述概念的時(shí)候,預(yù)測值y^=wx+b

為了訓(xùn)練logistic回歸模型的參數(shù)W和b,我們需要定義兩個(gè)函數(shù):損失函數(shù)和成本函數(shù)

損失函數(shù)為:


? --適用于單個(gè)訓(xùn)練集

成本函數(shù)為: ? ? ? ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??

--基于參數(shù)的總成本,我們的目的是為找到合適的w和b 使得成本函數(shù)達(dá)到最小

成本函數(shù)是一個(gè)與w和b 有關(guān)的二維凸函數(shù)

J函數(shù),凸函數(shù),有極值

梯度下降法:我們要做的是先初始化w和b,然后沿著下降最陡的方向下一步,當(dāng)走了一步之后,可能會停住,重復(fù)執(zhí)行w=w-α? ? b=b-α,迭代是的w和b 出現(xiàn)在上面極值點(diǎn)處,使得成本函數(shù)達(dá)到最低。

在計(jì)算參數(shù)w和b 的過程中需要用到導(dǎo)數(shù),這里的導(dǎo)數(shù)很簡單就不贅述,下面PPT中的數(shù)值α表示學(xué)習(xí)率


logistic回歸中的梯度下降
實(shí)現(xiàn)參數(shù)迭代的代碼

兩個(gè)循環(huán)組成,外層循環(huán)遍歷數(shù)據(jù)集,內(nèi)層循環(huán)將算法中的參數(shù)循環(huán)展示

考慮到現(xiàn)有的數(shù)據(jù)集越來越大,現(xiàn)在的神經(jīng)網(wǎng)絡(luò)往往選擇采用向量化的方法完成原本的循環(huán)操作

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容