有很多典型的歸納學習問題。它們之間的主要區(qū)別在于它們試圖預測的是什么類型的東西。這里有一些例子:
回歸(Regression): 試圖預測一個真實值。例如,根據(jù)過去的情況,預測股票明天的價格?;蛘吒鶕?jù)愛麗絲(關于Alice 稍后會介紹她的前世今生)的家庭作業(yè)分數(shù),預測她在機器學習期末考試中的分數(shù)。
二分類(Binary Classification): 試圖預測一個關于“是或不是”簡單的響應。例如,預測愛麗絲是否會喜歡上一門課。或者預測用戶對最新蘋果產(chǎn)品的評價是對產(chǎn)品的正面還是負面的評價。
多類分類(Multiclass Classification): 嘗試為一個樣例在多個類別中尋找它的類別。例如,預測一個新聞故事是關于娛樂、體育、政治、宗教等,還是預測一個課程類型是系統(tǒng)、理論、人工智能還是其他。
排序(Ranking): 試圖將一組對象按相關性排序。例如,為了響應用戶的查詢,預測查詢結(jié)果在顯示時的排序?;蛘哳A測愛麗絲對課程的偏好程度。
由于他們試圖預測的對象類型的類型而導致機器學習問題的原因很容易,這與測量誤差有關?;叵胍幌?,我們的目標是建立一個能夠做出“好的預測”的系統(tǒng)。這就引出了一個問題:預測“good”意味著什么?“不同類型的學習問題在他們?nèi)绾味x善良方面有所不同。例如,在回歸中,預測股價為0.05美元的股票價格可能要比在200美元時便宜很多。同樣的,不包含多類分類。在那里,意外地預測“娛樂”而不是“體育”并不比預測“政治”更好或更糟糕。
如果可以,請對于每一類典型的機器學習問題,留言一個或兩個具體的例子。