午夜视频在线网站,日韩视频精品在线,中文字幕精品一区二区三区在线,在线播放精品,1024你懂我懂的旧版人,欧美日韩一级黄色片,一区二区三区在线观看视频

分享

邏輯回歸與線性回歸的區(qū)別

 萬皇之皇 2018-06-17

logistic回歸與線性回歸實際上有很多相同之處,最大的區(qū)別就在于他們的因變量不同,其他的基本都差不多,正是因為如此,這兩種回歸可以歸于同一個家族,即廣義線性模型(generalized
linear
model)。這一家族中的模型形式基本上都差不多,不同的就是因變量不同,如果是連續(xù)的,就是多重線性回歸,如果是二項分布,就是logistic回歸。logistic回歸的因變量可以是二分類的,也可以是多分類的,但是二分類的更為常用,也更加容易解釋。所以實際中最為常用的就是二分類的logistic回歸。

與線性回歸不同,邏輯回歸主要用于解決分類問題,那么線性回歸能不能做同樣的事情呢?下面舉一個例子。比如惡性腫瘤和良性腫瘤的判定。假設(shè)我們通過擬合數(shù)據(jù)得到線性回歸方程和一個閾值,用閾值判定是良性還是惡性:
邏輯回歸與線性回歸的區(qū)別

如圖,size小于某值就是良性,否則惡性。但是“噪聲”對線性方程的影響特別大,會大大降低分類準(zhǔn)確性。例如再加三個樣本就可以使方程變成這樣:
  邏輯回歸與線性回歸的區(qū)別

  那么,邏輯斯特回歸是怎么做的呢?如果不能找到一個絕對的數(shù)值判定腫瘤的性質(zhì),就用概率的方法,預(yù)測出一個概率,比如>0.5判定為惡性的。

2.2 Sigmoid函數(shù)

  邏輯回歸首先把樣本映射到[0,1]之間的數(shù)值,這就歸功于sigmoid函數(shù),可以把任何連續(xù)的值映射到[0,1]之間,數(shù)越大越趨向于0,越小越趨近于1。

  函數(shù)的圖像如下圖,x=0的時候y對應(yīng)中心點。
  
邏輯回歸與線性回歸的區(qū)別

  判定邊界:對多元線性回歸方程求Sigmoid函數(shù)hθ(x)=g(θ0+θ1x1+...+θnxn)hθ(x)=g(θ0+θ1x1+...+θnxn),找到一組θθ,假設(shè)得到?3+x1+x2=0?3+x1+x2=0的直線,把樣本分成兩類。把(1,1)代入g函數(shù),概率值<0.5,就判定為負(fù)樣本。這條直線就是判定邊界,如下圖:>
  

邏輯回歸與線性回歸的區(qū)別

擬合:擬合模型/函數(shù)

由測量的數(shù)據(jù),估計一個假定的模型/函數(shù)。如何擬合,擬合的模型是否合適?可分為以下三類

1合適擬合

2欠擬合

3 過擬合

看過一篇文章(附錄)的圖示,理解起來很不錯:

欠擬合:
邏輯回歸欠擬合

邏輯回歸與線性回歸的區(qū)別

合適的擬合
邏輯回歸與線性回歸的區(qū)別

過擬合
邏輯回歸與線性回歸的區(qū)別

過擬合的問題如何解決?

模型太復(fù)雜,參數(shù)過多,特征數(shù)目過多。

參考文章:
https://blog.csdn.net/viewcode/article/details/8794401
https://blog.csdn.net/JoyceWYJ/article/details/51596797

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多