跳至內容

非線性迴歸

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
米-門二氏動力學 的詳細資訊圖像

在統計學中, 非線性迴歸迴歸分析的一種形式,其中觀測數據由函數建模,該函數是模型參數的非線性組合併且取決於一個或多個獨立變數。 通過逐次逼近的方法擬合數據。

一般

[編輯]

在非線性迴歸中,形式的統計模型

關聯自變數 x的向量及其相關的觀察到的應變數 y 。函數f在參數β的矢量的分量中是非線性的,但在其他方面是任意的。例如,酶動力學的米-門二氏動力學模型有兩個參數和一個獨立變數,由f相關: [a]

此函數是非線性的,因為它不能表示為兩個 線性組合

系統誤差可能存在於自變數中,但其處理不在迴歸分析的範圍內。 如果自變數不是無差錯的,那麼這是一個變數誤差模型 ,也在此範圍之外。

非線性函數的其他示例包括指數函數 , 對數函數 , 三角函數冪函數高斯函數洛倫茲曲線 。 某些函數(如指數函數或對數函數)可以進行轉換,以使它們是線性的。 如此轉換,可以執行標準線性迴歸,但必須謹慎應用。 有關詳細資訊,請參閱下面的線性化§Transformation 。

通常,對於最佳擬合參數,沒有閉合形式表達式,如線性迴歸 中所示。 通常應用數值最佳化算法來確定最佳擬合參數。 與線性迴歸相比,可能存在要最佳化的函數的許多局部最小值 ,甚至全局最小值也可能產生偏誤估計。 在實踐中,結合最佳化算法使用參數的估計值來嘗試找到平方和的全局最小值。

迴歸統計

[編輯]

這個過程的基本假設是模型可以用線性函數近似,即一階泰勒級數

其中 ,由此得出最小平方估計量由下式給出 .

計算非線性迴歸統計量並將其用作線性迴歸統計量,但在公式中使用J代替X. 線性近似將偏誤引入統計中。 因此,在解釋從非線性模型得到的統計數據時,需要比平常更多的謹慎。

普通和加權最小平方法

[編輯]

最佳擬合曲線通常假定應該看起來平方的總和最小化殘差 。 這是普通的最小平方 (OLS)方法。 然而,在應變數不具有恆定變異數的情況下,可以最小化加權平方殘差的總和;看加權最小平方法 。 理想情況下,每個權重應等於觀察變異數的倒數,但是在迭代加權最小平方算法中,可以在每次迭代時重新計算權重。

線性化

[編輯]

轉型

[編輯]

通過模型公式的適當轉換,可以將一些非線性迴歸問題移動到線性域。

例如,考慮非線性迴歸問題

帶有參數ab以及乘法誤差項U.如果我們採用雙方的對數,那就變成了

其中u = ln( U ),建議通過x上的ln( y )的線性迴歸估計未知參數,該計算不需要迭代最佳化。 但是,使用非線性轉換需要謹慎。 數據值的影響將發生變化,模型的誤差結構和任何推論結果的解釋也將發生變化。 這些可能不是期望值的效果。 另一方面,取決於最大誤差源是什麼,非線性轉換可以以高斯方式分布誤差,因此必須通過建模考慮來選擇執行非線性轉換。

對於米-門二氏動力學 ,線性雙倒數圖

1 / v對1 / [ S ]已被大量使用。 但是,由於它對數據錯誤非常敏感,並且強烈偏向於將數據擬合到自變數[ S ]的特定範圍內,因此強烈建議不要使用它。

對於屬於指數族的誤差分布,可以使用連結函數來轉換廣義線性模型框架下的參數。

分割

[編輯]
芥菜和土壤鹽分的產量

獨立解釋變數 (比如X)可以分成類或段,並且可以對每個段執行線性迴歸 。 具有置信度分析的分段迴歸可以產生依賴響應變數 (假設Y)在各個段中表現不同的結果。 [1]

該圖顯示土壤鹽度 (X)最初對芥菜的作物產量 (Y)沒有影響,直到臨界 值( 斷點 ),之後產量受到負面影響。 [2]

參見

[編輯]

參考文獻

[編輯]
  1. ^ RJOosterbaan,1994,頻率和迴歸分析。在:HPRitzema(ed。),Drainage Principles and Applications,Publ。 16,pp.175-224,國際土地復墾與改良研究所(ILRI),荷蘭瓦赫寧根。
  2. ^ RJOosterbaan,2002年。農民田間的排水研究:數據分析。國際土地復墾與改良研究所(ILRI)項目「液體黃金」的一部分,荷蘭瓦赫寧根。以PDF格式下載 : [1]頁面存檔備份,存於網際網路檔案館) 。這個數字是用SegReg程序製作的,可以從[2]頁面存檔備份,存於網際網路檔案館)免費下載。

腳註

[編輯]
  1. ^ This model can also be expressed in the conventional biological notation:

拓展閱讀

[編輯]