曲線回歸分析
在一元回歸中,若因變量和自變量相關的趨勢不是線性分布,呈現曲線關系。這種情況可以利用SPSS提供的曲線估計過程(Curve )方便地進行線性擬合,選出最佳的回歸模型來擬合出相應曲線。
下面以一個實例來介紹曲線擬合的基本步驟和使用方法。
例子
臺灣稻螟蟻螟侵入不同葉齡稻莖后的生存率數據(表4-1)。擬合出適合的曲線模型,來表達不同葉齡稻莖對臺灣稻螟蟻螟侵入的生存關系。
表4-1 臺灣稻螟蟻螟侵入不同葉齡稻莖后的生存率數據
生存率
8.9
10.3
12.3
12.9
13.1
13.5
13.8
13.6
12.7
13.5
葉齡
2
3
4
5
6
7
8
9
10
11
本例子數據保存在DATA6-3.SAV。
1)準備分析數據
在SPSS數據編輯窗口建立變量“生存率”和“葉齡”兩個變量,把表6-13中的數據輸入到對應的變量中。
或者打開已經存在的數據文件(DATA6-3.SAV)。
2)啟動線性回歸過程
單擊SPSS主菜單的“”下的“”中“Curve ”項,將打開如圖4-1所示的線回歸對話窗口。
圖4-1 線回歸對話窗口
3) 設置分析變量
設置因變量:從左側的變量列表框中選擇一個或多個因變量進入“(s)”框。本例子選“生存率”變量為因變量。
設置自變量:選擇一個變量為自變量,進入“”框如何用spss建立回歸模型,也可選取“”框中的“Time”項如何用spss建立回歸模型,即以時間為自變量。本例子選“葉齡”變量為自變量。
選擇標簽變量: 選擇一個變量進入到“Case ”框中,該變量為標簽變量,可以利用該變量的值在圖上查找觀測值。本例子沒有標簽變量。
4)選擇曲線方程模型
在“”框中選擇一個或多個回歸方程模型,這11個模型都可化為相應的線性模型。其中各項的意義分別為:
(1) 線性模型
(2) 二次模型
(3) 復合模型
(4) 生長模型
(5) 對數模型
(6) S 形模型
(7) Cubic 拋物線模型
(8) 指數的模型
(9) 倒數模型
(10) Power 冪函數模型
(11) 邏輯斯蒂模型
在各項模型上單擊鼠標右鍵,可以得到模型的方程類型。當選中“”項時,應在“Upper bound”框中輸入一個數值作為邏輯模型的上限值。
本例子選中第9號模型(,倒數模型)。
5)設置方程常數項
選中“ in ”項回歸方程中包含常數項。
6)繪制模型擬合圖
選中“Plot ”項繪制出回歸方程模型圖。本例子選中此項。
7)輸出方差分析表
選中“ ANOVA table”項,將輸出方差分析表。
8) 保存分析數據
單擊“Save”按鈕,將打開如圖4-2所示的對話框。該對話框用于選擇要保存的新變量。
圖4-2 曲線回歸保存值設置對話窗口
“Save ”框中列出了可保存的新變量:
“ ”預測值。因變量的預測值。
“”殘差。因變量的觀測值和預測值的差。
“ ”殘差因變量的預測區間。
當選中“ ”項時,可在該項下面的“ ”框中輸入顯著性水平。
本例子選中“ ”項、“”項和“ ”項。
“ cases”:當選擇時間序列為自變量時,本欄設置一個超過數據時間序列的預測周期。其中各項的意義分別為:
“ from last case”根據估計周期為所有的觀測量提供預測周期。
“ ”當要預測的觀測量超過當前的數據時間序列時,輸入觀測量的一個周期數值。
9)提交執行
在主對話框里單擊“OK”,提交執行,結果將顯示在輸出窗口中。輸出結果主要分兩部分:第一部分是文本輸出,給出了曲線模型、各統計量、方差分析以及曲線方程系數,見圖3-3;第二部分是預測模型與分析數據的圖形比較,見圖3-2。
有時SPSS在輸出瀏覽窗口不會完全顯示出來所有的文本,在文本框左下角顯示了一個紅色三角形來提示我們。可以使用鼠標選中文本塊,拖動鼠標把文本框擴大,直至顯示出全部文本。
根據“曲線回歸保存值設置對話窗口”的設置,SPSS在數據編輯窗口增添如下變量:
10) 結果分析
主要結果:
圖3-3 曲線回歸的文字輸出部分
圖3-4 回歸方程模型圖
分析:
建立回歸模型:
根據圖3-3中方程變量表得:
y = 14. - 11./x
回歸方程的顯著性檢驗:
回歸方程的方差分析表明:F=81.94,顯著水平為0.000。相關系數平方(R2)=0.91105。
從圖3-4回歸方程模型圖中也可以看出模型擬合程度是很好的。
結果: 表明用“ y = 14. - 11./x”模型能很好地描述了水稻不同葉齡(x)對臺灣稻螟蟻螟侵入后生存率(y)影響的數量相關關系。