《第三章 經典單方程計量經濟學模型》由會員分享,可在線閱讀,更多相關《第三章 經典單方程計量經濟學模型(22頁珍藏版)》請在人人文庫網上搜索。
1、第三章 經典單方程計量經濟學 模型:多元線性回歸模型一、 內容提要與學習指南1. 知識結構多元線性回歸模型多元回歸模型的形式與基本假設模型的基本形式:偏回歸系數的含義總體回歸函數與總體回歸模型樣本回歸函數與樣本回歸模型基本假設:非矩陣表示與矩陣表示基本建模過程模型的參數估計三大估計方法:OLS估計、ML估計、MM估計OLS估計量的統計性質:高斯-馬爾可夫定理OLS估計量的概率分布:正態分布模型的統計檢驗擬合優度檢驗:R2統計量與調整的R2方程總體線性性檢驗:F統計量變量的顯著性檢驗:t統計量參數的置信區間模型的應用:預測點預測:總體聚均值與個值的無偏預測區間預測:總體均值與個值的區間預測建模過
2、程中的其他問題樣本容量問題非線性模型的線性化:直接替換法、函數變換法、級數展開法非線性模型的直接估計:非線性OLS法虛擬變量模型基本概念:為什么引入虛擬變量虛擬變量的引入方式:加法、乘法及兩者的組合方式虛擬變量的設置原則:避免“虛擬變量陷阱”模型參數的約束性檢驗模型參數的線性約束檢驗模型中增加或減少解釋變量的檢驗參數的穩定性檢驗非線性約束:LR、WD、LM檢驗統計量2、內容提要與學習指南本章將一元回歸模型拓展到了多元回歸模型,其基本的建模思想與建模方法與一元的情形相同。主要內容仍然包括模型的基本假定、模型的估計、模型的檢驗以及模型在預測方面的應用等方面。只不過為了多元建模的需要,在基本假設方面
3、以及檢驗方面有所擴充。本章仍重點介紹了多元線性回歸模型的基本假設、估計方法以及檢驗程序。與一元回歸分析相比,多元回歸分析的基本假設中引入了多個解釋變量間不存在(完全)多重共線性這一假設;在檢驗部分,一方面引入了修正的可決系數,另一方面引入了對多個解釋變量是否對被解釋變量有顯著線性影響關系的聯合性F檢驗,并討論了F檢驗與擬合優度檢驗的內在聯系。本章的另一個重點是將線性回歸模型拓展到非線性回歸模型,主要學習非線性模型如何轉化為線性回歸模型的常見類型與方法。這里需要注意各回歸參數的具體經濟含義。當然,作為選學內容,本章也同時介紹了非線性模型的直接估計方法非線性普通最小二乘法。本章第三個學習重點是建立
4、包含虛擬解釋變量模型的相關問題。虛擬變量將經濟現象中的一些定性因素引入到可以進行定量分析的回歸模型,擴展了回歸模型的功能。如何引入不同類型的虛擬變量來解決相關的定性因素所產生的的影響是建立虛擬變量模型的核心,需要對具體問題進行深入分析來完成。引入虛擬變量的方式主要有加法方式、乘法方式以及而這的結合方式。在引入虛擬變量時有兩點需要注意,一是明確虛擬變量的對比基準,二是避免出現“虛擬變量陷阱”。本章第四個學習重點是關于模型的約束性檢驗問題,包括參數的線性約束與非線性約束檢驗。參數的線性約束檢驗包括對參數線性約束的檢驗、對模型增加或減少解釋變量的檢驗以及參數的穩定性檢驗三方面的內容,其中參數穩定性檢
5、驗又包括鄒氏參數穩定性檢驗與鄒氏預測檢驗兩種類型的檢驗。參數的約束性檢驗都是以F檢驗為主要檢驗工具,以受約束模型與無約束模型是否有顯著差異為檢驗基點。參數的非線性約束檢驗主要包括最大似然比檢驗LR、沃爾德檢驗Ward與拉格朗日乘數檢驗LM。它們仍以估計無約束模型與受約束模型為基礎,且都可以歸結到最大似然原理估計上來,并且檢驗統計量都是在大樣本下漸近地服從以約束條件個數為自由度的 分布。可以說,參數的約束性檢驗這一基本思想貫穿了經濟學學習的整個過程。非線性約束檢驗中的拉格朗日乘數檢驗在后面的章節中多次使用。3.典型例題與教材練習題知識點在下面的典型例題分析與教材練習題的解答分析中,還有如下內容需
6、要關注,它們在教材中沒有特別提及或之作為結論列出,但在計量經濟學的學習內容中非常重要。第一,多元線性模型關于參數是線性的,但關于變量可以是的非線性的。英雌模型變量采用不同的函數形式,其參數的經濟含義就會不同。例如在被解釋變量與某解釋變量都以對數函數的形式出現在模型中時,該解釋變量前的參數就是彈性的含義。那么關于其他的函數形式如何對參數的含義做解釋呢?第二,一個計量經濟學的初學者可能關注的一個問題是,多元回歸參數的估計何時恰好等于被解釋變量與每一個解釋變量作為一元回歸時的參數估計結果,即多元回歸等價于多個一元回歸?第三,在多元回歸中,OLS估計與殘差有關的若干“數值性質”有哪些?例如仍有殘差和為
7、零、殘差項羽解釋變量不相關、殘差項與估計的被解釋變量不相關等性質嗎?它們的推到過程怎么樣?第四,多元回歸模型中不包含常數項時的回歸仍稱為“過原點回歸”,多元回歸模型中過原點回歸的OLS估計會出現什么樣的變化?模型的結構參數的估計與包含常數項的回歸有差別嗎?與殘差有關的“數值性質”有何變化?第五,教材指出,在滿足高斯基本假設的情況下,多元線性回歸模型參數的OLS估計量之最佳線性無偏估計量,并證明了線性性與無偏性。那么最小方差應如何證明呢?第六,教材給出了多元線性回歸模型隨機干擾項方差的估計量表達式,它是如何推導出的呢?第七,矩估計是根據總體的矩條件,寫出對應的樣本矩條件,在矩陣表達式中,如何理解
8、兩者的“對應”性特征呢?例6 記樣本多元回歸模型為或,試證明OLS估計具有如下數值性質:(1) 估計的的均值等于實測的的均值: (2) 殘差和不相關:(3) 殘差和為零,從而殘差的均值為零:,(4) 殘差和估計的不相關:證明 (1)由于 于是 從而(2)由于多元回歸的OLS估計是在如下殘差平方和的最小化基礎上而完成的:由矩陣的求導法則容易得到該式的一階極值條件:即有如下矩陣形式表示的正規方程組:也即(3)的第一行各元素均為1,因此,(2)中的正規方程組的第一個方程恰為于是。(4)由于,則有例7 對多元線性回歸模型,試證明隨機干擾項的方差的無偏估計量為,其中e為相應樣本回歸模型的殘差向量。證明
9、由于被解釋變量的估計值與觀測值之間的殘差 殘差的平方和為 因為為對稱等冪矩陣,即所以有 由于為一數量,它本身就是它的跡,于是 其中符號“”表示矩陣的跡,其定義為矩陣主對角線元素的和。這里用到了矩陣的跡的兩個重要性質:于是以上過程既導出了隨機干擾項方差的估計量也證明了該估計量是無偏估計量。例8 對多元線性回歸模型,試證明OLS估計量具有最小方差性。證明:設是其他方法得到的關于的線性無偏估計量:其中,為固定矩陣,滿足,于是的無偏性要求。由于于是,當且僅當。的方差協方差矩陣為為主對角線元素非負的對稱矩陣(半正定矩陣),由此得的方差大于或等于OLS估計量的方差。三、教材練習題及參考解答1、多元線性回歸
10、模型的基本假設是什么?試說明在證明最小二乘估計量的無偏性和有效性的過程中,哪些基本假設起了作用?解答 多元線性回歸模型的基本假設仍然是針對隨機干擾項與針對解釋變量兩大類的假設。針對隨機干擾項的假設有:零均值,同方差,無序列相關且服從正態分布。針對解釋變量的假設有:解釋變量應具有非隨機性,如果是隨機的,則不能與隨機干擾項相關;各解釋變量之間不存在(完全)線性相關關系。在證明最小二乘估計量的無偏性中,利用了解釋變量非隨機或與隨機干擾項不相關的假設;在有效的證明中,利用了隨機干擾項同方差且無序列相關的假設。2、在多元線性回歸分析中,t檢驗與F檢驗有何不同?在一元線性回歸分析中兩者是否有等價作用?解答
11、 在多元線性回歸分析中,t檢驗常被用作檢驗回歸方程中各個參數的顯著性,而F檢驗則被用作檢驗整個回歸關系的顯著性。各解釋變量聯合起來對被解釋變量有顯著的線性關系,并不意味著每個解釋變量分別對被解釋變量有顯著的線性關系。在一元線性回歸分析中,兩者具有等價作用,因為兩者都是對共同的假設解釋變量的參數等于零進行檢驗的。3、為什么說對模型參數施加約束條件后,其回歸的殘差平方和一定不比未施加約束的殘差平方和小?在什么條件,受約束回歸與無約束回歸的結果相同?解答 對模型參數施加約束條件后,就限制了參數的取值范圍,尋找到的參數估計值也是在此條件下使殘差平方和達到最小的估計值,它不可能比未施加約束條件時找到的參
12、數估計值使得殘差平方和達到的最小值還要死。但當約束條件為真時,受約束回歸與無約束回歸的結果就相同了。4、在一項調查大學生一學期平均成績(Y)與每周在學習(X1)、睡覺(X2)、娛樂(X3)與其他各種活動(X4)所用時間的關系的研究中,建立如下回歸模型:Y=0+1X1+2X2+3X3+4X4+如果這些活動所用時間的總和為一周的總小時數168。問:保持其他變量不變,而改變其中一個變量的說法是否有意義?該模型是否有違背基本假設的情況?如何修改此模型以使其更加合理?解答 由于X1+X2+X3+X4=168,當其中一個變量變化時,至少有一個其他變量也要變化,因此,保持其他變量不變,而改變其中一個變量的說
13、法是無意義的。顯然,由于四類活動的總和為一周的總小時數168,表明X1,X2,X3,X4間存在完全的線性關系,因此違背了解釋變量間不存在(完全)多重共線性的假設。可以去掉其中的一個變量,如去掉代表“其他”活動的變量X4,則新構成的三變量模型更加合理。例如這時1就度量了當其他兩變量不變時,每周增加1小時的學習時間所帶來的學習成績的平均變化。這時,即使睡覺和娛樂的時間保持不變,也可以通過減少其他活動的時間來增加學習的時間。而這時三個變量間也不存在明顯的共線性問題。7、考慮以下過原點回歸: (1)求參數的OLS估計量;(2)對該模型為什么說對模型參數施加約束條件后,是否仍有結論 解答 (1)根據最小二乘原理,需求適當的, ,使得殘
14、差平方和最小:min 由微積分的知識,對上式分別關于,求偏導,并令倒數值為零,得如下正規方程組: 或 解得 (2)由(1)中的正規方程組知,對該模型,仍有 但不存在,即過原點回歸的殘差和不一定為零。8.對下列模型: (a) (b) 求出的最小二乘估計值,并將結果與下面的三變量回歸方程的最小二乘估計值作比較: (c)你認為哪個估計值更好?解答:將模型(a)改寫成則的估計值為將模型(b)改寫成則的估計值為對模型(c),的估計值為顯然模型(a)與模型(b)分別是模型(c)的參數在如下約束下的變形式:,因此,如果限制條件正確,則三個回歸結果相同。當然,從參數估計的表達式上看,模型(a)與模型(b)的回
15、歸算法更簡潔。但如果限制條件不正確,則模型(a)與模型(b)的回歸參數是有偏的。10.在一項對北京某大學學生月消費支出的研究中,認為學生的消費支出除受其家庭每月收入水平的影響外,還受在學校是否得到獎學金、來自農村還是城市、是經濟發達地區還是欠發達地區,以及性別等因素的影響。試設定適當的模型,并導出如下情形下學生消費支出的平均:(1)來自欠發達農村地區的女生、未得到獎學金;(2)來自欠發達城市地區的男生、得到獎學金;(3)來自發達地區的農村女生、得到獎學金;(4)來自發達地區的城市男生、未得到獎學金。解答:記學生月消費支出為,其家庭月收入水平為,則在不考慮其他因素的影響時,有如下基本回歸模型:其
16、他定性因素可用如下虛擬變量表示: , 則引入個虛擬變量后的回歸模型如下:由此回歸模型,可得如下各種情形下學生的平均消費支出:(1) 來自欠發達農村地區的女生、未得到獎學金時的月消費支出:(2) 來自欠發達城市地區的男生、得到獎學金時的月消費支出:(3) 來自發達地區的農村女生、得到獎學金時的月消費支出:(4) 來自發達地區的城市男生、未得到獎學金時的月消費支出:11. 表3-3給出三變量模型 的回歸結果。表3-3方差來源平方和 自由度平方和的均值 來自回歸 65 965-來自殘差 -來自總離差 66 04214(1) 求樣本容量,殘差平方和,回歸平方和及殘差平方和的自由度。(2) 求擬合優度及
17、調整的擬合優度。(3) 檢驗假設和對無影響。應采用何種假設檢驗?為什么?(4) 根據以上信息,你能否確定和各自對的影響?解答 (1)樣本容量為的自由度為的自由度為(2) (3)應該采用聯合假設檢驗,即檢驗,理由是只有這樣做才能判斷,一起是否對有影響。(4)不能。因為僅通過上述信息,可初步判斷,聯合起來對有線性影響,兩者的變化解釋了變化的。但由于無法知道回歸,前參數的具體估計值,因此還無法判斷它們各自對的影響有多大。14、在一項對某社區家庭對某種消費品的消費需求調查中,得到表3-4的資料。請用手工與軟件兩種方式對該社區家庭對該商品的消需求支出作二元線性回歸分析,其中手工方式要求以矩陣表達式進行運
18、算。表3-4序號對某商品的消費支Y商品單價X1家庭月收入.923..524..632..032..031..434..035..038..139..846.(1)估計回歸方程的參數及隨機干擾項的方差,計算,計算及。 (2)對方程進行F檢驗,對參數進行t檢驗,并構造參數95的置信區間。(3)如果商品單價變為35元,則某一月收入為20000的家庭的消費支出估計是多少?構造該估計值
19、的95的置信區間。解答 (1)以矩陣形式表達,二元樣本回歸方程為 參數的估計值為 由于 根據隨機干擾項方差的估計式 得到 而 故 又由于 故 (2)方程的總體線性性檢驗由下面的檢驗進行:在5%的顯著性水平下,自由度為的分布的臨界值為,可見32.294.74,表明方程的總體線性性顯著成立。 由于 故常數項與,前參數的估計值的t檢驗值分別為在5%的顯著性水平下,自由度為7的t分布的臨界值為,可見常數項及與的總體參數值均顯著地異于零。常數項與參數的95%的置信區間分別為 或 或 在軟件下,回歸結果如圖3-2所示圖3-2(3) 將X1=35,X2=20000帶入回歸方程,可得Y=626.5
20、1-9.+0.=856.20(元)由于(XX)-1= 5. -0. 0.-0. 0. -0. 0. -0. 0.因此,取X0=1 35 20000,Y的均值的預測的標準差為SY0=2X0(XX)-1X0=320.414.539=0372.62=37.05在5%的顯著性水平下為什么說對模型參數施加約束條件后,自由度為10-3-1=7的t分布的臨界值為t0.0257=2.365,于是Y的均值的95%的預測區間為856.202.36537.05 或 (768.
21、58,943.82)同樣容易得到Y個值得預測的標準差為SY0=21+X0XX-1X0=302.415.539 =1675.03=40.9315.針對教材例3.6.1,包含虛擬變量的模型(3.6.7)為:請檢驗如下兩個聯合假設,并回答問題:(1) 。并與單參數的t檢驗結果進行對比。(2) 。并與例3.7.3中的鄒氏參數穩定性檢驗的結果進行對比。 解答 (1)依題意可將模型:視為無約束模型,如果施加約束條件,則可轉化為如下受約束模型:上述無約束模型的回歸結果如下:(3.82) (-1.69) (10.27) (2.40) (7.02) (-0.04)R2 =0. F=497.56上述受
22、約束模型的回歸結果如下:(3.41) (14.53) (7.43) (0.35) R2=0. F=758.54于是,可進行如下F檢驗:該值小于5%顯著性水平下相應的臨界值F0.05(2,56)=3.16因此,拒絕原假設。原無約束回歸模型的t檢顯示,在5%的顯著性水平下,不拒絕的假設,但拒絕的假設。在軟件下,相應的檢驗過程如下:在對無約束模型進行OLS估計的回歸結果窗口中,選擇View/ Tests/Wald- (圖3-3)圖3-3在出現的Wald Test對話窗口輸入“C(2)=C(4)=0”(圖3-4
23、)。圖3-4點擊OK按鈕,即得F檢驗統計量的檢驗結果(圖3-5)。圖3-5(2)依題意,在約束條件下,原模型變化為:該受約束模型的OLS估計為: (5.23) (18.80) (7.74)R2=0. F=1154.99而原無約束模型中的可決系數為R2=0.,于是,可進行如下F檢驗在5%與10%的顯著性水平下相應的臨界值分別為F0.05(3,56)=2.77,F0.10(3,56)=2.18,因此,在5%的顯著性水平下不拒絕原假設,但在10%的顯著性水平下拒絕。這一檢驗結果與例3.7.3中鄒氏參數穩定性檢驗的結果相一致。軟件下的操作過程與(1)相似,只不過在W
24、ald Test對話框中需輸入“C(2)=C(4)=C(6)=0”17.表3-5列出了中國某年按行業分的全部制造業國有企業及規模以上制造業非國有企業的工業總產值Y,資產合計K及職工人數L。設定模型為(1)利用上述資料,進行回歸分析。(2)回答:中國該年的制造業總體呈現規模報酬不變的狀態嗎?表3-5序號工業總產值Y(億元)資產合計K(億元)職工人數L(萬人)序號工業總產值Y(億元)資產合計K(億元)職工人數L(萬人)13722.70 3078..70 1118.81 .52 1684.43 .70 2052.16 .37 2742.
25、77 .85 6113.11 .29 1973.82 .90 9228.25 .30 5917.01 .23 2866.65 .16 1758.77 .76 2545.63 .17 939.10 .95 4787.90 .77 694.94 .63 3255.29 .18 363.48 .83 8129.68 .36 2511.99 .68 5260.20 1
26、.71 973.73 .58 7518.79 .94 516.01 .91 984.52 .19 3785.91 .39 18626.94 .02 8688.03 .30 610.91 .37 2798.90 .53 1523.19 .07 1808.44 33解答(1)在軟件下,選中 ,在出現的對話框中輸入“log(Y) C log(K) log(L)”,得到如圖3
27、-6所示的回歸結果。圖3-6于是,樣本回歸方程為 (1.59) (3.45) (1.79) 給定顯著性水平5%,自由度為(2,28)的F分布的臨界值為,因此總體上看,,聯合起來對有顯著的線性影響。在5%的顯著性水平下,自由度為28的t分布的臨界值為,因此,的參數通過了該顯著性水平下的t檢驗,但未通過檢驗。如果設定顯著性水平為10%,t分布的臨界值為,這時的參數通過了顯著性水平檢驗。表明,工業總產值對數值的79.6%的變化可以由資產合計的對數值與職工人數的對數值的變化來解釋,但仍有20.4%的變化是由其他因素的變化影響的。(2)從上述回歸結果看,即資產與勞動的產出彈性之和近似為1,表明中國制造業
28、在該年基本呈現規模報酬不變的狀態。下面進行參數的約束檢驗,檢驗的零假設為。如果原假設為真,則可估計如下模型:通過上述資料,估計結果如圖3-7所示。圖3-7容易看出,該估計方程通過了F檢驗與參數的t檢驗。在原假設為真的條件下,有在5%的顯著性水平,自由度為(1,28)的F分布的臨界值為4.20.0.10114.20,不拒絕原假設,表明該年中國制造業呈現規模報酬不變的狀態。在軟件中,當估計完圖3-6所示的模型后,選中 ,在出現的對話框中輸入“C(2)+C(3)=1”,單擊OK后出現圖3-8所
29、示的結果。因此,得出的結論仍是不拒絕原假設,原假設為真。圖3-818.繼續17題,如果將C-D生產函數設定為,則模型式非線性的,而且無法線性化。試給出這一設定的非線性普通最小二乘估計,并與第17題的估計結果進行比較。解答 在軟件下,選中“ ”,在出現的 對話框中輸入“”(圖3-9),點擊OK按鈕,得如圖3-10所表示的結果。圖3-9圖3-10因此按非線性普通最小二乘估計的C-D生產函數為對照第17題的估計結果或可以看出,直接采用非線性OLS法估計與轉化為線性模型后的估計結果有是所不同。第17題的這一估計結果顯示,存在規模報酬不變的特性,但這里非線性的估計結果不存在這一特性(仍可通過Wald Test進行檢驗)。盡管如此,兩個估計結果顯示的基本特征大致相同:一方面,兩個結果均表明資本投入的產出彈性大于勞動投入的產出彈性,另一方面,它們都呈現資本投入的產出彈性在5%的顯著水平下顯著不為零,而勞動投入的產出彈性則在5%的顯著性水平下不顯著、在10%的顯著性水平下顯著的基本特征。