CHƯƠNG : HỒI QUI ĐA BIẾN Mô hìh hồi quy đơ đã trìh bày ở các chươg và là há hữu dụg cho rất hiều trườg hợp hác hau. Mặc dù vậy, ó trở ê hôg cò phù hợp ữa hi có hiều hơ một yếu tố tác độg đế biế cầ được giải thích. Hồi quy đa biế cho phép chúg ta ghiê cứu hữg trườg hợp hư vậy. Hãy xét các ví dụ sau:. Giới thiệu về hồi quy đa biế Ví dụ.: Rất hiều các ghiê cứu trê thế giới qua tâm tới mối qua hệ giữa thu hập và trìh độ học vấ. Chúg ta ỳ vọg rằg, ít ra về trug bìh mà ói, học vấ càg cao, thì thu hập càg cao. Vì vậy, chúg ta có thể lập phươg trìh hồi quy sau: Thu hập Học vấ + ε Tuy hiê, mô hìh ày đã bỏ qua một yếu tố há qua trọg là mọi gười thườg có mức thu hập cao hơ hi họ làm việc lâu ăm hơ, bất ể trìh độ học vấ của họ thế ào. Vậy ê, mô hìh tốt hơ cho mục đích ghiê cứu của chúg ta sẽ là: Thu hập Học vấ Tuổi + ε Nhưg gười ta cũg thườg qua sát thấy, thu hập có xu hướg tăg chậm dầ hi gười ta càg hiều tuổi hơ so với thời trẻ. Để thể hiệ điều đó, chúg ta mở rộg mô hìh hư sau: Thu hập Học vấ Tuổi + Tuổi Và chúg ta sẽ ỳ vọg rằg, mag dấu dươg, và mag dấu âm. Như vậy, chúg ta đã rời bỏ thế giới của hồi quy đơ và bước sag hồi quy đa biế. Ví dụ.: Nghiê cứu về hu cầu đầu tư ở Mỹ trog hoảg thời gia từ ăm 968 98. Ở Mỹ, thời ỳ ày mag dấu ấ lịch sử là cuộc chiế trah Việt Nam éo dài, dẫ đế bội chi gâ sách và lạm phát. Một ăm sau hi chiế trah ết thúc, lạm phát ở Mỹ đã đạt tới mức ỷ lục là 9.% vào ăm976. Điều đó dẫ đế việc gâ hàg trug ươg phải áp dụg mạh mẽ chíh sách tiề tệ chặt, vố đã được áp dụg trog vài ăm trước, và đưa Lê Hồg Nhật - + ε
mức lãi suất lê tới mức cao ỷ lục là 7.8%. hi sự díh líu của Mỹ về quâ sự tại Việt Nam đã hoà toà chấm dứt, guồ hâ lực trước đây phục vụ cho chiế trah ay chuyể ào ạt sag hu vực thươg mại. Và điều ày lại lại làm dấy lê một đợt lạm phát mới, đạt tới 9.% vào ăm 98, sau đó được đưa về mức 5.99% vào ăm 98 hờ vào việc âg lãi suất lê tới.%. Như vậy, lịch sử ih tế Mỹ trog thời ỳ ày được đặc trưg bởi chíh sách tiề tệ chặt, éo theo xu hướg cắt giảm liê tục về đầu tư qua các ăm. Chíh vì vậy, các hà ghiê cứu Mỹ đã đề xuất mô hìh ghiê cứu sau về cầu đầu tư vào giai đoạ ày: INV T G INT + ε Trog đó, INV và G lầ lượt là cầu về đầu tư và GNP thực tế, đơ vị trillios dollars; INT là lãi suất; và T là biế xu thế, tíh theo thời gia đã trôi qua, ể từ ăm 968. Từ lý luậ ih tế vĩ mô, chúg ta ỳ vọg rằg, mag dấu dươg, và mag dấu âm. Và vì đây là thời ỳ đầu tư ở Mỹ có xu thế bị co hẹp, chúg ta cũg ỳ vọg rằg mag dấu âm. Sử dụg dữ liệu thốg ê vĩ mô của ề ih tế Mỹ, từ ăm 968-98 [xem bảg dữ liệu. phía dưới], ết quả ước lượg của mô hìh hồi quy ày hư sau: Bảg Error! No text of specified style i documet..: Bảg ết xuất mô hìh hồi qui các yếu tố ảh hưởg đế cầu về đầu tư của Mỹ trog giai đoạ từ 968-98 Depedet Variable: INV Method: Least Squares Date: 0/09/07 Time: 6: Sample: 5 Icluded observatios: 5 Variable Coefficiet Std. Error t-statistic Prob. C -0.5097 0.0556-9.6997 0.0000 T -0.0658 0.00880-8.8958 0.0000 G 0.67066 0.056.78506 0.0000 INT -0.0065 0.000 -.878 0.00 R-squared 0.970 Mea depedet var 0.0 Adjusted R-squared 0.96898 S.D. depedet var 0.077 S.E. of regressio 0.0060 Aaie ifo criterio -7.0086 Sum squared resid 0.0005 Schwarz criterio -6.8500 Log lielihood 56.806 F-statistic 9.78 Durbi-Watso stat.9585 Prob(F-statistic) 0.000000 Lê Hồg Nhật -
Dưới dạg báo cáo, ết quả đó có thể được viết tóm tắt hư dưới đây: INV -0.509-0.065T + 0.67G - 0.00 INT (0.055) (0.008) (0.05) (0.00) R 0.97, N 5, ESS 0.0005 Nếu viết dưới dạg sai phâ, ta có: Δ INV - 0.065 Δ T + 0.67 Δ G - 0.00 Δ INT Nói hác đi, ếu các yếu tố hác được giữ hôg đổi, cứ sau mỗi một ăm, ể từ ăm 968 (tức là Δ T ), hu cầu đầu tư sẽ bị giảm là -0.065 trillios dollars. Cũg hư vậy, ếu bỏ qua yếu tố xu thế và lãi suất, tác độg riêg phầ của việc tăg GNP lê 0. trillios dollars ( Δ G 0.), sẽ làm cầu về đầu tư tăg lê thêm 0.067 trillios; và ếu đẩy lãi suất lê thêm % ( Δ INT ), trog hi giữ guyê các yếu tố cò lại, thì sẽ làm đầu tư giảm đi là -0.00 trillios dollars. Nhữg tíh toá trê đây cho thấy có sự tươg đồg rõ rệt về cách diễ giải ý ghĩa của các hệ số ước lượg trog mô hìh hồi quy đa biế so với trườg hợp đơ biế. Điều đó gợi ý rằg, về mặt bả chất, mô hìh hồi quy đa biế sẽ chỉ là sự mở rộg của hồi quy đơ biế. Ta sẽ thấy rõ hơ điều đó ở các phầ sau.. Biểu diễ đại số của mô hìh hồi quy đa biế Chúg ta hãy đưa ra bảg so sáh về dạg hàm của mô hìh hồi quy đa biế so với trườg hợp đơ biế: Ví dụ Dạg mô hìh Với mỗi qua sát Hồi quy đơ biế Hồi quy đa biế CONS INC + ε INV T G INT + ε Y + ε Y + ε y + ε y x x x + ε x Như vậy, hồi quy đa biế là một sự mở rộg tự hiê của trườg hợp đơ biế, hi số biế giải thích lớ hơ, ể cả hằg số. Để cho tiệ lợi, chúg ta sẽ đưa vào các ý hiệu vector: Lê Hồg Nhật -
Gọi vector hàg x (, x, x, x ) là vector các qua sát thứ,..., N của các biế giải thích. [Lưu ý, dấu phẩy ở bê phải, phía trê vector x là dấu chuyể vị. Như vậy, theo mặc địh, mọi vector (mà hôg có dấu chuyể vị) đều được coi là vector cột]. N Từg cặp qua sát dữ liệu do vậy, sẽ là, }. { y x Để mih họa, trog ví dụ. về cầu về đầu tư ở Mỹ (968 8), hữg cặp ( y, x ) được tô màu: ( y, x 5 5 ) và Bảg Error! No text of specified style i documet..: Dữ liệu vĩ mô về đầu tư và các biế giải thích của ề ih tế Mỹ (968 8). Obs INV C T G INT () (Y) () () () () 0.6.058 5.6 0.7.088 5.87 0.58.086 5.95 0.7..88 5 0.95 5.86.5 6 0.7 6.5 6. 7 0.99 7.6 7.8 8 0.6 8. 6.5 9 0.95 9.98 5.5 ( y, x 5 5 ) 0 0. 0.7 5.6 0.57.9 7.6 0.59.79 0.8 ( y, x ) 0.5.7.77 0..50. 5 0.0 5.75.0 Nguồ: Ecoomic Report of the Presidet. Govermet, Pritig Office, Washigto D.C., 98. Tiếp theo, ta gọi vector cột là vector các tham số tổg thể, cầ được ước lượg Lưu ý rằg, tích vô hướg giữa hai vector x và sẽ tạo lại phầ xu thế trog vế phải của phươg trìh hồi quy (.): Lê Hồg Nhật -
x (, x, x, x ) x x x,,.. N Vì vậy, ứg với từg cặp qua sát hư sau: N { x, y }, ta có thể viết lại phươg trìh hồi quy đó y x + ε,,.., N (.) Như vậy, mọi ý hiệu ta đã sử dụg trog ước lượg mô hìh hồi quy đơ biế, ay có thể được sử dụg lại cho mô hìh hồi quy đa biế. Cụ thể là: y x,,.., N (.) Và sai số ước lượg hay số dư (residual) sẽ có dạg: e y yˆ (.) Việc tiế hàh ước lượg các tham số của mô hìh bằg phươg pháp bìh phươg cực tiểu tươg đươg với việc giải bài toá sau: S ( ) e ( y x ) mi (.5) Tươg tự hư trog hồi quy đơ, ở đây, ta sử dụg điều iệ cực trị, (first order coditio, FOC), để tìm các tham số ước lượg trìh sau: S( ˆ) 0 S( ˆ) 0 S( ˆ) 0 ˆ,,,,.. Nói hác đi, ta đi giải hệ phươg Lê Hồg Nhật -5
S( ˆ) 0 (.6) Đây là hệ gồm phươg trìh với ẩ số, mà việc giải ó cho chúg ta tham số ước lượg (,,, ). Sử dụg phầ mềm Eviews, ết quả tíh toá các tham số ày đã được êu trog bảg báo cáo. ở trê. Mặc dù dạg biểu diễ giải tích của vector là há phức tạp. Tuy hiê, về bả chất chúg vẫ hôg hác gì trườg hợp đơ biế. Cụ thể là, tươg tự hư α, phươg trìh đầu tiê của hệ (.6) để ước lượg dẫ đế cái điều là, đườg hồi quy đi qua điểm trug bìh ( y, x ). Và vì vậy, ta cũg có thể ói đế tiêu chuẩ đo lườg độ phù hợp của đườg hồi quy R. Cụ thể là từ mối qua hệ (.): y y + e Hay cũg hệt hư thế: ( y y) y y+ e Người ta có thể viết lại ó hư sau: ( y y) ( x x ) + e Tức là, sự giao độg so với trug bìh của biế Y được giải thích một phầ bởi mô hìh, và phầ cò lại là sai số e, chưa được giải thích bởi mô hìh. Sử dụg các điều iệ tìm cực trị (.6), ta cũg có thể viết lại qua hệ đó hư sau: ( y y) ( y y) e + Hay cũg vậy, TSS RSS + ESS Vì thế, chúg ta có thể đưa ra địh ghĩa: Lê Hồg Nhật -6
R ESS TSS ( 0 R ). và sử dụg ó làm thước đo mức độ phù hợp của đườg hồi quy với dữ liệu qua sát. Phầ tiếp sau sẽ đề cập đế bả chất thốg ê của mô hìh hồi quy đa biế.. Bả chất thốg ê của mô hìh hồi quy đa biế Từ bây giờ, chúg ta sẽ sử dụg dạg tổg quát của mô hìh hồi quy đa biế: Y +... +... + ε (.7) y x +... x +... x + ε x + ε,,,,..., N Việc hồi quy mô hìh (.7) sẽ cho ta biểu diễ sau: Y + +... +... y x +... x +... x + e x + e,,,,..., N + e (.8) Trog đó, N là số qua sát, và là số biế giải thích. Ta phát biểu địh lý sau : Địh lý.: Phươg pháp bìh phươg cực tiểu, áp dụg cho mô hìh hồi quy đa biế, sẽ cho ta các tham số ước lượg dưới dạg sau: ˆ + c ε,,,.., (.9) Cũg hư trườg hợp đơ biế, phươg trìh (.9) chỉ ra rằg: ˆ bị tác độg bởi các yếu tố gẫu hiê ε, làm giá trị của ó hôg trùg hít với tổg thể. Và vì bị tác độg em chứg mih chi tiết ở chươg 8, phầ Maximum lielihood. Lê Hồg Nhật -7
bởi các yếu tố gẫu hiê, ˆ cũg là một biế gẫu hiê. Do đó, độ tốt của ước lượg sẽ N phụ thuộc trực tiếp vào bả chất của các quá trìh gẫu hiê ε }. { Điều ày dẫ đế việc cầ phải hắc họa bả chất thốg ê của mô hìh hồi quy, hư chúg ta đã làm cho trườg hợp đơ biế. Ta sẽ tiếp tục sử dụg các giả thuyết đã đưa ra về ε. Cụ thể là: A Eε 0, với mọi. A Varε σ, với mọi. iid A ε ~ N(0, σ ), với mọi. Và: A E y x ) x, với mọi. ( Đối với trườg hợp đa biế, chúg ta đưa thêm đòi hỏi sau: Gọi [,,..., N,..., ] là ma trậ tạo bởi các vector cột của biế giải thích [xem lại ví dụ mih họa về ma trậ ở bảg. về dữ liệu của mô hìh đầu tư]. hi đó, ta đòi hỏi rằg: A5 Các cột,,...,,..., } là độc lập tuyế tíh. Hay cũg vậy, ra. { Về mặt hìh học, giả thuyết ày có ý ghĩa hư sau. Hãy xét trườg hợp, phươg pháp bìh phươg cực tiểu có thể được biểu diễ bởi lược đồ dưới đây: Lê Hồg Nhật -8
Đồ thị Error! No text of specified style i documet..: Biểu diễ hìh học của hồi quy y Việc ước lượg tham số cũg giốg hư là tìm các hệ số (, ) sao cho y. Để làm được điều đó, điều iệ cầ là các vector, hôg được trùg hít với hau. Hay cũg vậy,, phải độc lập tuyế tíh. Đây được gọi là điều iệ xác địh (idetificatio coditio). Trog trườg hợp tổg quát, hi, điều iệ đó được phát biểu dưới dạg giả thuyết A5. Chúg ta sẽ sử dụg giả thuyết ày hi bà tới vấ đề đa cộg tuyế (multicolliearity) trog chươg 7.. iểm địh các giả thuyết thốg ê Bây giờ hãy chỉ chú ý đế giả thuyết đầu tiê A A, và sử dụg chúg để đáh giá tíh tốt của ước lượg theo các tiêu chuẩ thốg ê. Từ phươg trìh (.9), ta đã có: vào hai vế của (.9). Ta có: ˆ + cε. Bây giờ, hãy áp dụg toá tử ỳ vọg E ˆ E( + cε ) Eε + c (.0) Lê Hồg Nhật -9
[ở đây, ta sử dụg giả thiết A: Eε 0 ]. Do vậy, là ước lượg hôg chệch của ˆ. Tiếp theo, sử dụg lại côg thức: Var( x) Var( x Ex) [xem chươg, phầ ô tập], và lưu ý (.9), (.0), ta có: Var ˆ Var( ) Var ε ) ( c Sử dụg giả thiết A về tíh độc lập của các yếu tố gẫu hiê, cuối cùg ta hậ được: Var ˆ cvarε σ c, hay Var σ,, S,.., (.) (ở đây, mặc dù ta hôg đưa ra được tíh toá trực tiếp; hưg về cơ bả cũg là phươg sai mẫu của biế, tươg tự hư S trog trườg hợp đơ biế). S Địh Lý. [Gauss Marov]: Phươg pháp bìh phươg cực tiểu có sai số ước lượg, đo lườg bởi Var,,,..,, là hỏ hất trog lớp tất cả các ước lượg tuyế tíh và hôg chệch. Ta cũg ê hấ mạh lại rằg, chúg ta có được hữg tíh chất rất tốt: hôg chệch và hiệu quả của ước lượg bìh phươg cực tiểu, mà chỉ đòi hỏi có trug bìh bằg zero, tíh độc lập, và phươg sai giốg hau của các yếu tố gẫu hiê tức là giả thiết A. Sử dụg (.9) (.), chúg ta đi đế ết luậ rằg: ˆ σ ~ N(, ). Điều đó có ghĩa S ˆ là, sau hi chuẩ hóa, Z ~ N(0,). Thay thế σ bởi ước lượg hôg chệch σ S Lê Hồg Nhật -0
của ó là s N e ˆ, ta có thốg ê t ~ t( N ). Chúg ta s S se( ) bây giờ có thể xây dựg hoảg ti cậy cho,,,..,, và tiế hàh iểm địh các giả thuyết thốg ê về tham số của tổg thể. Chẳg hạ hư ếu muố iểm địh tíh có ý ghĩa của biế giải thích,,,..,, chúg ta lập giả thuyết sau: H : 0.vs. H : 0 0 Việc iểm địh bao gồm các bước sau: Bước : ác địh thốg ê t (t-stat): t ( se ) ~ t( N ) Bước : Tra bảg thốg ê t-studet với (N-) bậc tự do t( N ) để tìm giá trị t-tra bảg (t-critical) tλ ( N ), ứg với mỗi mức ý ghĩa (sigificace) λ [Chẳg hạ, 0.05 (5%); hay 0. (0%)] Bước : Bác bỏ giả thuyết H 0 (viết tắt là RH 0 ), ếu t t ( N ) λ, và se( ) hôg bác bỏ giả thuyết đó ( DNRH 0 ), ếu t ( N ) λ. se( ) Cũg hư trog trườg hợp đơ biế, gười ta thườg hay sử dụg p-value, hơ là phải tíh toá và tra bảg qua các bước đế hư trê. Cụ thể, ứg với từg biế giải thích,,,..,, ta cũg đặt: p value Pr ob{ t( N ) t ) Lê Hồg Nhật -
Cũg hệt hư ở đồ thị -9, chúg ta sẽ bác bỏ giả thuyết H : 0, ếu: p value λ, 0 [trog trườg hợp đó, ta ói là có ý ghĩa ở mức λ % ]. Và chúg ta sẽ hôg bác bỏ giả thuyết đó, ếu p value λ. Trog ví dụ. về đầu tư ở Mỹ (968-8), p-value của cả biế giải thích: T, G, INT, đều hỏ hơ 5%. Vì vậy, ta ói rằg tất cả các biế ày là có ý ghĩa ở mức λ 5%. Lê Hồg Nhật -