CHƯƠNG.1 Khái niệm và phân loại BIẾN NGẪU NHIÊN MỘT CHIỀU Khái niệm. Biến số gọi là biến ngẫu nhiên (random variable) nếu trong kết quả của phép thử nó sẽ nhận một và chỉ một giá trị có thể có của nó tùy thuộc vào sự tác động của các nhân tố ngẫu nhiên. Ký hiệu:, Y, Z hay 1,, Giá trị có thể có của bnn: chữ thường, y, z, { } {Y=y} là các biến cố ngẫu nhiên. 1 Ví dụ 1 Phân loại bnn : Lượng khách vào một cửa hàng trong ngày Y: Tuổi thọ của một chiếc điện thoại Trả ngẫu nhiên 3 mũ bảo hiểm cho 3 người. Gọi Z: số mũ bảo hiểm được trả đúng người T: Số sản phẩm hỏng trong 100 sản phẩm mới nhập về U: Chiều cao của một sinh viên gọi ngẫu nhiên trong lớp này 3 4 Rời rạc - Hữu hạn giá trị - Vô hạn đếm được giá trị - ác suất tập trung tại các điểm giá trị Phân loại Biến ngẫu nhiên Liên tục - Giá trị lấp đầy một hay vài khoảng hữu hạn hoặc vô hạn - ác suất tại từng khoảng giá trị - ác suất không tập trung tại các điểm P(=a)=0 với mọi a Ví dụ Hộp có 6 viên bi gồm 4 trắng và vàng. Lấy ngẫu nhiên viên bi từ hộp. Đặt Y là số viên bi vàng có trong viên lấy ra. Khi đó Y cũng là biến ngẫu nhiên. Ta có: Y=0, Y=1, Y< là các biến cố nào??? Y 0;; 1 5 6 1
Hai biến ngẫu nhiên độc lập Hai biến ngẫu nhiên, Y độc lập nếu hai biến cố: Y y Độc lập nhau với mọi giá trị của, y.. Quy luật phân phối ác suất Biểu diễn quan hệ giữa các giá trị của biến ngẫu nhiên và ác suất tương ứng. Nói cách khác mọi biến cố liên quan đến hai biến ngẫu nhiên, Y luôn độc lập nhau. 7 8 Luật phân phối ác suất Biểu diễn quan hệ giữa các giá trị của biến ngẫu nhiên và ác suất tương ứng. Thường gặp 3 dạng: Hàm phân bố ác suất (CDF) Hàm khối ác suất (PMF) Hàm mật độ ác suất (PDF) Rời rạc + Liên tục ác suất bên trái Tỷ lệ bên trái F() Rời rạc ác suất tại điểm p() f() Liên tục Mật độác suất f() Hàm phân phối ác suất Hàm phân phối ác suất (Cumulative Distribution Function), viết tắt CDF của biến ngẫu nhiên là hàm ác định: F ( ) P ; { } : biến cố bnn nhận giá trị nhỏ hơn hay bằng Đôi khi ta còn gọi là hàm phân bố ác suất hay hàm tích lũy ác suất. 9 10 i) ii) Tính chất 0 F 1, R F là hàm không giảm, liên tục bên phải. Nếu là biến ngẫu nhiên liên tục thì trên R. iii) F F lim 0 F lim F 1 iv) Pa b F b F a. Flà hàm liên tục Hàm phân phối ác suất 11 1
Hàm khối ác suất Probability Mass Function (PMF) Tính chất: i) p 0 p P ii) p 1 iii) P A p A Dạng bảng Dạng đồ thị Bnn Rời rạc - Bảng pps Bảng phân phối ác suất của. 1.. n P p 1. p. p n i : giá trị có thể có của bnn p i : ác suất tương ứng; i) pi p( i ) P ( i ) n ii) p 1 i1 i 13 14 PMF và CDF PMF và CDF Hàm phân phối ác suất được ác định như sau: F P p k k 0, 1 p1, 1 F p1 p, 3... p... p, 1 k 1 k 1 k 15 16 Ví dụ 3 ét phép thử tung hai đồng u phân biệt. Không gian mẫu là: Ω = {SS; SN; NS; NN} Gọi là số lần mặt sấp uất hiện, là bnn rời rạc. Hàm khối ác suất: 1/ 4 ; 0 hay p 1/ ; 1 0 ; 0; 1; Ví dụ 3 0 1 P 1/4 1/ 1/4 Hàm phân phối ác suất: F 0, 0 1/ 4,0 1 3 / 4,1 1, 17 18 3
Ví dụ 4 Ví dụ 5 Một hộp có 10 sản phẩm trong đó có 6 sản phẩm đạt loại A. Lấy ngẫu nhiên sản phẩm. Lập bảng phân phối ác suất của số sản phẩm loại A lấy ra? ác định PMF, CDF? Có kiện hàng. Kiện 1 có 4 sản phẩm tốt, 3 sản phẩm ấu. Kiện có 6 sản phẩm tốt, 4 sản phẩm ấu. Lấy ngẫu nhiên từ kiện 1 ra sản phẩm và từ kiện ra 1 sản phẩm. a) Lập bảng phân phối ác suất của số sản phẩm tốt trong 3 sản phẩm lấy ra? b) ác định PMF, CDF 19 0 Ví dụ 6 Luật Benford phát biểu rằng trong một lượng rất lớn các số thực ngoài đời, chữ số đầu tiên tuân theo luật phân phối với 30% là số 1, 18% là số và nói chung: j 1 PD j log 10, j {1,,3...,9} j Với D là chữ số đầu tiên của một phần tử chọn ngẫu nhiên. Luật phân phối trên có hợp lý không? Chú ý về BNN liên tục Nếu là bnn liên tục thì: i) P( a) 0, a b ii) P a b P a 1 Hàm mật độ ác suất Probability Density Function Viết tắt: PDF i) f 0 R ii) f d 1 Hàm mật độ ác suất 3 4 4
PDF và CDF f tdt f F F f Ví dụ 7 Cho biến ngẫu nhiên có CDF dạng: A) ác định hệ số k B) Tìm PDF 0, 0 F k,0 1 1,1 F 5 6 Ví dụ 8 Cho biến ngẫu nhiên có PDF dạng: k f 1 A) ác định hệ số k B) Tìm hàm CDF C) Tính P(<<3) D) Thực hiện 4 lần phép thử độc lập với bnn. Tính ác suất bnn không nhận giá trị trong khoảng (;3).3 Các tham số của biến ngẫu nhiên Kỳ vọng (Epected Value) E() Phương sai (Variance) V(), Var() Độ lệch chuẩn (Standard Deviation) Mốt (Mode) m 0 Trung vị (Median) m e Hệ số biến thiên (Coefficient of Variation) CV Hệ số bất đối ứng (Skewness) Hệ số nhọn (Kurtosis) Giá trị tới hạn 7 8 Kỳ vọng (Epected Value) Tính chất Kỳ vọng toán học của bnn được ký hiệu là E() hay và tính theo công thức sau: E() là trung bình theo ác suất của E() là số ác định và có cùng đơn vị với 9 30 5
Ví dụ 9 Tung một cục úc sắc nhiều lần. Gọi là số chấm mặt ngửa của cục úc sắc. Tính kỳ vọng của Về lâu dài (in a long run) giá trị trung bình của những lần tung là bao nhiêu? Ý nghĩa kỳ vọng Là giá trị trung bình của bnn (trong một quá trình lâu dài); phản ánh giá trị trung tâm của pps của bnn Trong thực tế sản uất hay kinh doanh, nếu cần chọn phương án cho năng suất cao ta chọn phương án cho năng suất kì vọng cao 3 Ví dụ 10 Một nhân viên bán hàng có cuộc hẹn trong 1 ngày. Với cuộc hẹn thứ nhất, khả năng thành công (ký được hợp đồng) là 0,7 và lợi nhuận dự kiến là 1000$. Với cuộc hẹn thứ, khả năng thành công là 0,4 và lợi nhuận là 1500$. Giả sử kết quả các cuộc hẹn độc lập nhau. Lợi nhuận kỳ vọng của nhân viên bán hàng là bao nhiêu? Ví dụ 11 là tuổi thọ của một loại thiết bị điện tử 0.000 f 3 100 Tìm tuổi thọ trung bình của loại thiết bị này. 33 34 Ví dụ 1 Nhu cầu hàng ngày của một loại thực phẩm tươi sống ở 1 khu vực là bnn rời rạc có pps: 80 100 10 150 P 0, 0,4 0,3 0,1 Giả sử khu vực này chỉ có 1 cửa hàng và cửa hàng này nhập mỗi ngày 100kg thực phẩm. Giá nhập là 40 ngàn/kg; bán ra là 60 ngàn/kg. Nếu thực phẩm không bán được trong ngày thì phải bán với giá 0/kg ngàn mới hết hàng. Muốn có lãi trung bình cao hơn thì cửa hàng có nên nhập thêm 0kg mỗi ngày hay không Ví dụ 13 Cho bnn có hàm mật độ: 0 f e A) Kiểm tra lại tính hợp lý của PDF trên B) Tính E() Biến ngẫu nhiên như trên gọi là có phân phối mũ với tham số λ. Ký hiệu: ~E(λ) 35 36 6
Ví dụ 14 Tính kỳ vọng của bnn rời rạc có hàm mật độ: C P k p k, k 1,, 3,... k Kỳ vọng của hàm của bnn Cho bnn và hàm (). Đặt Y=() là bnn Kỳ vọng toán học của Y: E φ = i + φ i p i, nếu rời rạc φ f d, nếu liên tục 37 38 ét hai bnn sau: Ví dụ 15 3 4 5 P 0,3 0,4 0,3 Y 1 6 8 P 0,4 0,1 0,3 0, So sánh E() và E(Y) Vẽ đồ thị và nhận ét về mức độ biến thiên của, Y Phương sai Định nghĩa. Phương sai (variance) của bnn, ký hiệu là V() được tính theo công thức: Rút gọn: V E E V E E 39 40 Ý nghĩa của phương sai Tính chất của phương sai Phương sai đo độ dao động của các giá trị của ung quanh kỳ vọng toán E() Phương sai có đơn vị là bình phương đơn vịcủa Nếu, Y cùng đơn vị, cùng ý nghĩa, V()>V(Y) thì: biến động, dao động, phân tán hơn Y Y ổn định, đồng đều hơn Trong kỹ thuật phương sai đặc trưng cho sai số của thiết bị. Trong kinh tế, phương sai đo độ rủi ro của các quyết định. 41 4 7
Ví dụ 16 Tiền lãi khi đầu tư 1 tỷ đồng vào các ngành A, B là các bnn độc lập, Y: 0 15 30 P 0,3 0,5 0, Y - 15 35 P 0, 0,45 0,35 Muốn lãi trung bình cao hơn thì đầu tư vào ngành nào? Muốn rủi ro thấp hơn thì đầu tư vào ngành nào? Muốn rủi ro thấp nhất thì chia vốn đầu tư theo tỷ lệ nào? 0 15 30 P 0,3 0,5 0, Ví dụ 17 Y - 15 35 P 0, 0,45 0,35 Đầu tư a tỷ vào ngành A và b tỷ vào ngành B trong 1 tháng. Tìm trung bình và phương sai của tổng tiền lãi trong 1 tháng? Đầu tư tỷ vào ngành A trong một tháng. Tìm trung bình và phương sai của tiền lãi thu được. Mỗi tháng đầu tư vào ngành A 1 tỷ, độc lập nhau. Tìm trung bình và phương sai của tổng tiền lãi trong tháng. Tính ác suất tổng tiền lãi không dưới 50 triệu. Tìm ác suất đầu tư vào A được lãi cao hơn B? 43 44 Độ lệch chuẩn Ví dụ 18 Định nghĩa. Độ lệch chuẩn (standard deviation) của bnn, ký hiệu () hay, là căn bậc hai của phương sai. V Độ lệch chuẩn cũng đo mức độ phân tán, dao động của bnn và có ý nghĩa tương tự phương sai. Độ lệch chuẩn có cùng đơn vị với bnn. 45 46 Ví dụ 19 Chuẩn hóa biến ngẫu nhiên Cho là bnn có kỳ vọng và độ lệch chuẩn >0. Đặt: Z Ta có: V Z E Z 0 1 Biến Z gọi là bnn chuẩn hóa của bnn. 47 48 8
Ví dụ 0 Tuổi thọ của một loại côn trùng M là biến ngẫu nhiên (đơn vị: tháng) với PDF như sau: 4, 0 4 f k Tìm hằng số k? ác định CDF? Tính tuổi thọ trung bình của loại côn trùng trên. Hệ số biến thiên Định nghĩa. Hệ số biến thiên (coefficient of variation) của ký hiệu là CV() được tính theo công thức: Kí hiệu: CV(). CV E.100% E 0 Hệ số biến thiên có đơn vị là %. Hệ số biến thiên đo độ phân tán tương đối. Có thể so sánh hệ số biến thiên của nhiều bnn khác nhau, không cần cùng đơn vị, ý nghĩa, không có cùng kỳ vọng. 49 50 Median (Trung vị) Định nghĩa. Trung vị của bnn, ký hiệu Med, m e là giá trị nằm ở chính giữa phân phối ác suất Nếu rời rạc: P me 0,5 P me 0,5 Nếu liên tục: m e f d 0,5 Mode Định nghĩa. Mốt (mode) của bnn, ký hiệu m o là giá trị ứng với ác suất lớn nhất ( rời rạc) hoặc hàm mật độ f() lớn nhất ( liên tục). BNN có thể có 1 mod, nhiều mod hoặc không có mod Nếu rời rạc: P m ma P Nếu liên tục: f m ma f 0 0 i i R 51 5 Ví dụ 1 Ví dụ Cho bnn Ta có: 1 3 4 5 P 0,1 0, 0,15 0,3 0,5 1 3 4 5 F() 0,1 0,3 0,45 0,75 1 Cho bnn có hàm mật độ ác suất f Tìm Med và Mod? 3,0 4 0, 0, Vậy Med 4 Mod 53 54 9
Phân vị mức (1-α) Giá trị tới hạn Định nghĩa. Với bnn liên tục, phân vị (percentile) mức 1 α ký hiệu là 1 α là số thực thỏa mãn: P 1 1 Định nghĩa. Với bnn liên tục, giá trị tới hạn (critical value) mức α (0 α 1) ký hiệu là α là số thực thỏa mãn: P α 55 56 Ví dụ 3 Tuổi thọ một loại côn trùng là (tháng) có hàm mật độ k 4, 0;4 f 0, 0;4 a) Tìm hằng số k b) Tìm Mod() c) Tìm ác suất côn trùng chết trước khi nó được 1 tháng tuổi Ví dụ 4 Cho bnn có hàm mật độ f và E()=0,6; V()=0,06 a) Tìm a,b,c? b) Đặt Y= 3. Tính E(Y) a b c, 0;1 0, 0;1 57 58 Ví dụ 5 Giả sử một cửa hàng sách định nhập về một số cuốn truyện trinh thám. Nhu cầu hàng năm về loại sách này như sau: Nhu cầu (cuốn) 30 31 3 33 P 0,3 0,15 0,3 0,5 Cửa hàng mua sách với giá 7USD một cuốn, bán ra với giá 10USD một cuốn nhưng đến cuối năm phải hạ giá với giá 5USD một cuốn. Ví dụ 5 Nhu cầu (cuốn) 30 31 3 33 P 0,3 0,15 0,3 0,5 Nếu nhập về 3 cuốn thì lợi nhuận bán được trung bình là bao nhiêu? ác định số lượng nhập sao cho lợi nhuận kì vọng là lớn nhất. 59 60 10
Bài tập chương Anscombe's quartet.1;.;.6;.7;.9;.10;.11;.14;.15;.17;.18;.10;.3;.4;.5.6;.7;.30;.31;.3.33;.34;.37 Tất cả 3 bài. Anscombe's quartet I II III IV y y y y 10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58 8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76 13.0 7.58 13.0 8.74 13.0 1.74 8.0 7.71 9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84 11.0 8.33 11.0 9.6 11.0 7.81 8.0 8.47 14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04 6.0 7.4 6.0 6.13 6.0 6.08 8.0 5.5 4.0 4.6 4.0 3.10 4.0 5.39 19.0 1.50 1.0 10.84 1.0 9.13 1.0 8.15 8.0 5.56 7.0 4.8 7.0 7.6 7.0 6.4 8.0 7.91 5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89 61 6 Anscombe's quartet Anscombe's quartet Property Value Accuracy Mean of 9 eact Sample variance of 11 eact Mean of y 7.50 to decimal places Sample variance of y 4.15 ±0.003 Correlation between and y 0.816 to 3 decimal places Linear regression line y = 3.00 + 0.500 to and 3 decimal places, respectively Coefficient of determination of the linear regression 0.67 to decimal places 63 64 11