Chương 4 Ước lượng tham số Bài giảng Lý thuyết xác suất và thống kê toán Lê Phương Bộ môn Toán kinh tế Đại học Ngân hàng Tp Hồ Chí Minh Homepage: http://docgate.com/phuongle 4.1
Nội dung 1 Cách trình bày một mẫu cụ thể cụ thể 2 ước lượng điểm ước lượng ước lượng điểm 3 ước lượng khoảng Khoảng tin cậy cho trung bình Khoảng tin cậy cho tỉ lệ Khoảng tin cậy cho phương sai 4.2
Tổng thể Tổng thể hay đám đông (kí hiệu C) là một tập hợp các phần tử có một hoặc một vài dấu hiệu chung về lượng hay về chất cần nghiên cứu. Ví dụ. 1 Nếu muốn nghiên cứu chất lượng sản phẩm của một lô hàng thì tổng thể là các sản phẩm được lấy ra từ lô hàng sản xuất, dấu hiệu nghiên cứu là sản phẩm có đạt tiêu chuẩn hay không. 2 Nếu muốn nghiên cứu thu nhập của người Việt Nam thì tổng thể là toàn bộ người dân Việt nam, dấu hiệu nghiên cứu là thu nhập của từng người dân. Dấu hiệu chung thay đổi qua các phần tử của tổng thể được biểu diễn bằng một biến ngẫu nhiên X nào đó. Nghiên cứu một tổng thể là nghiên cứu về phân phối xác suất và các số đặc trưng của biến ngẫu nhiên X của tổng thể đó. 4.4
Trong thực tế, việc điều tra nghiên cứu các phần tử của tổng thể gặp những khó khăn: Số phần tử của tổng thể lớn đòi hỏi nhiều chi phí và thời gian điều tra. Trong nhiều trường hợp không thể biết hết các phần tử của tổng thể nên không thể điều tra toàn bộ được. Là phương pháp chọn ra n phần tử đại diện cho tổng thể (còn gọi là chọn ra một mẫu kích thước n). Sử dụng các công cụ thống kê nghiên cứu mẫu này và dựa vào đó cho kết luận về tổng thể. 4.5
Chọn mẫu ngẫu nhiên Nguyên tắc chọn mẫu Mỗi phần tử của tổng thể có một xác suất được chọn vào mẫu được biết và khác 0. Chọn mẫu ngẫu nhiên đơn giản mỗi lần chỉ được chọn một phần tử mỗi phần tử đều có thể được chọn với cùng khả năng Có hai phương thức chọn: chọn hoàn lại, chọn không hoàn lại. Ưu điểm: có tính đại diện cao. Nhược điểm: phải biết toàn bộ tổng thể, chi phí chọn mẫu lớn. 4.6
Chọn mẫu ngẫu nhiên Chọn mẫu phân nhóm chia tổng thể thành các nhóm tương đối thuần nhất từ mỗi nhóm lấy ra một mẫu ngẫu nhiên Được dùng khi tổng thể có những sai khác lớn. Chọn mẫu chùm chọn mẫu ngẫu nhiên từ các tập con của tổng thể (các chùm) từ mỗi nhóm lấy ra một mẫu ngẫu nhiên Ưu điểm: tiết kiệm chi phí và thời gian. Nhược điểm: sai số chọn mẫu cao. 4.7
Chọn mẫu có suy luận Nguyên tắc chọn mẫu Dựa trên ý kiến chuyên gia về đối tượng nghiên cứu. Nhược điểm: khó đảm bảo tính khách quan. Các thang đo Mỗi loại đặc trưng thuộc 1 trong 3 loại thang đo. 1 Thang đo định danh: dùng để phân loại các biểu hiện của đặc trưng, không so sánh và tính toán được. Ví dụ: giới tính (nam, nữ). 2 Thang đo thứ bậc: giữa các biểu hiện của đặc trưng đã có quan hệ hơn kém, có thể so sánh nhưng không tính toán được. Ví dụ: trình độ học vấn (tiểu học, trung học cơ sở, trung học phổ thông, đại học, trên đại học). 3 Thang đo khoảng: có thể so sánh và tính toán trên các biểu hiện của đặc trưng. Ví dụ: chiều cao người trưởng thành (150cm, 155cm, 160cm, 170cm, 180cm,... ) 4.8
Giả sử cần nghiên cứu đặc trưng X của tổng thể. Với mẫu kích thước n, gọi X i là giá trị của đặc trưng X của phần tử thứ i của mẫu (1,..., n). Mẫu ngẫu nhiên kích thước n là một bộ gồm n biến ngẫu nhiên độc lập X 1, X 2,..., X n được lập từ biến ngẫu nhiên X và có cùng phân phối với X. Kí hiệu W = (X 1, X 2,..., X n ). Khi thực hiện lấy mẫu thực tế, ta được X 1 = x 1, X 2 = x 2,..., X n = x n. Khi đó, (x 1, x 2,..., x n ) được gọi là mẫu cụ thể kích thước n. Một hàm của mẫu ngẫu nhiên T = T (X 1, X 2,..., X n ) được gọi là một thống kê. 4.9
Ví dụ. Gọi X là chiều cao của một cư dân bất kì trong thành phố. Chọn ngẫu nhiên 4 người trong thành phố và gọi X i là chiều cao của người được chọn thứ i, (i = 1, 4) thì ta có 4 biến ngẫu nhiên độc lập có cùng phân phối với X, khi đó ta có mẫu ngẫu nhiên (X 1, X 2, X 3, X 4 ). Khi tiến hành lấy mẫu thực tế được chiều cao của 4 người lần lượt là 1,6m, 1,7m, 1,57m, 1,64m thì (1, 6; 1, 7; 1, 57; 1, 64) là một mẫu cụ thể. 4.10
Cách trình bày một mẫu cụ thể Một mẫu cụ thể kích thước n, trong đó giá trị x i xuất hiện n i lần với x 1 < x 2 <... < x k và n 1 + n 2 + + n k = n. Khi đó n i : tần số của x i, f i = n i n : tần suất của x i. Bảng phân phối tần số thực nghiệm: x i x 1 x 2... x k n i n 1 n 2... n k Bảng phân phối tần suất thực nghiệm: x i x 1 x 2... x k f i f 1 f 2... f k Ví dụ Khảo sát số nhân khẩu trong 10 hộ gia đình được kết quà: 2, 4, 6, 1, 6, 4, 5, 2, 6, 5 (nhân khẩu). Lập bảng phân phối thực nghiệm của mẫu 10 hộ gia đình trên. 4.12
tổng quát chưa hiệu chỉnh X n = X 1+X 2 + +X n n F n = X A n n ( ) Ŝn 2 = 1 2 n Xi X n i=1 (hiệu chỉnh) S 2 n = 1 n 1 Độ lệch chuẩn (hiệu chỉnh) S n = S 2 n n ( ) 2 Xi X n i=1 cụ thể chưa hiệu chỉnh (hiệu chỉnh) s 2 n = 1 n 1 Độ lệch chuẩn (hiệu chỉnh) x n = x 1+x 2 + +x n n f n = x A n n ŝn 2 = 1 n (x i x n ) 2 i=1 n (x i x n ) 2 s n = s 2 n i=1 Để ngắn gọn, có thể bỏ chỉ số dưới n. Ví dụ: X, x, F, f, S 2, s 2. 4.14
Kì vọng và phương sai của các đặc trưng mẫu Cho tổng thể X có E(X ) = µ, V (X ) = σ 2 và tỉ lệ p. Kì vọng và phương sai của các đặc trưng mẫu mẫu: E(X ) = µ, V (X ) = σ2 n. mẫu: E(F) = p, V (F) = p(1 p) n. mẫu chưa hiệu chỉnh: E(Ŝ2 ) = n 1 n σ2. mẫu (hiệu chỉnh): E(S 2 ) = σ 2. 4.15
Một số phân phối xác suất của các đặc trưng mẫu Trường hợp tổng thể X có phân phối chuẩn: X N(µ, σ 2 ) X µ σ n N(0, 1). n t(n 1). X µ S (n 1)S2 σ 2 χ 2 (n 1). Trường hợp kích thước mẫu đủ lớn: n 30 X µ σ n N(0, 1). n N(0, 1). X µ S 4.16
cụ thể Từ một mẫu cụ thể có bảng phân phối thực nghiệm hay phân phối ghép lớp, tính trung bình mẫu x và độ lệch chuẩn s. x = ni x i n, x 2 = s 2 = s = s 2. ni x 2 i n, n n 1 (x2 (x) 2 ), Ví dụ. Cho bảng phân phối thực nghiệm: x i -2 1 2 3 4 5 n i 2 1 2 2 2 1 Tính trung bình và độ lệch chuẩn của mẫu. 4.18
cụ thể Lưu ý Với bảng phân phối ghép lớp ta thay lớp x i 1 x i bằng một đại diện x i = x i 1+x i 2. Khi số liệu lớn, phức tạp, ta có thể đổi biến để giảm độ phức tạp tính toán: x i = x i a. h Ví dụ. Lượng xăng hao phí của một ôtô đi từ A đến B sau 30 lần chạy được kết quả cho trong bảng: Lít 9,6 9,8 9,8 10 10 10,2 10,2 10,4 10,4 10,8 Số lần 3 5 10 8 4 Tính trung bình và độ lệch chuẩn của mẫu. 4.19
ước lượng tham số : Tìm ước lượng cho tham số θ của một tổng thể. Trong đó θ là 1 µ (trung bình tổng thể), 2 p (tỉ lệ tổng thế), 3 σ 2 (phương sai tổng thế). Ta có thể dùng một con số nào đó để ước lượng θ. Ước lượng như vậy được gọi là ước lượng điểm. Ngoài ra ta có thể chỉ ra một khoảng (θ 1, θ 2 ) có thể chứa θ. Ước lượng như vậy được gọi là ước lượng khoảng. Ví dụ. Cho một mẫu khảo sát gồm 10000 người của một quốc gia được chọn ngẫu nhiên có độ tuổi trung bình là 27 và độ lệch chuẩn là 3 tuổi. Ước lượng tuổi trung bình của toàn bộ dân số thuộc quốc gia đó. 4.21
ước lượng điểm ước lượng điểm Tìm một thống kê ˆθ(X 1, X 2,..., X n ) để ước lượng (thay thế) tham số θ chưa biết. Khi đó ˆθ được gọi là hàm ước lượng cho θ. Từ mẫu cụ thể (x 1,..., x n ), ta tính được giá trị ˆθ = ˆθ(x 1,..., x n ). Khi đó ˆθ được gọi là ước lượng điểm của θ. Có vô số cách chọn thống kê ˆθ để ước lượng cho tham số θ cho trước. Vì vậy người ta đưa ra các tiêu chuẩn để đánh giá chất lượng của ước lượng. Từ đó tìm được hàm ước lượng tốt. 4.23
ước lượng Ước lượng không chệch Thống kê ˆθ được gọi là ước lượng không chệch của θ nếu E ˆθ = θ. Ý nghĩa Ước lượng không chệch là ước lượng có sai số trung bình bằng 0 (vì E ˆθ θ = 0). (Sai số trung bình bằng 0 được gọi là sai số ngẫu nhiên, ngược lại là sai số hệ thống). Ví dụ. mẫu F, trung bình mẫu X, phương sai mẫu (hiệu chỉnh) S 2 tương ứng là ước lượng không chệch của p, µ, σ 2. Còn Ŝ2 là ước lượng chệch của σ 2. 4.25
ước lượng Ước lượng vững Thống kê ˆθ được gọi là ước lượng vững của θ nếu ˆθ(X 1,..., X n ) P θ. Do đó với n đủ lớn thì với xác suất gần 1 ta có: ˆθ θ. Ví dụ. F, X, S 2, Ŝ2 tương ứng là các ước lượng vững cho p, µ, σ 2, σ 2. Ước lượng hiệu quả Thống kê ˆθ được gọi là ước lượng hiệu quả của θ nếu nó là ước lượng không chệch và có phương sai bé nhất trong các ước lượng không chệch của θ. Ví dụ. Nếu X N(µ, σ 2 ) thì X là ước lượng hiệu quả của µ. Nếu X B(1, p) thì F là ước lượng hiệu quả của p. 4.26
ước lượng điểm Sử dụng các đặc trưng mẫu F, X, S 2 tương ứng là ước lượng không chệch, vững cho p, µ, σ 2. Ŝ 2 là ước lượng chệch, vững cho σ 2. Nếu X N(µ, σ 2 ) thì X là ước lượng hiệu quả cho µ. Nếu X B(1, p) thì F là ước lượng hiệu quả cho p. Hạn chế của phương pháp ước lượng điểm Khi kích thước mẫu nhỏ thì phương pháp ước lượng điểm có thể cho sai số lớn. Không đánh giá được độ chính xác của ước lượng. 4.28
Cho xác suất 1 α, từ mẫu ngẫu nhiên (X 1,..., X n ) tìm các thống kê ˆθ 1, ˆθ 2 sao cho P(ˆθ 1 < θ < ˆθ 2 ) = 1 α. Với mẫu cụ thể (x 1, x 2,..., x n ), ta có ˆθ 1 nhận giá trị θ 1 và ˆθ 2 nhận giá trị θ 2. Khi đó (θ 1, θ 2 ) được gọi là ước lượng khoảng của θ trong đó 1 α: độ tin cậy của ước lượng, (θ 1, θ 2 ): khoảng tin cậy của ước lượng, θ 2 θ 1 = 2ε: độ dài khoảng tin cậy, ε: độ chính xác (sai số) của ước lượng. ước lượng khoảng với độ tin cậy 1 α còn được gọi là bài toán tìm khoảng tin cậy 1 α. 4.30
Khoảng tin cậy cho trung bình Giả sử tổng thể X có EX = µ chưa biết. Với độ tin cậy 1 α, tìm khoảng tin cậy cho µ. Chỉ xét trường hợp n 30 và σ 2 chưa biết. Khoảng tin cậy 2 phía (đối xứng) (x ε, x + ε), với s ε = z α. 2 n Trong đó z α là giá trị tới hạn mức α của phân phối chuẩn tắc: ϕ(z α ) = 0, 5 α. 4.32
Khoảng tin cậy cho trung bình Ví dụ. Chủ một kho sơn muốn đánh giá lượng sơn chứa trong các thùng 1 lít được sản xuất từ một dây chuyền công nghệ quốc gia. Khảo sát một mẫu 50 thùng được lượng sơn trung bình là 0,97 lít và độ lệch chuẩn của lượng sơn là 0,08 lít. 1 Với độ tin cậy 95% hãy ước lượng lượng sơn trung bình chứa trong một thùng. 2 Với độ tin cậy 95% hãy ước lượng tổng lượng sơn của kho, biết kho có 50000 thùng sơn. Ví dụ. Một lô hàng gồm các linh kiện điện tử cùng loại có tổng khối lượng 1 tấn. Kiểm tra ngẫu nhiên 100 linh kiện từ lô hàng thì thấy khối lượng trung bình của các linh kiện là 10,1 gam và độ lệch chuẩn là 1 gam. Với độ tin cậy 95% hãy ước lượng số lượng linh kiện có trong lô hàng. 4.33
Các bài toán chỉ tiêu của ước lượng Trong bài toán tìm khoảng tin cậy đối xứng khi mẫu đủ lớn (n 30) và σ 2 chưa biết, ta có các bài toán sau: 1 Cho 1 α và n, tìm độ chính xác ε. s ε = z α. 2 n 2 Cho ε và n, tìm độ tin cậy 1 α. Ta có z α = ε n 2 s. Do đó ( ) ε n 1 α = 2ϕ(z α ) = 2ϕ. 2 s 4.34
Các bài toán chỉ tiêu của ước lượng 3 Cho 1 α và ε ε 0, tìm kích thước mẫu n. Ta có s = ε ε 0 n z α 2 n z α 2 s ε 0 ( z α 2 n s ) 2. ε 0 4.35
Các bài toán chỉ tiêu của ước lượng Ví dụ. Chủ một kho sơn muốn đánh giá lượng sơn chứa trong các thùng 1 lít được sản xuất từ một dây chuyền công nghệ quốc gia. Khảo sát một mẫu 50 thùng được lượng sơn trung bình là 0,97 lít và độ lệch chuẩn của lượng sơn là 0,08 lít. 1 Nếu sử dụng mẫu này và muốn ước lượng lượng sơn trung bình trong thùng với độ chính xác 0,02 lít thì đảm bảo độ tin cậy là bao nhiêu? 2 Nếu chủ kho muốn ước lượng lượng sơn trung bình trong thùng đảm bảo độ tin cậy 95% và độ chính xác (sai số không quá) 0,02 lít thì cần khảo sát thêm bao nhiêu thùng nữa? 4.36
Khoảng tin cậy cho tỉ lệ Giả sử tỉ lệ p của tổng thể chưa biết. Với độ tin cậy 1 α, tìm khoảng tin cậy cho p. Khoảng tin cậy 2 phía (đối xứng) (f ε, f + ε), với ε = z α 2 f (1 f ). n Ví dụ. Để đánh giá tỉ lệ phế phẩm của một dây chuyền sản xuất, người ta khảo sát ngẫu nhiên 500 sản phẩm thì thấy có 30 phế phẩm. Với độ tin cậy 95%, hãy ước lượng tỉ lệ phế phẩm của dây chuyền sản xuất. 4.38
Các bài toán chỉ tiêu của ước lượng Trong bài toán tìm khoảng tin cậy đối xứng, ta có các bài toán sau: 1 Cho 1 α và n, tìm độ chính xác ε. f (1 f ) ε = z α. 2 n 2 Cho ε và n, tìm độ tin cậy 1 α. Ta có n z α = ε 2 f (1 f ). Do đó 1 α = 2ϕ(z α (ε ) = 2ϕ 2 n f (1 f ) ). 4.39
Các bài toán chỉ tiêu của ước lượng 3 Cho 1 α và ε ε 0, tìm kích thước mẫu n. f (1 f ) z α = ε ε 2 0 n n z α 2 f (1 f ) ε 0 n z2 α 2 f (1 f ). ε 2 0 4.40
Các bài toán chỉ tiêu của ước lượng Ví dụ. Giám đốc một ngân hàng muốn ước lượng tỉ lệ khách hàng gửi tiền tại ngân hàng được chi trả theo tháng. Một mẫu ngẫu nhiên 100 khách hàng có 30 người được chi trả theo tháng. 1 Sử dụng mẫu trên, nếu muốn ước lượng tỉ lệ khách hàng được chi trả theo tháng với độ chính xác 0,08 thì độ tin cậy đạt được là bao nhiêu? 2 Nếu muốn ước lượng tỉ lệ khách hàng được chi trả theo tháng với độ tin cậy 95% và độ chính xác (sai số) 5% thì cần kích thước mẫu khảo sát là bao nhiêu? 4.41
Khoảng tin cậy cho phương sai Cho biến ngẫu nhiên X N(µ, σ 2 ) với σ 2 chưa biết. Tìm khoảng tin cậy 1 α cho σ 2. Chỉ xét trường hợp chưa biết trung bình tổng thể µ. Khoảng tin cậy 2 phía ( (n 1)s 2 (n 1)s 2 ) χ 2 (n 1, α 2 ), χ 2 (n 1, 1 α 2 ) Trong đó χ 2 (n, α) là giá trị tới hạn mức α của phân phối χ 2 (n): với X χ 2 (n) (tra bảng 4). P(X > χ 2 (n, α)) = α 4.43
Khoảng tin cậy cho phương sai Ví dụ. Cho biết mức hao phí nguyên liệu của một loại sản phẩm cho một đơn vị sản phẩm có phân phối chuẩn. Người ta cân thử một mẫu 25 sản phẩm loại này và nhận được kết quả cho trong bảng Mức hao phí (gam) 18 20 20-22 22-24 Số sản phẩm 5 18 2 Với độ tin cậy 95% hãy tìm khoảng tin cậy cho độ lệch chuẩn của mức hao phí nguyên liệu trên. 4.44