Chương 5 Kiểm định giả thuyết thống kê Bài giảng Lý thuyết xác suất và thống kê toán Lê Phương Bộ môn Toán kinh tế Đại học Ngân hàng Tp Hồ Chí Minh Homepage: http://docgate.com/phuongle 5.1
Nội dung 1 2 của tổng thể của tổng thể của tổng thể 3 So sánh hai trung bình So sánh hai tỉ lệ 5.2
là các giả thuyết nói về: Các tham số đặc trưng của biến ngẫu nhiên của tổng thể như trung bình µ, tỉ lệ p, phương sai σ 2 ; Dạng quy luật phân phối xác suất của biến ngẫu nhiên của tổng thể; Tính độc lập của các biến ngẫu nhiên của các tổng thể. ta mong muốn bác bỏ được kí hiệu là H 0. Mệnh đề đối lập của H 0 được gọi là đối thuyết, kí hiệu là H 1. H 0 và H 1 tạo thành một cặp giả thuyết thống kê, được nghiên cứu đồng thời để cho kết luận: hoặc bác bỏ H 0, chấp nhận H 1 ; hoặc chấp nhận H 0, bác bỏ H 1. 5.4
Qui tắc xác định cặp giả thuyết thống kê Với các giả thuyết thống kê về tham số, H 0 luôn là mệnh đề chứa trường hợp dấu bằng (=,, ). Ví dụ. Viết cặp giả thuyết thống kê tương ứng với các mệnh đề: 1 Khối lượng trung bình của sản phẩm là 400 gram. 2 Khối lượng trung bình của sản phẩm lớn hơn 450 gram. 3 Khối lượng trung bình của sản phẩm lớn hơn hoặc bằng 500 gram. 4 phế phẩm lớn hơn 10%. 5 phế phẩm không lớn hơn 10%. 6 Độ lệch chuẩn khác 10 m. 5.5
giả thuyết thống kê Phương pháp dùng công cụ của thống kê, từ các thông tin trên mẫu điều tra cho kết luận về việc chấp nhận hay bác bỏ giả thuyết thống kê H 0 được gọi là kiểm định giả thuyết thống kê. Tiêu chuẩn kiểm định giả thuyết là một thống kê G(X 1, X 2,..., X n, θ 0 ) lập từ mẫu ngẫu nhiên kích thước n thỏa điều kiện: khi H 0 đúng thì phân phối xác suất của G hoàn toàn được xác định. Ở đây θ 0 là một hằng số đã biết trong H 0. 5.7
Ý tưởng: Giả sử H 0 đúng Phân phối xác suất của G được xác định. Với xác suất α cho trước (α rất nhỏ), ta tìm được miền W α R sao cho P(G W α ) = α. Khi có mẫu thực nghiệm, ta tính được giá trị tiêu chuẩn kiểm định g = G(x 1, x 2,..., x n, θ 0 ). Vì xác suất G W α là α rất nhỏ nên nếu vẫn xảy ra g W α thì giả sử ban đầu (H 0 đúng) là không hợp lí, nghĩa là: Nếu g W α thì bác bỏ H 0, chấp nhận H 1. Ngược lại, nếu g / W α thì chấp nhận H 0. W α được gọi là miền bác bỏ giả thuyết H 0, α được gọi là mức ý nghĩa của kiểm định. 5.8
kiểm định giả thuyết thống kê 1 Phát biểu giả thuyết H 0 và đối thuyết H 1 ; 2 Định mức ý nghĩa α; 3 Chọn tiêu chuẩn kiểm định G; 4 Thiết lập miền bác bỏ H 0 : W α ; 5 Từ mẫu cụ thể (x 1, x 2,..., x n ), tính g = G(x 1, x 2,..., x n ) g W α: bác bỏ H 0, chấp nhận H 1, g / W α: chấp nhận H 0, bác bỏ H 1. 5.10
Kiểm định giả thuyết về trung bình của tổng thể Bài toán Giả sử tổng thể X có E(X ) = µ chưa biết. Với mức ý nghĩa α, hãy kiểm định giả thuyết H 0 : µ = µ 0 (với µ 0 đã biết). Chỉ xét trường hợp mẫu đủ lớn (n 30) và σ 2 chưa biết. Giá trị tiêu chuẩn kiểm định: z = (x µ 0) n s Kiểm định Cặp giả thuyết Bác bỏ H 0 nếu Hai phía H 0 : µ = µ 0, H 1 : µ µ 0 z > z α 2 Bên trái H 0 : µ µ 0, H 1 : µ < µ 0 z < z α Bên phải H 0 : µ µ 0, H 1 : µ > µ 0 z > z α trong đó z α là giá trị tới hạn mức α của phân phối chuẩn tắc ϕ(z α ) = 0, 5 α. 5.12
Ví dụ. Bột ngọt được đóng gói 453 gam một gói trên máy tự động. Kiểm tra ngẫu nhiên 81 gói thấy khối lượng trung bình là 450 gam và độ lệch chuẩn 36 gam. Với mức ý nghĩa 5% có thể kết luận khối lượng trung bình của các gói bột ngọt là 453 gam không? Giải. Gọi µ là khối lượng trung bình của bột ngọt. Cặp giả thuyết: H 0 : µ = 453, H 1 : µ 453. Các đặc trưng mẫu: n = 81, x = 450, s = 36. Giá trị tiêu chuẩn kiểm định: z = (x µ 0) n = (450 453) 81 = 0, 75. s 36 α = 0, 05 ϕ(z α/2 ) = 0, 5 0, 025 = 0, 475 z α/2 = 1, 96. Vì z < z α/2 nên chưa có cơ sở để bác bỏ H 0. Với mức ý nghĩa 5% có thể kết luận khối lượng các gói bột ngọt là 453 gam. 5.13
Ví dụ. Thông qua một mẫu gồm 100 gia đình, người ta thu được chi tiêu trung bình hàng tháng của các gia đình đó là 2,455 triệu đồng với độ lệch tiêu chuẩn là 0,3 triệu. Với mức ý nghĩa 0,05 có thể cho rằng chi tiêu trung bình hàng tháng của các gia đình là 2,4 triệu đồng hay không? Ví dụ. Khối lượng trung bình khi xuất chuồng ở một trại chăn nuôi gà công nghiệp năm trước là 2,8 kg/con. Năm nay người ta sử dụng một loại thức ăn mới. Cân thử 35 con khi xuất chuồng người ta tính được x = 3, 2 kg và s 2 = 0, 25 kg 2. Với mức ý nghĩa 5% có thể cho rằng loại thức ăn mới làm tăng khối lượng trung bình của đàn gà lên hay không? 5.14
Kiểm định giả thuyết về tỉ lệ của tổng thể Bài toán Giả sử p là tỉ lệ của tổng thể X chưa biết. Với mức ý nghĩa α, kiểm định giả thuyết H 0 : p = p 0 (với p 0 [0, 1] đã biết). Giá trị tiêu chuẩn kiểm định z = (f p 0) n p0 (1 p 0 ) Kiểm định Cặp giả thuyết Bác bỏ H 0 nếu Hai phía H 0 : p = p 0, H 1 : p p 0 z > z α 2 Bên trái H 0 : p p 0, H 1 : p < p 0 z < z α Bên phải H 0 : p p 0, H 1 : p > p 0 z > z α 5.16
Kiểm định giả thuyết về tỉ lệ của tổng thể Ví dụ. sản phẩm loại A ban đầu của một nhà máy là 45%. Sau khi áp dụng một phương pháp sản xuất mới, người ta lấy ra 400 sản phẩm để kiểm tra, qua kiểm tra thấy có 215 sản phẩm loại A. Với mức ý nghĩa 5%, hãy kết luận xem phương pháp sản xuất mới có thực sự làm tăng tỉ lệ sản phẩm loại A lên hay không? Ví dụ. Một trường học báo cáo tổng kết năm học vừa qua có 20% sinh viên giỏi. Đoàn thanh tra kiểm tra mẫu ngẫu nhiên 800 sinh viên có 128 xếp loại giỏi. Biết mức ý nghĩa 5%, hãy kiểm định xem báo cáo của trường có cao hơn so với thực tế hay không? 5.17
Kiểm định giả thuyết về phương sai của tổng thể Bài toán Giả sử tổng thể X có phân phối chuẩn N(µ, σ 2 ) với phương sai σ 2 chưa biết. Với mức ý nghĩa α, kiểm định giả thuyết H 0 : σ 2 = σ 2 0 (với σ 0 > 0 đã biết). Chỉ xét trường hợp chưa biết trung bình tổng thể µ. Giá trị tiêu chuẩn kiểm định: χ 2 = (n 1)s2 σ 2 0 Cặp giả thuyết Bác bỏ H 0 nếu H 0 : σ 2 = σ0 2, H 1 : σ 2 σ0 2 χ 2 < χ 2 (n 1, 1 α/2) hoặc χ 2 > χ 2 (n 1, α/2) H 0 : σ 2 σ0 2, H 1 : σ 2 < σ0 2 χ 2 < χ 2 (n 1, 1 α) H 0 : σ 2 σ0 2, H 1 : σ 2 > σ0 2 χ 2 > χ 2 (n 1, α) 5.19
Kiểm định giả thuyết về phương sai của tổng thể Ví dụ. Chủ hãng sản xuất một loại thiết bị đo cho biết sai số đo của thiết bị này có độ lệch chuẩn bằng 5mm. Kiểm tra một mẫu 19 thiết bị loại này thấy phương sai là 33. Với mức ý nghĩa 5%, cho nhận xét về ý kiến trên của chủ hãng, biết sai số đo của thiết bị có phân phối chuẩn. Ví dụ. Một nhà sản xuất bóng đèn tuýp cho rằng chất lượng bóng đèn sẽ được coi là đồng đều nếu tuổi thọ của các bóng đèn có độ lệch chuẩn không quá 1000 giờ. Lấy ngẫu nhiên 10 bóng để kiểm tra thì tìm được độ lệch chuẩn là 1150 giờ. Với mức ý nghĩa 5%, có thể coi chất lượng bóng đèn do công ty đó sản xuất là đồng đều hay không, biết tuổi thọ của bóng đèn có phân phối chuẩn. 5.20
Liên hệ với bài toán ước lượng khoảng 1 µ 0 thuộc khoảng tin cậy đối xứng 1 α của µ với mức ý nghĩa α, chấp nhận giả thuyết H 0 : µ = µ 0 (với đối thuyết H 1 : µ µ 0 ). 2 p 0 thuộc khoảng tin cậy đối xứng 1 α của p với mức ý nghĩa α, chấp nhận giả thuyết H 0 : p = p 0 (với đối thuyết H 1 : p p 0 ). 3 σ0 2 thuộc khoảng tin cậy 2 phía 1 α của σ2 với mức ý nghĩa α, chấp nhận giả thuyết H 0 : σ 2 = σ0 2 (với đối thuyết H 1 : σ 2 σ0 2). 5.21
So sánh hai trung bình Bài toán Giả sử có hai tổng thể X 1 và X 2 với E(X 1 ) = µ 1 và E(X 2 ) = µ 2. Với mức ý nghĩa α, kiểm định giả thuyết H 0 : µ 1 = µ 2. Chỉ xét trường hợp n 1 30, n 2 30, σ1 2, σ2 2 chưa biết. Giá trị tiêu chuẩn kiểm định: z = x 1 x 2 s1 2 + s2 2 n 1 n 2 Kiểm định Cặp giả thuyết Bác bỏ H 0 nếu Hai phía H 0 : µ 1 = µ 2, H 1 : µ 1 µ 2 z > z α 2 Bên trái H 0 : µ 1 µ 2, H 1 : µ 1 < µ 2 z < z α Bên phải H 0 : µ 1 µ 2, H 1 : µ 1 > µ 2 z > z α 5.23
So sánh hai trung bình Ví dụ. Giám đốc một hãng sản xuất muốn xác định xem có sự khác nhau về năng suất giữa ca ngày và ca tối không. Một mẫu 100 công nhân ca ngày sản xuất được x 1 = 74, 3 sản phẩm với độ lệch tiêu chuẩn s 1 = 16 sản phẩm; một mẫu khác gồm 100 công nhân ca tối sản xuất được x 2 = 69, 7 sản phẩm với s 2 = 18 sản phẩm. Với mức ý nghĩa 1%, có thể nói năng suất ca ngày cao hơn ca tối không? 5.24
So sánh hai tỉ lệ Bài toán Giả sử có hai tổng thể X 1 và X 2 với tỉ lệ p 1 và p 2 tương ứng. Với mức ý nghĩa α, kiểm định giả thuyết H 0 : p 1 = p 2. Giá trị tiêu chuẩn kiểm định: f 1 f 2 z = ( 1 f (1 f ) + 1 ) n 1 n 2 với f = k 1 + k 2 = n 1f 1 + n 2 f 2 là tỉ lệ chung của 2 mẫu. n 1 + n 2 n 1 + n 2 Kiểm định Cặp giả thuyết Bác bỏ H 0 nếu Hai phía H 0 : p 1 = p 2, H 1 : p 1 p 2 z > z α 2 Bên trái H 0 : p 1 p 2, H 1 : p 1 < p 2 z < z α Bên phải H 0 : p 1 p 2, H 1 : p 1 > p 2 z > z α 5.26
So sánh hai tỉ lệ Ví dụ. Người ta muốn so sánh chất lượng hạt giống được lấy từ 2 nông trại. Gieo thử 100 hạt giống của nông trại thứ nhất thì có 10 hạt không nảy mầm. Gieo thử 150 hạt giống của nông trại thứ hai thì thấy có 11 hạt không nảy mầm. Với mức ý nghĩa 5%, hãy xem chất lượng hạt giống của nông thứ hai có cao hơn nông trại thứ nhất không? 5.27