Giới thiệu về kiểm định giả thuyết thống kê
Sơ lược về bài toán kiểm định giả thuyết thống kê
Kiểm định giả thuyết thống kê (statistical hypothesis test) là phương pháp ra quyết định sử dụng dữ liệu, hoặc từ thí nghiệm hoặc từ nghiên cứu quan sát (observational study)(không có kiểm soát). Trong thống kê (statistics), một kết quả được gọi là đủ độ tin cậy mang tính thống kê (statistically significant) nếu nó ít có khả năng diễn ra theo một ngưỡng xác suất cho trước (ví dụ 5% hay 10%). Cụm từ kiểm định độ tin cậy ("test of significance") được đưa ra bởi Ronald Fisher.
Kiểm định giả thuyết đôi khi được gọi là phân tích dữ liệu để khẳng định, để so sánh với phân tích dữ liệu để khám phá.
Một ví dụ cho bài toán kiểm định giả thuyết thống kê:
Công ty Hoàng Lâm sản xuất mỳ chính theo dây chuyền của Đức. Theo tiêu chuẩn thì trọng lượng các gói mì chính được đóng trên một máy tự động là 453 g. Nghi ngờ máy tự động làm việc không còn đủ chính xác, công ty Hoàng Lâm tiến hành kiểm tra ngẫu nhiên 81 gói ta thấy trọng lượng trung bình là 448 g. Với mức ý nghĩa 0,05 có thể cho rằng trọng lượng các gói mì chính không đạt tiêu chuẩn hay không, biết rằng trọng lượng gói mì chính là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 36g?
Những câu hỏi cần giải quyết trong bài toán kiểm định liên quan đến ví dụ trên thường gặp:
1. Trọng lượng trung bình của 01 gói mỳ chính theo điều tra là bao nhiêu?
2. Để bác bỏ giả thuyết “dây chuyền vẫn hoạt động tốt – trọng lượng mỳ chính đúng tiêu chuẩn” thì tiêu chuẩn kiểm định phải không nằm trong khoảng nào?
3. Dây chuyền còn hoạt động tốt không?