Bất kể bạn sống ở đâu, lúc này hay lúc khác, bạn đã bị kẹt xe. Làm sao để biết được liệu ở một số thành phố khác có tắt đường nhiều hơn hay ít hơn thành phố ta đang sống? Ta dựa vào thông số nào để so sánh mức độ kẹt xe của 2 thành phố? Rồi dựa vào thông số nào biết được vị trí xếp hạng mức độ kẹt xe của thành phố ta so với các thành phố khác trong cả nước. Các nhà thống kê thực hiện việc so sánh bằng cách sử dụng thống kê mô tả.
Ứng với 3 mối quan tâm đó, bài này sẽ chỉ cho bạn cách lấy và giải t
Bất kể bạn sống ở đâu, lúc này hay lúc khác, bạn đã bị kẹt xe. Làm sao để biết được liệu ở một số thành phố khác có tắt đường nhiều hơn hay ít hơn thành phố ta đang sống? Ta dựa vào thông số nào để so sánh mức độ kẹt xe của 2 thành phố? Rồi dựa vào thông số nào biết được vị trí xếp hạng mức độ kẹt xe của thành phố ta so với các thành phố khác trong cả nước. Các nhà thống kê thực hiện việc so sánh bằng cách sử dụng thống kê mô tả.
Ứng với 3 mối quan tâm đó, bài này sẽ chỉ cho bạn cách lấy và giải thích các thông số thống kê mô tả như: các thông số đo lường trung bình, các đo lường về sự biến thiên và các đo lường vị trí.
Ta đã biết cách tóm tắt dữ liệu bằng cách tổ chức chúng vào một phân bố tần số và sau đó trình bày dữ liệu bằng cách sử dụng các dạng biểu đồ khác nhau, giúp dễ dàng thu được thông tin hữu ích từ dữ liệu thô. Phần này, sẽ cho thấy các phương pháp thống kê được sử dụng để mô tả dữ liệu.
Phương pháp phổ biến nhất trong các phương pháp này là tìm ra điểm trung tâm của tập hợp dữ liệu. Thuật ngữ khuynh hướng định tâm thường được dùng để nói đến một kiểu đo lường mô tả nhằm cho biết điểm trung tâm của tập dữ liệu nằm ở đâu trong phân bố của tập hợp dữ liệu. Nó bao gồm trung bình (mean), trung vị (median), (mode) và trung bình khoảng (midrange).
Việc biết được điểm trung tâm của tập dữ liệu không đủ để mô tả toàn bộ tập dữ liệu. Chẳng hạn, một chủ cửa hiệu giày biết rằng kích thước trung bình của cỡ giày của một người đàn ông là size 10, nhưng chủ cửa tiệm sẽ không thể kinh doanh được lâu nếu chỉ có các đôi giày size 10. Ví dụ này cho thấy, ngoài việc biết trung bình, bạn phải biết được sự phân tán của các dữ liệu, các thông số đo lường sự phân tán của dữ liệu được gọi là các số đo lường tính biến thiên (measures of variation) hay các số đo lường độ phân tán (measures of dispersion) . Các số đo này bao gồm khoảng biến thiên(range), phương sai (variance) và độ lệch chuẩn (standard deviation).
Đôi khi chúng ta muốn biết vị trí của một giá trị quan sát so với những giá trị quan sát khác trong tập dữ liệu. Các vị trí phổ biến nhất là phân vị (percentile), thập phân vị (decile) và tứ phân vị (quartile).
Cuối cùng là kỹ thuật phân tích dữ liệu khám phá bằng biểu đồ hộp . Kỹ thuật này khác với các kỹ thuật truyền thống ở trên, nó được sử dụng để xác nhận các phỏng đoán về dữ liệu.
» Danh sách Tập tin đính kèm:
» Tin mới nhất:
» Các tin khác: