1. Phương pháp lấy mẫu?
Trong bộ dữ liệu điều tra tổng thể, trường hợp không thể thu thập số liệu, dữ liệu thống kê phân tích được phát triển bằng các thiết kế thử nghiệm cụ thể và các
mẫu khảo sát. Thống kê chính là việc cung cấp công cụ để nói trước và dự báo việc sử dụng các dữ liệu thông qua các mô hình thống kê. Để sử dụng một mẫu như một thông tin hướng dẫn cho toàn bộ tổng thể, điều quan trọng là nó thực sự đại diện cho mẫu tổng thể. Lấy mẫu đại diện phải đảm bảo rằng nó được suy luận và kết luận một cách chính xác từ việc chọn mẫu cho toàn bộ tổng thể. Một vấn đề lớn nhằm làm tăng kích cỡ mẫu được lựa chọn là mẫu đại diện. Thống kê cung cấp các phương pháp thiết kế thử nghiệm mẫu, các thử nghiệm này có thể làm giảm bớt các vấn đề ở việc bắt đầu nghiên cứu, tăng khả năng nhận biết các mẫu tin tưởng về mẫu thống kê.
Lý thuyết chọn
mẫu là một phần của lý thuyết xác suất thống kê toán. Xác suất được sử dụng trong “toán học thống kê” (cách khác “lý thuyết thống kê”) để nghiên cứu sự phân bố lấy mẫu thống kê mẫu và các tính chất của thủ tục thống kê. Việc sử dụng các phương pháp thống kê là được chấp nhận khi các phương pháp hoặc thống kê mẫu tổng thể đủ thông tin để chấp nhận giả thuyết.
Sự khác biệt trong quan điểm giữa lý thuyết xác suất cổ điển và lý thuyết xác suất lấy
mẫu là xấp xỉ, lý thuyết xác suất bắt đầu từ các tham số cho tổng quy mô mẫu để suy ra xác suất mẫu. Tuy nhiên phương pháp thống kê phát triển theo hướng đối lập – quy nạp từ các mẫu để các thông số lớn hơn hoặc tổng quy mô mẫu.
2. Các kiểu dữ liệu?
Các biến thử khác nhau đã được tạo ra để phân loại mức độ đo lường. Các nhà tâm lý Stanley Smith Stevens đã xác định thang đo danh nghĩa, thứ tự, khoảng thời gian và tỷ lệ đo. Thang đo danh nghĩa không có thứ tự xếp hạng có ý nghĩa trong các giá trị, và cho phép chuyển đổi một-một. Thang đo thứ tự có sự khác biệt chính xác giữa các giá trị liên tiếp, nhưng có một thứ tự có ý nghĩa giá trị và cho phép bất kỳ chuyển đổi nào để chuyển đổi. Đo khoảng thời gian có ý nghĩa và khoảng cách giữa các phép đo được xác định, nhưng giá trị bằng không là tùy ý (như trong trường hợp số dôi kinh độ và độ C hoặc độ F), và cho phép bất kỳ chuyển đổi tuyến tính. Đo tỷ lệ có cả một giá trị số không có ý nghĩa và khoảng cách giữa các phép đo khác nhau được xác định, và cho phép chuyển đổi sang sự thay đổi tỷ lệ.
Vì các biến chỉ phù hợp cho thang đo danh nghĩa hoặc thang đo thứ tự, không thể đo lường một cách hợp lý về số lượng, đôi khi chúng được nhóm lại với nhau như các biến phân loại, trong khi thang đo tỷ lệ và thang đo thời gian được nhóm lại với nhau như là các biến định tính, những biến có thể rời rạc hoặc liên tục do tính chất số lượng. Chúng thường được phân biệt như vậy thường ít tương quan với các dữ liệu trong nghiên cứu khoa học lưu trữ và phân tích thông tin được đưa vào. Trong đó các biến phân loại phân đôi có thể được đại diện với các kiểu dữ liệu Boolean (sử dụng hệ thống dữ liệu lý luận như AND, OR, NOT để xác định quan hệ giữa các thực thể), biến phân loại Polytomous với số nguyên....và các biến liên tục với các loại dữ liệu nghiên cứu khoa học lưu trữ và phân tích thông tin được đưa vào. Nhưng các bản đồ của các kiểu dữ liệu khoa học lưu trữ và phân tích thông tin đưa vào với các loại dữ liệu thống kê phụ thuộc vào phân loại sau khi được thực hiện.
Có nhiều phân tích khác đã được đề xuất. Ví dụ, Mosteller và Tukey (1977) phân lớp, phân bậc, tính phân số, đếm, tổng số lượng và cân bằng. Nelder (1990) mô tả tính liên tục, chỉ số liên tục, tính tỷ lệ và chế độ phân loại của dữ liệu. Cũng như Chrisman (1998) và Van Den Berg (1991) .
Vấn đề có thích hợp hay không để áp dụng các loại khác nhau của các phương pháp thống kê số liệu thu được từ các loại khác nhau của các phương pháp đo lường phức tạp do các vấn đề liên quan đến việc chuyển đổi các biến và giải thích chính xác các câu hỏi đặt ra nghiên cứu. “mối quan hệ giữa các dữ liệu và những gì dữ liệu mô tả đơn thuần phản ánh một thực tế là một số loại báo cáo thống kê có thể có giá trị chân lý đó không phải là bất biến theo một số biến thay đổi. Có hay không một sự chuyển đổi hợp lý để chiêm ngưỡng phụ thuộc vào câu hỏi ai đang cố gắng để trả lời”.